面向服务推荐的用户兴趣发现方法研究

来源 :济南大学 | 被引量 : 0次 | 上传用户：zhjjchj

【摘要】

：

随着信息及互联网技术的飞速发展,现阶段人们已经进入了大数据时代,在面对当前大量数据的时候,信息过载产生的问题越来越严重,也给用户在海量信息中选择带来不确定性,为了有

【作者】

：

邢丽静

【机构】

：

济南大学

【出处】

：

济南大学

【发表日期】

：

2016年01期

【关键词】

：

协同过滤推荐系统随机森林冷启动数据稀疏

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息及互联网技术的飞速发展,现阶段人们已经进入了大数据时代,在面对当前大量数据的时候,信息过载产生的问题越来越严重,也给用户在海量信息中选择带来不确定性,为了有效解决此问题,推荐系统逐渐引起人们的重视。推荐系统的出现是以用户为中心进行服务,准确发现他们的兴趣,为用户发现或者推荐需要的信息或服务。进行推荐的时候是根据用户属性、相应的浏览历史以及各种评分等等信息。目前推荐系统主要在电子商务领域有切实应用,通过推荐可以使服务提供者拥有主动,这样会实现精准服务并且给他们带来更多的利润。现如今在推荐系统中使用最广泛最成熟的方法是协同过滤方法,首先计算用户或者服务之间的相似度,利用最近邻进行分析,找到用户们的兴趣,最终将结果推荐给用户。然而此算法在分析用户兴趣的时候也存在着一定的缺点比如冷启动、数据稀疏性以及可扩展问题,针对以上问题在本文中进行了改进。本文主要研究内容如下:第一,针对协同过滤所存在的冷启动以及数据稀疏一系列问题,本文提出了基于混合属性协同过滤方法。在用户进行购物等行为时候会留下自己的信息以及浏览历史等等信息,在本文中将以上的信息进行充分利用,主要将用户的属性或者特征、用户的评分以及用户的浏览历史进行了综合,其中在用户评分方面则是主要使用了用户们之间的共同评分,并且采用了改进过的SVD(Singular Value Decomposition)方法进行数据预处理;用户浏览历史加入了时间戳的函数,找到用户的动态兴趣。将以上三方面分别计算相似度,最后将相似度进行分权重计算,得到最后的相似度,根据相似度找到相应的兴趣,再使用KNN(k-Nearest Neighbor)进行分析,将结果推荐给所需要的用户。第二,为了针对某个用户进行特定的服务推荐,提出了基于随机森林的单用户兴趣发现及服务推荐,在兴趣挖掘的时候则使用了改进过的随机森林,将CART(Classification And Regression Tree)和C4.5进行线性融合,经过将以上方法结合后提高数据分类预测精度,并且提高了推荐结果的精确度。在挖掘用户兴趣的过程中首先将数据进行相应的处理,如果是离散型的数据则使用SVD进行预处理,如果是连续型数据则进行离散化,在进行离散化时候则使用了CADD(Class-Attribute Dependent Discretizer)等算法进行处理,然后进行训练和测试,根据训练和测试结果找到用户的兴趣,最后得出某个用户的推荐列表。第三,提出交叉验证方法将基于混合属性的协同过滤和基于随机森林的推荐结果进行融合,在融合的过程中主要是将数据平均分成N份,将N-1份进行训练,剩余的1份进行测试,训练出用户的兴趣,根据兴趣训练出有效的用户兴趣函数,然后进行测试,得到最终的推荐结果。同时设计了相关实验,选择准确率和召回率作为评价标准,经过大量的实验说明了本文所提出相关方法的有效性。

其他文献

基于服务聚类的个性化语义Web服务发现机制研究

语义Web技术解决了传统Web服务发现查全率和查准率低下的问题,已成为国内外的研究热点。然而由于语义计算的复杂性,导致了语义Web服务发现效率低下,如何在保证查全率和查准率

学位

本体个性化语义服务聚类Web服务发现机制

时空对象位置隐私保护技术研究与实现

随着移动定位技术的发展,位置服务(Location-based Service)中的时空对象位置隐私保护技术成为学术界关注的热点。目前,时空对象位置隐私保护技术研究在情境感知下位置隐私保

学位

时空对象位置服务隐私保护位置匿名查询处理情境感知

基于服务组件架构的轻量级快速应用软件开发框架的研究

随着业务规模的不断扩大以及业务变得越来越复杂，企业经常需要增加内部应用系统。如果这些应用系统在设计时没有将其作为整个企业信息系统的一部分，将造成各个应用系统之间的协

学位

服务组件架构面向服务软件开发框架RADFWeb服务绑定访问控制

基于无线传感器网络覆盖的部署及调度算法的研究

传感器网络的覆盖问题是传感器网络的重要研究内容,较强的监视能力和较高容错率对传感器节点的覆盖质量提出了较高的要求。论文从提高区域覆盖质量和延长网络使用寿命两个角

学位

异构传感器网络概率感知模型虚拟力节点部署K重覆盖节点调度

改进K均值算法在数据挖掘中的研究应用

数据挖掘是多个领域的交叉学科,用于分析海量数据中的潜在关系以给人们提供有价值的帮助。聚类分析是数据挖掘中的重要技术,它是在无先验知识情况下,按照一定的要求和规律,将

学位

数据挖掘聚类分析K均值模拟退火调和平均

稀疏学习及其在多标记学习中的应用研究

机器学习是一种旨在设计和实现特定算法，使得计算机能够根据经验数据进化自身行为。它隶属于计算机科学中的人工智能范畴，也是近来人工智能学科研究最活跃的子领域。机器学习的

学位

机器学习稀疏学习优化l1投影多标记学习

面向智能电视应用的交互情景事件感知算法研究

计算机、互联网以及普适计算等理论技术的发展正在深刻地影响着人们的生活。同时人机交互技术也越来越多的融入到人们的工作和生活之中。伴随社会发展与科技的进步,传统的人

学位

手势交互智能电视隐式人机交互用户意图推理上下文感知

保温砌模格构式混凝土墙体抗震性能试验研究

学位

面向海量URL数据存取的快速文件系统

海量URL快速存储和访问是高性能web爬虫的基础,由于web爬虫需要根据一定的策略将URL按照一定的顺序进行抓取,因此,为了快速查找,URL往往被保存在关系数据库中。但是当数据库

学位

快速文件系统URL管理B+树逻辑存取模型物理存取模型

温室温湿度系统建模及预警技术研究

随着设施农业及其配套技术的推广,我国现代化温室呈现出量大、面广等特点。温室是由人工营造相对独立的特殊小气候环境,将生态因子维持在适宜作物生长繁育的最优区间非常不易

学位

温室小气候模型数据处理预警LabVIEW

面向服务推荐的用户兴趣发现方法研究

其他学术论文