【摘 要】
:
个性化推荐系统是“数据大爆炸”时代下的产物。个性化推荐系统作为一个“信息过滤器”,能够“量身定做”地为用户提供精确度高、效率快的服务。目前,个性化推荐系统已经成功应用到图书推荐、影视推荐、美食推荐等多个领域。针对传统个性化推荐系统中存在的数据稀疏和冷启动问题,学者们进行了大量的深入研究。其中,奇异值分解(SVD)算法通过奇异值分解技术填充矩阵的缺省值,较好地缓解了数据稀疏的问题。SVD++算法是在
论文部分内容阅读
个性化推荐系统是“数据大爆炸”时代下的产物。个性化推荐系统作为一个“信息过滤器”,能够“量身定做”地为用户提供精确度高、效率快的服务。目前,个性化推荐系统已经成功应用到图书推荐、影视推荐、美食推荐等多个领域。针对传统个性化推荐系统中存在的数据稀疏和冷启动问题,学者们进行了大量的深入研究。其中,奇异值分解(SVD)算法通过奇异值分解技术填充矩阵的缺省值,较好地缓解了数据稀疏的问题。SVD++算法是在SVD算法的基础上引入隐式反馈,有效地缓解了冷启动问题。随着社交网络的兴起,结合用户社交网络中的信任关系进行推荐逐渐成为研究热点。TrustSVD算法就是在SVD++算法的基础上引入信任关系,改善数据稀疏和冷启动问题。本文深入分析了TrustSVD算法。首先,TrustSVD算法忽视了推荐项目的时效性问题。每个项目都有自己的生命周期,有些很短比如新闻;有些很长比如经典电影。如果项目度过了流行期并进入衰退期,那么关注它的顾客会越来越少,它的推荐价值也会越来越低。由于TrustSVD推荐算法对已衰退的项目和流行的项目处理方式相同,可能会为用户推荐已经“过期”的项目,导致算法的推荐效果不好。同时,TrustSVD推荐算法将用户给出的显式信任数据用于评分预测,然而随着信息泄露导致网络诈骗盛行,用户越来越注重网络安全,并不会随意在网上公布自己的信息,比如对其他用户的显式信任反馈。因此用户间的信任关系存在着获取难、数据稀疏的问题;同时,显式信任只有0、1两个值,并不能很准确的模拟现实生活中用户间的信任程度;并且由于数值简单,显式信任还存在着大量的噪声。为了提高TrustSVD算法的推荐性能,本文主要做了以下几个方面的改进及研究工作:(1)项目的时效性表示。考虑到项目都有生命周期,对项目进行时效性度量很有必要。本文引入一个衡量项目是否及时的时效性指标,并在此基础上提出基于时效性的矩阵分解推荐算法,该算法有效地降低了为用户推荐过期产品的概率。(2)基于时效性和双信任机制的推荐算法研究。本文引入隐式信任解决显式信任数据稀疏的问题。传统的隐式信任计算方法,比如皮尔逊系数是从用户评分数据推断而来,而利用评分数据推断隐式信任很有可能存在着被恶意攻击的风险。因此本文将jaccard相似度和信任因子共同求调和平均得到隐式信任数据。jaccard相似度和信任因子的计算并不需要评分数据,这样的隐式信任更具有准确性。同时,本文引入双信任机制,对显式信任和隐式信任赋予不同权重,从而控制显式信任和隐式信任对于评分预测的贡献程度,改善信任数据的稀疏性。(3)本文在Epinions数据集和Ciao DVD数据集上进行改进算法和原始TrustSVD算法的对比实验。在Epinions数据集上,改进算法在对所有用户推荐的平均绝对误差最多降低1.49%,均方根误差最多降低1.33%;对冷启动用户推荐的平均绝对误差最多降低1.61%,均方根误差最多降低1.35%。在Ciao DVD数据集上,改进算法在对所有用户推荐的平均绝对误差最多降低2.21%,均方根误差最多降低1.88%;对冷启动用户推荐的平均绝对误差最多降低4.22%,均方根误差最多降低3.41%。实验结果证明本文改进算法在Epinions数据集和Ciao DVD数据集上的误差大幅降低,算法准确率提高,也验证了本文改进算法的有效性和可行性。
其他文献
在分布式网络系统中,时间和频率是系统中各节点之间实现协同工作的关键信号,是实现精确同步的基本必要条件。实现时频同步的介质包括无线、卫星以及光纤,对于卫星介质,其时频同步约为20纳秒,但相对带来的成本较高;对于无线介质例如长、短波授时,其时频同步精度仅为1~100微秒,且在传播过程中更容易受到各种干扰;对于光纤介质,在专用光纤网络上实现的时频同步,其精度能够达到更高的量级,但是存在高昂成本以及无法普
随着对控制系统要求的提高,对于需要同时满足设定值跟随特性和干扰值抑制特性的系统,采用一自由度PID控制时,如果对扰动抑制问题处理不当,就会给输出带来较大的超调量和较长的调节时间,采用二自由度PID控制可以很好的解决这个问题。近年来,二自由度PID控制广泛应用于过程控制领域,如时滞系统、高性能运动控制系统等,但很少应用于开关电源,本文为了改善开关电源输出端的超调量,引入二自由度PID控制技术,并运用
近些年随着物联网的迅速发展,蓝牙技术联盟(SIG)在2017年基于低功耗蓝牙发布了蓝牙Mesh网络规范,设计用于大型网络的节点间通信,主要在智能家居、楼宇自动化、智能城市等物联网场景得到使用。在当前的网络规范中,节点之间使用洪泛机制进行通信,虽然满足了通信的需求,但是会造成网络消息冗余以及网络资源的大量使用。在此背景下,本文基于蓝牙Mesh网络,在不改变蓝牙Mesh网络定义的前提下,进行路由方案的
近年来食品安全问题层出不穷,为了有效防范食品安全事故发生,国家颁布食品安全法,建立食品安全风险监测制度,强化食品安全监管。其中保证手部卫生是减少食品制作过程中病原体传播风险的最重要的防御措施。在食品加工厂中,作为直接接触食品的人员,部分食品制作者的手部会佩戴戒指、创口贴等异物,其带有的微生物会污染食物,引发食品安全问题。然而人工目视检测异物的效率和精度低,检测结果失误率高,经常出现漏检和误检问题。
随着信息科学的迅速发展,链路预测成为近年来复杂网络研究领域出现的一个热点问题,它的主要任务是设计出一个能够更加准确地描述给定网络机制的预测算法,从而得到更准确的预测结果,它有助于理解复杂网络的演化机制,在复杂网络研究中有着相当重要的应用。目前为止,相关研究大多只考虑结构特征,然而,当一个节点与其它节点创建链接时,标签信息通常扮演着重要的角色,因此,本文考虑了节点的标签信息。本文的研究内容主要有以下
指针式仪表以其抗干扰能力强、使用寿命长等优势,被广泛应用在各类工业场所,尤其在石油勘探一类干扰强、气候多变、多辐射的复杂环境中。在这类工作环境中指针式仪表负责对现场机械设备的工作状态进行监测,目前指针式仪表读数仍以人工抄录为主。随着工业自动化、智能化的要求不断提高,一些关于指针式仪表示数自动识别的算法相继诞生。主要分为基于传统图像处理技术的指针式仪表识别方法和基于深度学习模型的识别算法。传统算法运
在当今信息时代下,使用数字化资产进行数据的存储和使用,已经成为一种普遍存在的机制。由于具有易于复制和传播特点的数字技术带给人们便利的同时,也导致了一些权属和数据安全等问题。加之传统的架构模式在大数据时代下,面对日益增长的数据量,难以满足高效的数据共享和数据管理等需求。因此本文提出一种基于以数据为中心的体系架构,即面向数据的安全体系结构(Data Oriented Security Architec
商机数据指的是各地政府在其公共交易网站上发布的一些招标公告和中标候选公示等数据。随着大数据时代和5G技术的发展,各地政府逐步舍弃了传统招投标交易模式,开始使用电子招投标方式,交易过程中产生了大量的商机数据。海量商机数据有着多数据源、异构、不可共享等问题,加上传统软件系统难以满足高效的数据共享和数据管理等需求。因此本文基于苗放教授在2012年提出的面向数据的体系结构(Data-Oriented Ar
随着浅层矿产资源几乎枯竭,寻找新的地表矿床的可能性越来越小。我国自2008年实施国家深部探测技术与实验研究专项(Sino Probe),为深部找矿吹响了号角,其中三分量井中磁测方法能利用深井有效探测磁性矿,是深部找矿和预测隐伏矿床的利器之一。目前国内缺乏实用化的小口径深井(3000m)高精度三分量井中磁力仪,国家重点研发计划项目专题“基于微型磁通门的井中高温小直径三分量磁场传感器的研制(2018Y
大地电磁测深法是地质勘探工作的重要方法,因有效易行、成本低廉,被应用于越来越多的领域。正演是大地电磁测深法的关键技术,它具有两大作用:一是为理论计算作辅助验证;二是为反演计算提供基础资料。传统正演算法的发展渐趋成熟,但对于复杂模型的计算效率不高。而深度学习可为地磁正演提供更高效的方案。深度学习是计算机行业研究的热门领域,常用于图像处理等方面,但其在大地电磁正演方面的研究较少。故而本文以拓展深度学习