【摘 要】
:
互联网为人们带来了海量数据,如何从大数据中快速获取需要的信息已经成为当前的研究热点之一。推荐算法作为有效解决信息过载问题的方法,已经被广泛运用于多个领域。本文通过不同的角度对推荐算法进行研究,旨在提高推荐算法的综合性能,解决冷启动问题。一方面以二部图网络结构为基础,加入时间因素,针对马太效应中的营销近视症问题提出基于物品综合流行性的推荐模型,提升了算法的综合性能;另一方面利用神经网络挖掘用户与物品
论文部分内容阅读
互联网为人们带来了海量数据,如何从大数据中快速获取需要的信息已经成为当前的研究热点之一。推荐算法作为有效解决信息过载问题的方法,已经被广泛运用于多个领域。本文通过不同的角度对推荐算法进行研究,旨在提高推荐算法的综合性能,解决冷启动问题。一方面以二部图网络结构为基础,加入时间因素,针对马太效应中的营销近视症问题提出基于物品综合流行性的推荐模型,提升了算法的综合性能;另一方面利用神经网络挖掘用户与物品的潜在联系。构建用户特征与兴趣的参数系统,利用BP神经网络求解优化。还通过引入特征信息扩展网络结构,构建特征图像,借助卷积神经网络进行分类。基于神经网络的推荐策略研究能够有效处理冷启动问题,提升算法性能。本文主要工作有:(1)设计时间权重衰减模型对时间进行合理量化。通过离散分箱的方式将时间分段,并根据数据增长形式赋予指数衰减型的权重值,模拟权重随时间的延长而衰减的过程。分箱处理方式在一定程度上避免了异常数据的影响。(2)提出基于物品综合流行性的实时推荐算法(ComPI)。在时间权重衰减模型的基础上考虑物品的发展规律,利用全概率模型框架设计能够量化物品综合流行度的模型,该模型能与多种基准推荐算法结合优化推荐结果。(3)分析数据增长特性与数据划分。本文对常见的推荐数据集的增长特点和数据集的划分方法进行分析,发现研究算法时应该更注重算法在指数型增长的数据集上的性能。在划分数据时不仅要考虑数据量,还要考虑时间逻辑。(4)提出基于BP神经网络的推荐模型(BP-Rec)解决用户冷启动问题。构建用户特征与用户兴趣分布的参数系统,利用BP神经网络模拟参数求解过程,挖掘两者之间的潜在关系。预测用户的兴趣分布,解决新用户的冷启动问题。(5)构建关系特征图像。将用户和物品的特征信息作为节点扩展二部图网络结构,利用特征节点描述用户和物品的连接关系,将连边关系转换为特征图像。(6)提出基于卷积神经网络的物品推荐模型(CNN-Rec)缓解冷启动问题。设计卷积神经网络对关系特征图像进行分类,进而预测用户对物品的选择。本文设计了多组对比实验,选用了具有不同增长特征的数据集和多个角度的评价指标,结果表明本文提出的模型具有良好的推荐效果,能够提升算法的综合表现,有效解决冷启动问题。
其他文献
近年来食品安全问题层出不穷,为了有效防范食品安全事故发生,国家颁布食品安全法,建立食品安全风险监测制度,强化食品安全监管。其中保证手部卫生是减少食品制作过程中病原体传播风险的最重要的防御措施。在食品加工厂中,作为直接接触食品的人员,部分食品制作者的手部会佩戴戒指、创口贴等异物,其带有的微生物会污染食物,引发食品安全问题。然而人工目视检测异物的效率和精度低,检测结果失误率高,经常出现漏检和误检问题。
随着信息科学的迅速发展,链路预测成为近年来复杂网络研究领域出现的一个热点问题,它的主要任务是设计出一个能够更加准确地描述给定网络机制的预测算法,从而得到更准确的预测结果,它有助于理解复杂网络的演化机制,在复杂网络研究中有着相当重要的应用。目前为止,相关研究大多只考虑结构特征,然而,当一个节点与其它节点创建链接时,标签信息通常扮演着重要的角色,因此,本文考虑了节点的标签信息。本文的研究内容主要有以下
指针式仪表以其抗干扰能力强、使用寿命长等优势,被广泛应用在各类工业场所,尤其在石油勘探一类干扰强、气候多变、多辐射的复杂环境中。在这类工作环境中指针式仪表负责对现场机械设备的工作状态进行监测,目前指针式仪表读数仍以人工抄录为主。随着工业自动化、智能化的要求不断提高,一些关于指针式仪表示数自动识别的算法相继诞生。主要分为基于传统图像处理技术的指针式仪表识别方法和基于深度学习模型的识别算法。传统算法运
在当今信息时代下,使用数字化资产进行数据的存储和使用,已经成为一种普遍存在的机制。由于具有易于复制和传播特点的数字技术带给人们便利的同时,也导致了一些权属和数据安全等问题。加之传统的架构模式在大数据时代下,面对日益增长的数据量,难以满足高效的数据共享和数据管理等需求。因此本文提出一种基于以数据为中心的体系架构,即面向数据的安全体系结构(Data Oriented Security Architec
商机数据指的是各地政府在其公共交易网站上发布的一些招标公告和中标候选公示等数据。随着大数据时代和5G技术的发展,各地政府逐步舍弃了传统招投标交易模式,开始使用电子招投标方式,交易过程中产生了大量的商机数据。海量商机数据有着多数据源、异构、不可共享等问题,加上传统软件系统难以满足高效的数据共享和数据管理等需求。因此本文基于苗放教授在2012年提出的面向数据的体系结构(Data-Oriented Ar
随着浅层矿产资源几乎枯竭,寻找新的地表矿床的可能性越来越小。我国自2008年实施国家深部探测技术与实验研究专项(Sino Probe),为深部找矿吹响了号角,其中三分量井中磁测方法能利用深井有效探测磁性矿,是深部找矿和预测隐伏矿床的利器之一。目前国内缺乏实用化的小口径深井(3000m)高精度三分量井中磁力仪,国家重点研发计划项目专题“基于微型磁通门的井中高温小直径三分量磁场传感器的研制(2018Y
大地电磁测深法是地质勘探工作的重要方法,因有效易行、成本低廉,被应用于越来越多的领域。正演是大地电磁测深法的关键技术,它具有两大作用:一是为理论计算作辅助验证;二是为反演计算提供基础资料。传统正演算法的发展渐趋成熟,但对于复杂模型的计算效率不高。而深度学习可为地磁正演提供更高效的方案。深度学习是计算机行业研究的热门领域,常用于图像处理等方面,但其在大地电磁正演方面的研究较少。故而本文以拓展深度学习
个性化推荐系统是“数据大爆炸”时代下的产物。个性化推荐系统作为一个“信息过滤器”,能够“量身定做”地为用户提供精确度高、效率快的服务。目前,个性化推荐系统已经成功应用到图书推荐、影视推荐、美食推荐等多个领域。针对传统个性化推荐系统中存在的数据稀疏和冷启动问题,学者们进行了大量的深入研究。其中,奇异值分解(SVD)算法通过奇异值分解技术填充矩阵的缺省值,较好地缓解了数据稀疏的问题。SVD++算法是在
单幅图片超分辨率重建技术是通过一定算法算法将一幅低分辨率的图片进行处理,重建出一幅高分辨率图片的技术。目前该技术在医学影像、卫星遥感、高清数字电视、高清游戏和城市安防等多个领域中都有着广泛的应用,同时该技术还有着重要的理论意义,为人们创造了巨大的社会价值与学术科研价值。随着计算机性能的提高以及神经网络的发展,基于深度学习的超分辨率重建方法的优点逐步体现出来,人们逐渐将卷积神经网络应用在超分辨率重建
近年来,随着信息化社会的不断发展,多媒体技术、现代通信及智能系统等新兴领域迅速崛起。自然语言作为一种理想的人机通信方式,为计算机、自动化等系统建立了良好的人机交互环境。但是在以信息化方式进行语音的传达、存储、识别、合成的过程中,往往受到周围环境噪声的影响,造成通信系统性能下降,严重时甚至失效。语音增强的目的就是从受污染信号中尽可能提取出纯净语音,从而改善语音质量,提高语音处理系统的识别率和抗干扰能