【摘 要】
:
在“信息过载”时代,个性化推荐系统成为研究热点,它可以根据用户信息需求快速主动地进行推荐,省略掉用户筛选、过滤信息的过程,防止用户遗漏重要信息。同时,它又存在一些问题,例如评分数据稀疏和“冷启动”问题。因此,如何有效解决这些问题,准确进行推荐,成为目前主要的研究内容。推荐系统中信息来源有多种:评分数据,项目信息和用户信息。在互联网中,评分数据和项目信息作为公共资源可轻易获取,如果提取项目特征时从项
论文部分内容阅读
在“信息过载”时代,个性化推荐系统成为研究热点,它可以根据用户信息需求快速主动地进行推荐,省略掉用户筛选、过滤信息的过程,防止用户遗漏重要信息。同时,它又存在一些问题,例如评分数据稀疏和“冷启动”问题。因此,如何有效解决这些问题,准确进行推荐,成为目前主要的研究内容。推荐系统中信息来源有多种:评分数据,项目信息和用户信息。在互联网中,评分数据和项目信息作为公共资源可轻易获取,如果提取项目特征时从项目信息入手,可很好地缓解推荐系统中项目“冷启动”问题。相反,由于涉及隐私问题,可提取用户特征的用户信息难以在网上直接收集。故本文从新的角度获取用户信息,提出了一种对称模型,此模型可同时训练用户信息和项目信息,从而提取特征,并且在此基础上,加入了社区因素。具体来说,主要完成以下几个方面的工作:(1)在回顾和总结推荐系统研究背景及存在问题后,通过对协同过滤算法和深度学习算法深入分析,并在基于社区推荐算法的探究之上,明确了研究方向:第一,社区包含一些隐藏信息,如果在社区中做推荐,推荐准确度会得到提高。第二,结合协同过滤算法和深度学习算法的优势,提出了一种深度协同算法。(2)提出了社区均模型的IBCF算法。通过对均模型、增量均模型和时间均模型的分析,发现都忽略了社区信息。针对这一问题,本文首先将用户向量使用均模型表示,实现社区的快速划分,然后计算社区和整体用户集上项目相似度,利用平衡因子调整两种相似度比例,最后预测用户评分,完成用户推荐。在数据集Movie Lens 100k和Jester实验,结果表明,此算法在保证时间没有大幅度提高的情况下,推荐准确度得到进一步提高。(3)针对协同深度学习(collaborative deep learning,CDL)算法仅利用项目信息提取特征的问题,提出了基于对称SDAE的协同过滤算法。除项目信息之外,用户评分可直观表示用户喜好,通过分析项目信息和用户评分,提取出用户信息。基于对称SDAE的协同过滤算法在利用项目信息的基础上,也可充分挖掘用户信息,这样得到的特征更加精准。实验表明,此算法的推荐准确度要高于CDL算法。(4)提出了基于社区的对称SDAE协同过滤算法。一方面,社区均模型可以快速划分社区,在社区中训练模型可以捕捉社区信息。另一方面,基于对称SDAE的协同过滤算法可以同时从用户信息和项目信息中提取用户特征和项目特征,可有效缓解“冷启动问题”。故结合两者优势,提出此算法。在数据集CiteULike进行实验,实验表明,本算法推荐准确度进一步提高。
其他文献
鸭坦布苏病毒(Duck Tembusu virus,DTMUV)属黄病毒属,病毒编码三种结构蛋白(核衣壳蛋白C、膜蛋白前体PrM、囊膜蛋白E)和七种非结构蛋白(NS1、NS2A、NS2B、NS3、NS4A、NS4B、NS5)。
电力电子技术的主要功能是把电能转换成负载做需要的形式,作为电力电子技术的核心之一,DC-DC的应用显然是很普遍的。如何较好的控制DC-DC变换器是当前的热门话题。与此同时,
目的目前,流行病学研究表明,职业噪声暴露会导致高血压、冠心病、中风等心血管疾病的发病率的增加,但是大部分都是横断面的调查,而且结果仍存在争议,并且分子生物学机制仍不
抗生素的长期滥用,使细菌的耐药性不断增强,加剧了抗生素抗性基因的传播和扩散。研究表明,重金属和抗生素存在协同选择作用。在重金属污染严重的区域,即使没有抗生素的存在,也发现了抗生素抗性基因。硼作为一种在环境中广泛分布的半金属元素,其与抗生素是否存在协同选择作用还未有相关报道。本实验测定了 8株噬冷菌(Algoriphagus)的生长曲线,选取其中7株菌进行了抗生素和硼的最小抑菌浓度测定。并对耐药噬冷
基因是指控制生物性状的遗传信息,通常由DNA序列承载,可以视作基本遗传单位。基因的产物可以是蛋白质和RNA,从而控制生物个体的性状差异表现。而两个基因的相似度有多高,演化上是否可能同源。归结到计算上,就是如何找到两个序列的最优或近似最优的比对。随着人类基因组计划的测序工作的完成,生物信息科学的研究重点放在了探明基因序列的功用上。而在高通量测序技术快速进展的背景之下,生物数据呈现指数型增长。因此产生
本文以黑鲷(Acanthopagrus schlegeli)幼鱼作为试验研究对象。分别探讨三种单一型添加剂(发酵浒苔、粉碎浒苔和复方中草药),以及组合添加剂对黑鲷幼鱼生长、血脂、血清非特异性免
食品安全是全球性的热点问题,而食源性致病菌是导致食品安全问题频发的主要原因。目前检测食源性致病菌的金标准仍然以传统培养法为主,该方法耗时较长且操作繁复,影响结果判
本文研究时间尺度T上三阶非线性中立型时滞动力方程(?)和(?)的振动性.根据Riccati变换,不等式及相关引理,在此得到一些定理与推论.当所研究的方程满足定理的条件时,得到方程的所有解x(t)或者是振动的或者是(?).最后,利用具体例子说明相关结果.本文所研究的方程是建立在Yang研究的三阶非线性中立型时滞动力方程(?)的振动性和Li研究的方程(?)的振动性的基础上得到的新的方程。将Yang和L
除虫菊被誉为无污染的天然植物杀虫剂,在害虫的生物防治中有很好的作用,但本实验室项目组前期试验研究表明购买和收获的除虫菊种子初始发芽率很低(为16.17%),且成苗难,给生产
创新社区对企业的新产品开发工作具有重要意义,是顾客参与新产品开发的重要手段。创新社区在蓬勃发展的过程中,也面临着一个现实挑战,即创新社区中的信息未能被新产品开发人员充分采纳。已有文献对创新社区中新产品开发人员信息采纳行为影响机理中的影响因素进行了研究,积累了大量的研究成果,但也存在一些亟待进一步研究的问题。基于这样的研究背景,本研究在全面梳理创新社区中新产品开发人员信息采纳行为影响机理中的影响因素