【摘 要】
:
在互联网迅猛发展的今天,信息和数据呈现爆炸式增长,面对海量数据信息,如何快速准确地找到用户感兴趣的内容,已经成为一个亟待解决的重要问题。推荐系统在此背景下诞生,推荐算法是推荐系统的核心,它可以通过挖掘用户行为数据构建用户兴趣偏好模型,从而主动为用户进行推荐。协同过滤是推荐算法中广为应用的技术,项目间和用户间相似度的度量是协同过滤推荐算法的关键,仅依据稀少的评分数据无法准确地进行相似度计算,因此,如
论文部分内容阅读
在互联网迅猛发展的今天,信息和数据呈现爆炸式增长,面对海量数据信息,如何快速准确地找到用户感兴趣的内容,已经成为一个亟待解决的重要问题。推荐系统在此背景下诞生,推荐算法是推荐系统的核心,它可以通过挖掘用户行为数据构建用户兴趣偏好模型,从而主动为用户进行推荐。协同过滤是推荐算法中广为应用的技术,项目间和用户间相似度的度量是协同过滤推荐算法的关键,仅依据稀少的评分数据无法准确地进行相似度计算,因此,如何利用项目间存在的内在关联性来改进项目间的相似度和如何利用SimRank信息来改进用户间的相似度成为了本文的研究重点,主要的研究工作如下:(1)针对评分数据稀疏带来的传统协同过滤算法中项目间相似度计算不准确问题,提出一种基于频繁项集挖掘的协同过滤推荐算法,采用Apriori算法对事务数据库进行频繁项集挖掘,利用Jaccard相似度来衡量频繁项集中项目间的关联性,得到基于频繁项集的项目相似度,再引入加权因子将该相似度与通过评分数据计算的项目相似度进行综合,得到项目间的综合相似度。算法不仅考虑了项目间内在关联,还考虑了用户对项目的评分数据,提高了推荐算法的推荐质量。在MovieLens、FilmTrust和LastFM这三个公开数据集上进行实验,实验结果显示,提出的改进算法较对比算法能取得更好的推荐效果。(2)提出一种基于改进SimRank的协同过滤推荐算法,算法对用户-项目二部图进行优化,根据评分数据和用户的特征构建用户节点关系图,解决了已有的SimRank算法中二部图结构复杂导致算法复杂度高的问题,同时考虑不同邻居用户对目标用户的贡献不同,利用加权因子改进SimRank计算方法,更精准地度量用户间的相似度。并利用SimRank算法的传递性,挖掘出目标用户更多的潜在邻居,提供更多样的推荐项目,缓解了数据稀疏性导致协同过滤算法预测准确度低和覆盖率低的问题,在MovieLens、FilmTrust和LastFM这三个公开数据集上进行实验,其结果证明了改进算法的有效性。
其他文献
量子点(quantum dots,QDs)的优异光学特性已被学界认可。因此,作为新型的荧光标记物,量子点正逐渐取代传统的有机荧光染料,在细胞标记、多色成像和肿瘤靶向等方面都有着非常广
去中心化分布式应用(DApps)被誉为互联网的未来。但由于它的底层技术——区块链公开透明的特点,造成了隐私保护上的问题。本文构建了一种更安全、抵抗双花攻击的轻量级环签名(LwRS),并将其与改进的双密钥隐形地址协议(DkSAP-IoT)相结合,并集成了数据可用性和安全性的理念。通过构建新的强化承诺方案来实现安全的LwRS,该方案利用签名人的整个私钥,然后使用加密哈希函数来计算更强的密钥镜像,而Dk
在所有植物次生代谢产物中,紫杉醇是一种高效的抗癌药物,临床上对多种癌症都具有良好的治疗效果。当前它仍主要从生长十分缓慢的珍稀濒危物种红豆杉属的树皮中提取,因此探索
葆灵女中在其五十载的办学历程中,教育实践不断发生改革,尤以1925年以后所发生的多方面变化和改革最为显著。本文旨在通过对葆灵女中的教育实践变迁进行系统的回顾和梳理,进而探究引起其变迁的诸多因素。本文采用史料实证研究方法,跨学科综合研究方法以及个案分析方法,在充分挖掘葆灵女中一手资料的基础上,一方面对史料加以甄别和分析,另一方面结合历史、宗教以及社会文化的研究。此外,本文将葆灵女中作为教会学校的个案
薄板冲压成形技术以其大批量、高效率、低成本等优点引起了国内外学者的关注并得到迅速发展,其成形方法包括刚模成形和软模成形。随着科技的发展,对成形零件的形状和质量提出
民族器乐音乐是中国最具特色的传统音乐,它拥有千年的历史文化,在这历史长河中它不断的繁衍生息,被赋予着一代又一代民族器乐研究者的智慧和传承精神。民族器乐音乐在地方戏
死亡仪式是将死亡的个体归入社会另一范畴——死者世界——的重要手段,它更多地表现为社会性的仪式。在本次田野调查中,笔者以白露坑村的死亡仪式为主要研究对象,通过对不同类型的葬礼过程、做墓与二次葬、祖先的巫术力量和年节祭祀等内容的描述,试图对当地如何通过仪式和观念赋予祖先完满的道德人格这一问题进行分析。在白露坑村,死者可通过葬礼和二次葬等仪式归入祖先的范畴。二次葬是死者进入坟墓的重要仪式,它也是令社会中
帕木竹巴第悉执掌西藏地方政权时,四海平定,富裕之民,依法治官,以律治贤,职官取其人文之精华,贤者探讨十明之文化,出现其繁荣之根源与帕木竹巴第悉时期的行政组织相关联的,故本文首先应用文献研究和实地调查相结合对帕竹的宗谿、万户和部落等基层行政单位的数量与其地理位置作了考证与梳理,并探析了基层行政单位的组织形式与作用其次帕竹第悉时期的第悉、宗本,囊钦、都元帅、岱本等行政职官作了梳理,帕竹首都职官构架作了
本文为一篇汉译英翻译实践报告,选取了《大羌故事》的第四和第五章节作为报告的翻译材料。译者受导师委托,参加了《大羌故事》翻译项目。该项目目的在于向世界传播中华文化。在提倡加强国内文化宣传和倡导文化“走出去”的当今社会,翻译介绍少数民族文化的材料有着重要的意义。原文材料涵盖多篇羌族文化故事以供读者了解中国少数民族文化。本文作者将理论与翻译实践进行有机统一,在理论的指导下圆满完成了此次项目。译者采用目的
随着计算机技术的发展,数据量呈现爆炸式的增长,数据压缩作为减小存储数据所需空间的技术,能够有效缓和存储和传输的压力,在各类系统中得到了广泛的应用。与此同时,海量数据上的有效信息的挖掘是目前的研究热点,而数据挖掘和分析通常需要基于对数据的随机存取以及查询等操作。现有的传统数据压缩算法通常只是为了消除数据的冗余而设计,不支持压缩数据上的随机存取和其他检索操作,而高效的索引结构也通常只是面向原始数据设计