基于幂律特性和局部敏感哈希的社交网络个性化推荐方法研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:myna5726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文聚焦于时下发展迅速的社交网络研究,针对大数据时代下社交网络研究的几个重要问题开展论文研究工作。社交网络是近年来最为流行和用户量最大的互联网应用,诸如国外的Facebook、Twitter和国内的新浪微博、微信朋友圈等,都拥有着亿级乃至数十亿级的用户群体,并且社交网络积累了海量的用户行为数据,这些人们通过社交网络的交流、分享所产生的行为数据对用户行为、信息传播、复杂网络、推荐系统等等领域的研究都有着重要的意义,涵盖了从管理学、社会科学到计算机科学技术的研究范围。本文立足于新浪微博的用户数据,针对大数据背景下带来的长尾推荐、数据稀疏性、数据维度灾难等问题开展研究工作。在社交网络数据中,幂律分布是数据的基本规律,幂律分布的长尾部分数据有明显的稀疏性,长尾推荐一直是推荐系统的挑战,而冷启动、数据稀疏和覆盖率这些问题也是推荐系统的重要研究内容。本文通过分析数据幂律分布的特性,在研究社交网络个性化推荐方法的基础上,结合社交网络用户行为数据反映出来的幂律分布特性,通过极大似然估计计算数据幂律分布的标度值。结合幂律特性改进了相似度计算方法,提出了一种基于幂律特性的混合推荐方法PowerLawCF(Collaboration Filter)。使用新浪微博的用户签到数据进行实验结果分析后,PowerLawCF算法的推荐效果有显著提升,提高了对于长尾推荐的效果,对推荐系统的数据稀疏性和冷启动问题有较好的解决。随着大数据时代的到来,数据维度灾难问题越来越显著,局部敏感哈希(Locality-Sensitive Hashing,LSH)在近年来成为研究者们关注的热点。文章通过对局部敏感哈希在KNN搜索计算上的高效表现,针对社交网络推荐构建合适的哈希函数族,并基于哈希结果进行用户分组,构建基于局部敏感哈希的个性化推荐方法,并通过数据实证分析证明推荐方法具有较好的推荐效果。本文通过对社交网络幂律特性、长尾推荐方法以及局部敏感哈希的应用研究,较好的解决了社交网络个性化推荐中的长尾推荐、数据稀疏性以及数据维度灾难问题,研究具有一定的理论和应用价值。
其他文献
目的:探究散装、小包装及中药配方颗粒中药饮片的优缺点。方法:选取2018年1~2月我院门诊186例患者,发放调查问卷分析比较散装、小包装及中药配方颗粒中药饮片的优缺点。结果:
<正>大午集团"私企立宪制"的核心事实上是"三权分立":所有权、决策权和经营权完全分开孙大午,以1000只鸡与50头猪起家,于1985年创建了大午农牧集团有限公司(下称大午集团)。1
目的:研究二巯丙磺钠对重型杀虫双中毒患者的治疗价值.方法:350例重型杀虫双中毒患者随机分2组,170例(Ⅱ组)应用传统综合疗法,即洗胃、导泻,应用东莨菪碱等对症治疗.180例(Ⅰ
近年来,英语教学重心逐渐发生转移,即由教向学转变。同时,随着信息化时代和终身学习时代的到来,对学习者自主学习能力的要求逐渐提高。动机作为语言学习关键的影响因素之一,已经成为外语教育领域重要的研究课题。在借鉴社会文化学派成果的基础上,D?rnyei提出了二语动机自我系统这一新的理论框架,在实践中其有效性已经得到了诸多学者的验证。然而,目前学者较少地探究二语动机自我系统与自主学习能力相关性问题,尤其在
<正> “条条大道通罗马”这句家喻户晓的成语在意大利更有深刻的体会。驱车出罗马城观光,免不了要走上罗马古道。2000多年来,这些占道依然散发出青春的活力、简直难以置信。
研究背景术后认知功能障碍(postoperative cognitive dysfunction,POCD)是指患者在麻醉或手术后,大脑加工处理信息的能力受到不同程度损害的一种严重的术后并发症。发生POCD
本文以浙江省11个地级市的2000年~2015年的旅游业及经济发展相关指标为研究对象,运用空间分析和面板计量回归方法,分析了区域旅游业发展和经济增长率时空演化格局,并探讨其影
合成了以芴为取代基,P原子为核的一类新型有机膦化合物.此类化合物的HOMO值在5.35~5.24eV之间.在二氯甲烷中的最大紫外吸收光谱峰值在313~351nm之间,荧光光谱峰值在334~397nm
涉罪合同效力的判定问题主要存在于诈骗类犯罪案件中,近年来,合同诈骗罪、集资诈骗罪、信用卡诈骗罪等财产性犯罪高发,诈骗类犯罪数量呈逐年递增趋势。此类刑事犯罪多与合同
由于动力锅炉、过热器等设备在运行中对条件有一定的要求。但是,由于环境相对较差,锅炉的参数容量相对较高,机组需要长期持续地运行,由于锅炉参数、停机、事故等各项元素的影