基于多源异构数据融合的社交网络链路数据预测研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:fkj1022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交网络服务和其他网络应用的迅速增长,社交网络数据出现以指数级增长的态势,这些数据开始互相关联,并出现交集。由于这些数据在一定程度上保存了用户的潜在行为模式,因此,如何从海量的社交网络数据中挖掘出用户的潜在关联来实现社交网络服务质量的提升,成为许多社交网站及相关企业亟待解决的问题,同样在学术界也引起了一股研究热潮。链路预测采用补全社交关系网络的方式,来挖掘出大数据中的潜在商业价值。链路预测是指通过已知的网络节点以及网络结构等信息预测出网络中尚未产生链路的两个节点之间产生链路的可能性。由于链路预测所面对的数据具有多维度和全面性的特点,因此数据之间常常存在着意想不到的关联性。但传统的链路预测没有对这些多维度的数据进行深挖,忽略了数据的关联性。本文对这些多维度数据进行层层探索,创建新的链路预测模型,实现更准更高效的预测结果。针对传统链路预测存在的局限性,本文通过神经网络构建了基于多源异构数据融合的链路预测混合模型,主要研究内容如下:1.本文提出了一种基于多源异构数据的链路预测混合模型。该模型利用基于地理位置的社交网络数据集中的用户关系拓扑图和用户签到记录这两种异构数据对用户行为模式进行挖掘,在一定程度上提升了传统链路预测模型的准确度。2.本文构建了一种基于锚链接算法的链路预测混合模型。该模型利用锚链接算法对基于地理位置的社交网络数据集中的多维度数据之间的潜在关联进行了更深层次的挖掘,充分捕获多源异构数据之间的关联性,其预测准确度优于基于多源异构数据的链路预测混合模型。3.本文实现了一种基于局部敏感哈希技术的链路预测混合模型。该模型利用局部敏感哈希技术,将基于地理位置的社交网络数据集中融合的多源异构数据转换为汉明编码,局部敏感哈希技术能够保存原来关联节点之间的相似性,并且使用汉明编码训练模型能够提升运算速度和降低数据存储消耗,对比前两种模型,该模型在性能和准确度上都进一步提高。本文提出的三种链路预测混合模型在如Gowalla、Foursquare等公开数据集上进行了实验,使用AUC、F1值等评估指标,对比了仅使用单一数据源的传统链路预测方法如walk2friends、node2vec等,验证混合模型的可行性和高效性。实验结果表明本文提出的混合模型比传统的链路预测更为高效和准确。
其他文献
国有企业内部法律顾问制度对企业的法律顾问执业活动进行了规范,它不仅适应了企业发展的需求,还满足了市场经济发展的需要。但国有企业内部法律顾问制度的现状不容乐观,其中
<正>今天是周五,因为班上的美术老师临时出差,我领到了学校的代课单。当我出现在教室门口的一刹那,预料中的情形再次上演——"啊?不是美术课吗?""唉!又要上语文了!"……接下
芜湖铁画,作为一种传统的民间工艺,在现代社会潮流中遭遇到发展的困境。这困境实质上是传统工艺美术在现代社会如何生存和发展的问题。芜湖铁画如何摆脱困境,加快发展,这是文
肝门部胆管癌是一种来源于左右肝管、肝总管及其汇合部位的恶性肿瘤。Ⅲ型和Ⅳ型肝门部胆管癌是按Bismuth-Corlette分型中发生在胆囊管开口以上且向肝内侵犯至左右一级或二级
目的:对麝香保心丸在临床老年CHF治疗中的应用与效果进行有效观察。方法:抽选某院于2012年7月~2014年3月收治的102例老年CHF患者作为观察对象,随机将其分成甲乙两组各51例,分
随着社会经济的发展,人民的生活水平越来越高,人们对住所的环境也有较高的要求。家庭装修现在我国居民追求安全、舒适的居住环境的一种需求,也是一种新的消费动向,但由此引发
随着互联网的发展,我们的生活已经步入数字化时代。当今世界,文化与科技相互交融,高创新、高技术含量的文化产品在文化产业的发展中占有越来越重要的地位。西藏是我国一个文
<正>入冬以来最低温的寒流报到,让"泡汤族"泡个过瘾,不过要小心的是每年秋冬温泉季都会发生数起意外。因此,提人们泡汤前要注意安全,否则温泉之旅恐怕也会"泡汤"啦!其实泡温
【正】 广电部于1月5日公布《关于改革故事影片摄制管理工作的规定》。这一文件列举了对故事片摄制管理工作改革的几项重大决定。即:1.自95年1月1日起,其他各省、自治区、直
<正>设计说明:朗瑞科技是一家生产销售汽车灯具的公司,品牌名称LR是朗瑞的谐音英文LIGHT/RICH取两个单词首字母组成,寓意为更丰富的光线.在汽车照明领域,提供充分的光线照明
期刊