信息网络中节点缺失信息推断研究

被引量 : 5次 | 上传用户:zhouj1790
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息网络是指使用互联网应用的个体与个体之间的交互行为产生的大量的,相互作用的网络[1]。Newman在他的论文中第一次将这种在节点上存有信息的网络归结为信息网络。信息网络中的用户一方面期待信息网络为其提供方便的服务,包括推荐内容,好友等。另一方面却出于保护隐私等考虑,不愿意填写个人信息,不愿公开个人社交关系。所以,为了解决这一矛盾,链接预测与属性推断成为信息网络中数据挖掘的两项重要任务。链接预测问题是预测信息网络中的指定链接是否会产生,或寻回丢失的链接信息的问题。属性推断问题是指推断节点或者边的缺失属性,或者判断节点或者边的属性值真伪的问题。目前大部分属性推断的工作基于信息网络结构或节点的内容信息建模,并且通常假设拥有足够训练模型的标注数据。然而,在实际应用中,标注数据的的时问与人力成本巨大,因此有监督的机器学习模型虽然往往取得好的效果,但是却难以在实际中应用。此外,大部分现有的研究工作将链接预测与属性推断视为两个不同的问题进行分析研究,然而,根据同质性理论(homophily),这两个问题无论是在应用场景还是问题的本质之问均存在强烈关联。针对以上问题,本论文首先提出一个两阶段模型,解决如何在缺少标注数据的情况下,推断信息网络中的缺失属性。模型的第一阶段,先利用社团探测算法,扩展标注数据。第二阶段,利用扩展后的标注数据训练有监督的随机游走模型,基于网络结构与节点内容的相似性,推断用户缺失属性。其次,本文提出利用信息网络中的社团信息,同时解决属性推断与链接预测问题的方法。该方法利用SAN网络(social attribute network)以及社团信息,结合网络结构和用户属性,同时解决属性推断与链接预测问题。根据同质性理论,用户的属性信息与链接信息之间存在相互补充与相互促进的关系。因此,本文设计了一个迭代框架,使两个问题的解决过程中实现信息的不断补充与促进,最终实现二者效果的相互提高。最后,两个真实数据集上的实验结果表明,本文提出的算法较之其他现有算法,具有更好的效果。根据实验结果可知,社团发现算法不仅可以有效解决标注数据不足的问题,而且可以使属性推断与链接预测融合到一个统一的解决框架内。而有监督的随机游走和SAN网络上的随机游走可以有效衡量信息网络中节点的内容及结构相似性,充分利用结构及内容两方面信息,解决属性推断与链接预测问题。
其他文献
可以说自从有了人类以来就产生了社交网络,而研究人类在社交网络中的行为模式与相互作用原理一直是学术界的热门领域。然而针对真实的人类社交网络,由于数据采集、试验困难等
目的:观察熄风停汤治疗小儿抽动症的临床疗效。方法:38例用熄风停汤(自拟)加减治疗。结果:痊愈10例,好转26例,无效2例,总有效率94.7%。结论:熄风停汤治疗小儿抽动症疗效显著。
采用自制4-丁氧甲酰氨基甲苯2-异氰酸酯(BCATI)或4-丙烯酰氧乙氧甲酰氨基甲苯2-异氰酸酯(AECATI)改性(丙烯酸)环氧(酯)树脂制备涂料。结果表明,所用两种原料BCATI或AECATI中的-NCO与(丙烯酸)环氧(酯)树脂中-OH比为~0.25/1时,所制成的清漆
民国肇始,代议制初历实践,已然弊端尽显。章太炎在《华国》刊文主张恢复科道制,寻求消除代议制弊端的办法。《甲寅》复刊,在章士钊主导下,有关恢复科道制的讨论持续数月之久
从连续性方程出发,考虑浆液压力对土体孔隙率的影响,分析推导了浆液在多孔介质中的渗流规律,并给出了扩散半径的简单近似计算公式;然后将二相流理论应用到注浆研究中,假设孔
本文是汉译英翻译项目报告,翻译的文本为广西大学中加国际学院(SCIC)于2016年10月10日发布的《本科英语专业评估自评报告》,总字数为20768。该翻译文本为教育评估报告翻译,属
通过对2D12、4M10、4M20硫化氢气体压缩机运行中的故障现象进行分析、优化改造,取得了满意效果,从而确保了设备稳定运行。
随着计算机网络技术(Internet)、无线网络技术的迅猛发展,出现了网络书店、电子图书、互联网等获取知识、信息的新方法,这些方法由于传播快捷、价格实惠、地域限制性小等优势
SS400含硼钢强度高、塑性好、工业化生产速度快,具有良好的综合性能和使用性能,应用广泛。硼对提高SS400含硼钢的综合性能有重要作用,但在实际生产SS400含硼钢时发现硼的加入也
根据CNNIC发布的《第35次中国互联网络发展状况统计报告》,截止2014年12月底,我国网络购物用户规模达到3.61亿,较2013年底增加5953万人,增长率为19.7%;我国网民使用网络购物的比例