【摘 要】
:
在线社交网络是对实际世界对象及其间相互关联关系的抽象描述。在网络中的节点代表着实体对象,而连接则代表实体间的交互关联。这些链接中包含丰富的节点属性信息,结构信息以及网络演化信息。在网络的演化过程中,某些链接可能出现或消失,需要对缺失数据进行补全以及对未来可能出现或消失的链接做出预测。同时作为数据挖掘领域的一个重要分支,链路预测被应用于社交网络、电子商务、学等领域,具有很重要的现实意义。目前基于相似
论文部分内容阅读
在线社交网络是对实际世界对象及其间相互关联关系的抽象描述。在网络中的节点代表着实体对象,而连接则代表实体间的交互关联。这些链接中包含丰富的节点属性信息,结构信息以及网络演化信息。在网络的演化过程中,某些链接可能出现或消失,需要对缺失数据进行补全以及对未来可能出现或消失的链接做出预测。同时作为数据挖掘领域的一个重要分支,链路预测被应用于社交网络、电子商务、学等领域,具有很重要的现实意义。目前基于相似性的链路预测方法大多基于节点表示的假设,利用节点的共同邻居这一特性,导致单一的指标得到节点表示较为相似,难以将网络中的节点特征进行有效区分。同时,传统深度神经网络的池化使得学习得到的节点特征表示难以有效保留网络结构信息,从而影响模型预测效果。针对上述问题,本文主要研究工作如下:(1)针对无节点属性的网络,提出一种基于层叠泛化的链路预测模型。首先,从机器学习的角度出发,将相似性指标作为节点对之间的特征,从而将链路预测转换为二分类问题;然后,利用集成学习,引入层叠泛化机制,采用不同的机器学习模型,对多个不同的相似性指标进行有效结合,从而获得更好刻画目标网络结构特征的融合指标,进而使模型预测性能得到提升。(2)针对有节点属性的网络,提出一种基于图神经网络和胶囊网络的链路预测模型。首先,使用图神经网络学习生成相应的节点特征,将网络节点映射到低维的节点特征向量;其次,通过设计的转换块,将学习到的节点特征转换为相应的的节点对特征;第三,受胶囊网络思想的启发,通过胶囊网络学习节点对之间的特征表示,有效地捕获节点对之间的结构信息。同时,可以在模型中使用不同的图神经网络以适用不同的目标网络,从而获得预测性能上的提升。(3)设计并实现了科研合作者网络关系预测系统。将第三章与第四章分别提出的链路预测模型应用于专家合作网络预测系统,旨在为研究者方便快捷的熟悉自身所从事领域的网络关系信息,做出有效的决策提供帮助与建议。根据用户输入的专家信息,通过模型对其合作网络关系进行预测,并将预测的合作网络关系结果以可视化的方式展现给用户。综上所述,本文针对无节点属性的网络与有节点属性的网络,分别提出了基于层叠泛化的链路预测模型和结合图神经网络与胶囊网络的链路预测模型。通过在多个不同真实数据集上进行实验验证,并对现有的方法进行相应的对比分析。实验结果表明,本文所提出的链路预测模型在AUC、F1-score等多个评估指标上均取得较好的预测性能,从而验证了模型的有效性。最后,将模型应用与专家合作网络系统,同样取得不错的预测结果。
其他文献
命名实体识别是从文本中抽取出关键的实体信息。随着用户在网络中的交互数据量增多,为应对网络信息爆炸的问题,命名实体识别研究一直是研究热点。目前,命名实体识别的相关研究主要基于深度学习的方法开展,研究者一方面尝试在文本的字符隐藏特征表示中加入外部词典信息,另一方面在transformer框架下加强文本字符的边界信息,两者都有效地提升了实体识别的精确度。现有研究存在的主要问题主要有二,一是当前主流的中文
财务风险管理对一个企业而言至关重要,在市场经济体制下,加强旅游企业财务风险管理,才能更好地促进旅游业可持续发展。旅游企业在发展过程中会面临各种财务风险,企业只有强化自身的财务风险管理能力,才能在竞争中不被打败。
近年来,随着税收政策的不断改革、“营改增”“国地税合并”“减税降费”等税制完善大事件的发生,我国税务环境逐渐步入新常态,企业外部涉税情况也越来越复杂。在此宏观背景下,税务机关的执法监管力度逐渐加大,稽查人员的素质不断提高,因此导致上市公司、名人因偷漏税行为曝光而声名狼藉的丑闻层出不穷。而房地产行业作为我国支柱型产业之一,具有项目开发时间跨度长、涉税业务环节和税种多等行业特征。同时,许多房地产开发企
随着层出不穷的新技术应用、更加多样化和个性化的客户需求不断涌现,大规模定制逐渐成为一种汽车行业的必然趋势。要实现大规模定制的生产模式,加强产品数据管理尤为重要。作为汽车企业的数据管理和过程管理核心,产品数据管理是所有工程和制造活动的出发点,反映了企业的业务流程与管理规范。只有在先进的产品数据管理体系的支持下才能使大规模定制成为可能。本文以A汽车公司产品数据管理现状为基础,采用KJ法对A汽车公司面向
随着互联网的飞速发展,人们的生活方式也发生了巨大的改变,越来越多的人在互联网进行交流、购物等。其中,以亚马逊、淘宝、京东为代表的网络购物平台成为了人们的首选购物渠道。电商平台每天都会产生巨量的文本数据,用户会根据自己对购买产品的使用体验给出相应的购物评价。消费者对商品的评论表达了消费者对商品的情感态度,这对于其他消费者选购该商品时具有重要的参考价值,同时对于商家和网站管理者进行下一步的决策具有指导
本文以满文档案中收录的有关孔有德盛京家产人丁安置情况的档案为基本资料进行研究。翻译整理相关档案,确认孔有德在盛京留下的人口皆是孔有德原十五佐领下人,且并无罪责。因其多以种地为生,盛京佐领将其编入盛京内务府粮庄,称为“无罪拨入”,这些人的身份从旗下自由人转变为粮庄内奴仆。孔有德盛京留存人丁编为7个粮庄。每庄计入庄头各编15丁,补放7个庄头,庄头纳入管领。杨凤保等编庄后,不满被编入粮庄,强烈要求拨出官
近年来,物业管理公司因其专业性和高成长性备受资本市场的青睐。与此同时,国家亦在政策层面支持物业管理行业的发展,促使该行业的市场规模日益增长。因此,越来越多的物业管理公司成功通过上市融资跨入资本市场,这也导致目前物业管理行业的竞争越发激烈。通过并购进行规模化发展以寻求新的业务增长点,是目前物业管理公司保持竞争优势和抢占市场份额途径和有效方式。基于此,本学位论文以物业管理行业龙头公司之一的Y公司并购M
随着经济增速放缓、市场需求下滑以及产业结构调整等多重因素的影响,房地产开发企业纷纷向产业地产转型,寻求多元化发展,但产业地产多为持有型物业,比传统房地产开发周期和投资回报期更长,而融资模式仍以银行贷款等债权融资方式为主,资金退出机制不畅,整体行业发展受限,亟需寻求创新投融资模式。国家现大力推行公募REITs这种新型资产证券化融资模式,为房地产企业融资提供了新的思路。本文选取“博时招商蛇口产业园封闭
随着互联网迅速发展,线上消费已成为一种趋势,并为广大消费者所接受,因而各种购物平台的在线评论信息也开始呈现爆炸式增长。通过挖掘这些评论的潜在情感倾向,企业可以快速找准自己的定位,从而在用户体验的基础上改进产品和服务,获得消费者的信任和青睐,促进服务业的蓬勃发展。同时,也能促进在线评论者的交流,帮助用户更好更快的做出决策。因此探究在线评论信息,挖掘其背后的情感倾向具有重大的商业价值和学术价值。本文主
小样本细粒度(Few-shot Fine-grained,FSFG)图像分类,在实际生活中具有十分重要的现实意义。在生物研究、医疗影像和商品销售等领域具有很好的实用场景和应用潜力。细粒度图像的某些类别中标记良好的样本有限,同时其分类工作需要强大的专业认知能力。这给细粒度图像进行准确的分类带来巨大的挑战。本文基于深度卷积特征的FSFG图像识别研究,旨在有限的训练数据下对细粒度图像进行准确的分类。论文