基于结构学习的网络嵌入增强技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:lv0550159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络嵌入,又称网络表示学习,在社交网络、推荐系统、知识图谱、自然语言处理等领域都有着广泛的应用。典型的网络嵌入技术以应用中的网络结构等信息为输入,通过嵌入模型获取网络节点的低维特征,基于这些低维特征可以方便的进行如节点分类、聚类等机器学习任务。现实世界的网络结构数据往往存在各种缺陷,如网络结构中边的遗失、噪音等问题,已有的网络嵌入模型被应用在具有缺陷的网络结构数据上时往往效果大打折扣。目前的网络嵌入工作鲜有考虑网络结构数据本身的缺陷问题。本文工作针对网络嵌入中数据存在的诸如边缺失、稀疏、错误等网络结构缺陷问题进行研究,提出一种迭代式方法进行网络结构学习,从而提高网络嵌入的效果。具体而言,本文工作的主要内容包括:1.针对存在边缺失缺陷的网络结构,提出一种迭代式的网络结构学习方法IAL。该方法在每一轮的学习中包括子集筛选、边评价、网络结构更新、网络结构评价等模块。该方法对具有边缺失、边稀疏等缺陷的网络结构数据具有增强作用,能提高网络嵌入的表现。2.针对存在边错误缺陷的网络结构,基于错边数据的具体特征,提出一种两步处理的网络结构学习方法IAL-REC。该方法能有效提高含有边错误等缺陷的网络结构的质量,增强网络嵌入的表现。3.将方法整理成实用性较强的工具。根据方法的具体特性对工具进行模块分离和整理,对预处理、网络结构学习、常用算法、网络嵌入模型等模块进行整理实现。使用者可以方便的根据不同任务的特点选择合适的训练策略,提高开发效率。4.在常用的网络结构数据集上进行半监督图节点分类实验,验证了本文网络结构学习方法的有效性,实验表明,本文方法能有效提高网络结构数据的质量,提高网络嵌入模型的效果。
其他文献
本研究通过田间试验对东北红豆杉宽甸、本溪、和龙、汪清和穆棱5个产地幼苗的保存率、地上和地下性状等15个生长特征进行了测定,试验分别在山东、北京、辽宁3个地点观测4年生苗,利用表型性状和原产地生态因子相关性研究,揭示了东北红豆杉地理变异规律,并采用系统聚类的方法将5个产地分为三类。主要研究结果如下:1、在山东和辽宁试验点,汪清产地幼苗表现最好,宽甸产地幼苗表现最差。在北京试验点汪清产地表现最好,和龙
尖晶石型氧化物ZnAl_2O_4具有良好物理化学性质,并且具有良好的力学性能、较宽的活性温度范围,在透光导电材料、陶瓷、催化剂、催化剂载体、材料等领域应用广泛。目前过渡金属离子负载的铝酸锌(ZnAl_2O_4)作为一种良好的非均相催化剂,广泛应用于光催化有机合成以及碳氢化合物选择还原脱除氮氧化物(NO_x)。本文综述了尖晶石型氧化物选择催化还原脱除氮氧化物(NO_x)的研究背景,并概括了小分子在尖
水分解制氢技术不仅可以缓解化石燃料消耗引发的环境问题,而且还能满足日益增长的能源需要。无偏压水分解器件的制备逐渐受到国内外科研工作者的关注。目前,半导体与太阳电池
白蚁分飞的持续时间短,分飞过后脱翅并配对建巢,是白蚁种群扩大和繁衍的重要活动,在白蚁生活史中占有重要地位。目前对白蚁分飞行为的研究中,主要集中在白蚁分飞行为的生物学
融资错配现象的长期存在极大地影响了我国企业的投融资行为,亟须进行制度创新加以解决。引入优先股这种新式融资工具,无疑有助于我国建立多层次的资本市场,而对优先股这一新政的深入研究,不仅能剖析该制度对我国资本市场各相关利益主体带来的影响,还可以为我国融资理论的研究提供素材,当然需要交代的是,本文所研究的融资错配,指的是企业间融资资源的错配。本文利用2007—2017年中国沪深A股的上市公司的财务面板数据
《论共产党员的修养》是刘少奇在思想政治教育领域的代表作,集中地体现了刘少奇进行思想政治教育的独特方法。首先,恰当运用说服教育法充分论证做到以理服人;其次,创造性地从
醛类物质是很多化工和医药产品的重要中间体。2019年,全世界醛类物质的产量超过1500万吨。醛类物质用途十分广泛,例如,国际上采用正戊醛生产无毒、环保型大分子增塑剂邻苯二
多源信息在现实世界中广泛存在,并且蕴含更丰富的内容。如何利用多源信息改善模型性能以及提升模型鲁棒性,已成为机器学习研究的热点问题。在各种机器学习算法中,分别从模型
制造企业开展服务化是顺应产业变革、增强核心竞争力的重要途径,但在向服务化转型的过程中存在诸多风险与挑战,制造企业面临遭遇失败的可能。失败是异质性资源的一种,学习失
新中国诞生前,我国的神经外科事业几乎是空白,没有一家医院有神经外科病房。30年代初期,在北京、沈阳等地曾一度进行过脑外科治疗,那时仅少数几位普外科医生兼做一些神经系统
会议