论文部分内容阅读
链接预测问题旨在预测网络演化中的链接出现和消失,是社交网络数据挖掘中的核心问题之一。然而,现有大多数链接预测工作主要集中于单个网络,对于耦合网络的链接预测却鲜有研究。但在现实世界中,绝大多数网络都是互相作用互相依赖的,不能孤立地研究单个网络而忽略网络之间的相互联系与作用,因此,研究耦合网络链接预测问题是有必要、有意义的。本文针对现有耦合网络链接预测算法存在元路径泛化低等问题,提出了统一元路径模型并实现耦合网络链接预测算法(CNLP)解决该问题,实验表明该算法预测效果接近原生元路径方法,能有效改善算法泛化性、区别对待不同元路径、不需专家设计元路径。本文将链接预测理论运用于链路预测分析系统,有利于通过可视化操作直观查看链路分析的效果和流程。通过具体案例完成潜在白名单推荐和产品推荐。本文的主要工作包括以下两方面:(1)改进相似性指标(CN、Katz)和耦合网络链接预测算法。在相似性指标中整合节点导向力和时间因子,节点导向力考虑节点和路径在网络中的作用各异,时间因子通过平均度度量连接形成的可能性,该方法在其他相似性指标和路径指标也有效果。实验表明:当使用节点导向力因素,实验精度比原生CN指标和Katz指标仅提高2%左右;同时使用节点导向力和时间因子,其精度改善提高5%至10%。本文构建统一元路径方法解决耦合网络异质性,区别处理网络中元路径的类型,整合耦合网络链接预测算法(CNLP)。实验表明:该方法比其他方法精度提高超过3%,统一元路径增强了模型泛化程度、区别对待网络中不同元路径和自动设计元路径。(2)设计并实现复杂网络的链路预测分析系统。链路预测分析系统用于采集信息完成在线审查,用户实时查看相关数据,并对链路预测进行分析管理。系统采用SOA分布式架构设计原则、深耕接口设计。实现系统核心模块,合理完成架构设计,提供完善的系统解决方案。系统实现表明:分布式架构有利于整合系统资源,提高系统的稳定性、灵活性和可扩展性,提供良好的操作界面,提高了链路分析的稳定性和安全性,具有广泛的实际应用价值。系统将链接预测理论和互联网金融案例有机融合在一起,主要帮助发现潜在客户,推荐金融产品。