【摘 要】
:
随着互联网和信息行业的发展,大量新闻通过新闻APP传播。在传播过程中,新闻APP平台会产生海量数据,对这些数据进行研究和分析,从而进行精准推荐,能够提高该新闻APP的经济收益。本文基于某新闻APP的用户点击数据构造二分网络,使用网络密度、度分布和簇系数等度量指标探寻用户点击新闻的规律;通过不同的数据增强方法对构造好的二分网络生成相应的扰动图后,使用对比学习和图神经网络相结合的方法对二分网络中的缺失
论文部分内容阅读
随着互联网和信息行业的发展,大量新闻通过新闻APP传播。在传播过程中,新闻APP平台会产生海量数据,对这些数据进行研究和分析,从而进行精准推荐,能够提高该新闻APP的经济收益。本文基于某新闻APP的用户点击数据构造二分网络,使用网络密度、度分布和簇系数等度量指标探寻用户点击新闻的规律;通过不同的数据增强方法对构造好的二分网络生成相应的扰动图后,使用对比学习和图神经网络相结合的方法对二分网络中的缺失连边进行链路预测,分析该数据集中的用户行为,并进行后续的推荐。在构造的二分网络中,网络密度仅为0.74%,且新闻、用户节点的度值均近似服从幂律分布,交互关系薄弱,符合一般大型交互网络的分布规律,因此该数据适合用本文使用的图学习和对比学习相结合的方法进行预测。在模型训练时,本文对比不同的数据增强方法,将AUC提升了 0.603%,准确率提升了 0.9741%,再对超参数进行微调后,得到的最终预测结果中AUC为85.8886%,准确率为87.8705%。本文对预测结果进行进一步分析,基于不同度值的新闻节点分析预测结果,发现不同热门程度的新闻的链路预测的准确率都在0.9至1之间,因此,大部分从新闻角度预测到的链路都是正确的,可以从新闻角度寻找潜在连边的对应用户,并进行后续的推荐任务。
其他文献
广西壮族自治区历史悠久,具有浓厚的革命文化气息,其中具有一定知名度和社会贡献的人,在其生平中形成的全部具有保存价值的各种形式的记录的集合体,就是名人档案。名人档案不仅是可供挖掘的文化资源,拥有潜在的增值效应,也是不可多得的精神财富。以发挥名人档案文化价值、实现名人档案的充分利用为目的,通过文献研究法、案例分析法与实地调研法对名人档案信息资源的开发模式进行研究,分析拉斯韦尔5W模式应用于名人档案信息
随着我国供应链金融行业不断发展,供应链金融规模持续增长,与相关产业不断融合,发展模式不断创新,拓宽了中小企业融资渠道,为促进相关行业发展和国民经济增长起到了重要作用。但是,在供应链金融业务具体运作过程中,商业银行对供应链金融服务的风险识别和风险控制成本较高,而对于供应链企业来说,上游企业不愿为下游企业做信用背书,下游企业因运营成本较高而减少订单量,供应链金融在解决融资难、融资贵方面的作用尚未充分发
数字素养与技能是数字社会公民学习工作生活应具备的数字获取、制作、使用、评价、交互、分享、创新、安全保障、伦理道德等一系列素质与能力的集合[出自《提升全民数字素养与技能行动纲要》]。全民数字素养与技能是国际竞争力和软实力的关键指标,提升全民数字素养与技能是顺应数字时代要求,更好迎接数字文明新时代的关键举措。随着《提升全民数字素养与技能行动纲要》的发布,高校图书馆馆员提升数字素养以适应社会的发展进步已
近年来,我国与马来西亚双边在经济、政治、文化等方面往来非常密切,两国语言的翻译需求日益变大。面向中马的人工翻译,成本较高,效率较为低下。在这一趋势下,机器翻译具有很大的研究意义与实用价值。当前,机器翻译模型性能优异程度取决于语料数据的数量与质量,而中马语料数据不足,使得中马机器翻译模型性能难以提升。本文提出基于迁移学习与基于GumbelTree-LSTM优化的中马机器翻译模型,缓解语料不足带来的性
因果中介效应分析是探究处理变量、中介变量和结果变量之间关系的一种方法,其主要目的在于探究处理变量是否通过中介导致了结果以及在多大程度上通过中介导致了结果,进而揭示事物间的因果机制,被广泛地应用于心理学,行为学和统计学领域。在已有的研究中,研究者所探究的中介往往都是标量。本文将文本分析技术与因果中介效应分析相结合,旨在探究人们在文本上所表达的情感能否作为中介对一些宏观经济指标产生影响。由于结果变量是
公共体育课程是高校教育的重要组成部分,加强高等学校课程思政建设是实现立德树人根本任务的战略举措,课程思政融入体育教学是当下教学改革重要组成部分,其教学设计成为提高教学质量的前提。该研究将以公共羽毛球课程为切入点,对课程思政融入羽毛球教学设计进行研究。该研究选取南宁市广西大学、广西民族大学和广西外国语学院三所高校的2021-2022学年人才培养方案和公共羽毛球课程教学文件为研究对象。运用文献资料法、
在广西发展红色文化旅游和加快文旅融合转型发展的趋势下,如何利用好红色文化资源,提出新的红色文化旅游发展思路,构建独具特色的红色文化旅游品牌,提高地区文旅产业发展速度,是广西旅游业发展关注的重要问题。多年来,广西红色文化旅游产业一直处于向好向上的发展态势,但市场热度攀升却并不明显,急需寻找一个新的突破口来带动西江流域红色文化旅游的整体发展。广西西江流域拥有丰富的红色文化资源且具有典型的整体性特征,应
针对基于FCN和U型网络架构的深度学习显著性目标检测方法提取的显著性图存在边界不清晰和结构不完整的问题,文中提出了一种基于边缘信息引导多级尺度特征融合网络(EGMFNet)。EGMFNet使用多通道融合残差块(RCFBlock)以嵌套的U型网络架构作为主干模型。同时,在网络的较低层级引入具有边缘信息引导的全局空间注意力模块(EGSAM)以增强空间特征及边缘特征。此外,在损失函数中引入了图像边界损失
21世纪以来,知识的地位越来越高。随着互联网的崛起,人们更倾向于在互联网上进行知识搜寻,网络知识社区由此兴起。但是在网络知识社区繁荣发展的背后,也存在着用户知识搜寻满意度和留存率较低的问题。因此,在知识爆炸时代,识别影响用户持续知识搜寻意愿的关键因素,并针对性进行提升成为亟待解决的问题。在此背景下,基于信息系统持续使用模型、情感依恋理论和“认知-情感-意动”理论,建立网络知识社区用户持续知识搜寻意
随机Loewner演化(简称SLE)是由Schramm为描述回路擦除随机游走的尺度极限而引入的一个单参数的随机分形曲线族,它们可以通过驱动函数为时间改变的Brownian运动的Loewner微分方程的解来构造。SLE是描述统计物理学中离散模型尺度极限的一种强有力工具。本文的主要工作如下:第一,研究了偶极Loewner方程的迹与Lipschitz函数图形。证明了如果驱动函数W是一个范数小于4的H¨o