【摘 要】
:
在互联网时代,类似今日头条这样的在线新闻分发平台吸引了数以亿计的用户。由于在线新闻服务的便捷性和时效性,许多用户的新闻阅读习惯已经从传统报纸转向数字新闻内容。那么在信息爆炸时代,平台如何为用户过滤筛选出用户有阅读欲望的新闻成了新闻推荐领域研究的重点任务。协同过滤算法和神经网络模型是新闻推荐领域研究的两大重要方向。然而,现有的很多方法大都忽略了新闻隐式信息是新闻的重要组成部分,对新闻表示的完整性和准
论文部分内容阅读
在互联网时代,类似今日头条这样的在线新闻分发平台吸引了数以亿计的用户。由于在线新闻服务的便捷性和时效性,许多用户的新闻阅读习惯已经从传统报纸转向数字新闻内容。那么在信息爆炸时代,平台如何为用户过滤筛选出用户有阅读欲望的新闻成了新闻推荐领域研究的重点任务。协同过滤算法和神经网络模型是新闻推荐领域研究的两大重要方向。然而,现有的很多方法大都忽略了新闻隐式信息是新闻的重要组成部分,对新闻表示的完整性和准确性起着重要作用。同时,一篇文章往往由多个主题构成,即使主题相同的文章由于其对应的篇幅不同,那么得到的表示也应当不同。此外,不同的用户对同一个主题的关注度和感知度并不相同,进而同一个主题在为不同用户建模时所占有的权重则不同。针对上述问题,本文提出了一种基于多主题感知的个性化新闻推荐模型(Personalized News Recommendation System Based On Multi-topic Aware,PMA),引入了对新闻隐式属性的特征表示提取模块,希望通过挖掘不同用户对词语的关注度、主题的感知度、新闻的关注度来为不同的用户动态的得到不同的新闻表示。同时,在新闻隐式表示中加入了上下文信息来丰富和弥补主题表示的不足之处。最后,通过一个注意力单元来学习显式表示和隐式表示的权重,以期望得到更加全面且合理的新闻表示。本文在一个基于公开的新闻数据集Adressa和MIND的子数据集上进行多轮实验,从新闻推荐领域常用的多个评分指标对模型推荐效果进行评估并与多个新闻推荐模型做对比。实验结果表明,本文提出的模型在新闻推荐方面有一定的提升效果。本文的主要工作内容如下:(1)提出基于多主题感知的个性化新闻推荐模型(PMA)。模型利用CNN网络从新闻的标题中提取局部特征表示。利用LDA主题模型对新闻的内容进行主题分析和提取,通过BERT模型得到文章的主题表示。为了模拟不同用户对词语的敏感度、主题的感知度和新闻的关注度,本文在模型中引入一个个性化注意网络,通过用户的ID来生成词语、主题、新闻的关注度向量。将这些向量作用于对应的表示提取模块,从而实现新闻表示的个性化。利用用户的浏览历史结合用户对新闻本身的关注来为不同的用户动态建模。最后,结合用户的个人偏好对候选新闻进行点击预测。(2)与多个不同的新闻推荐模型做对比实验。本文从,,9)等多个维度将本文提出的模型与其它新闻推荐模型做对比。实验结果表明融入了个性化主题表示和上下文信息的隐式表示将会得到更加丰富、完整和准确的新闻表示,进而得到更加精准的用户画像,达到更好的个性化推荐效果。此外,本文还做了模型内部消融实验和优化实验来验证模型结构的合理性和有效性,同时寻找模型中超参数的合理值。(3)基于多主题感知的个性化新闻推荐系统的设计与实现。利用上述模型(PMA),开发了基于Django的个性化新闻推荐系统。在系统中用户除了可以按照新闻分类或标题搜索的方式寻找新闻,也可以直接定位到推荐栏目。在推荐栏目中,系统会从用户未浏览过的大量新闻池中召回一小部分做为候选新闻,使用PMA模型对候选新闻进行点击预测,并根据预测值降序展示。系统会记录下用户对每次推荐结果的行为,这些行为将会影响对用户画像的调整,进而影响下一次推荐结果。本文对融入了隐式信息和用户感知度等特征的新闻表示进行研究,并将模型具体的应用到一个新闻推荐系统中,缓解信息过载,提升用户的体验,具有现实意义。
其他文献
近年投资基金逐渐成为大众化话题,搜集查询基金信息的需求不断增加。人们可通过搜索引擎或基金网站了解基金信息,但有时需要对相关基金信息进行比较,对感兴趣的基金进一步了解其相关信息,比如要了解某基金的基金经理还管理了哪些基金。此类需求涉及问答系统中的多跳问答问题,在知识图谱中表现为问题主实体到答案实体经过的关系路径不止一条。基于知识图谱的问答在处理单跳问题方面已能达到较高精度,目前难点和研究方向集中在复
随着网络的高速发展,用户在网络上的足迹记录越来越多。为了提高用户的体验,满足用户的个性化需求,个性化推荐系统被提出来。传统的推荐系统都是在单域中进行推荐,会面临冷启动与数据稀疏的问题。跨域推荐的提出,实现了可借助其他域中的数据为用户进行推荐,解决了单域推荐系统中存在的冷启动与数据稀疏问题。但随着用户在网络上的交互越来越频繁,越来越广泛,用户在不同域之间的兴趣会产生影响,这时候,跨域推荐不仅仅是作为
随着互联网技术的发展与普及,网络上的信息爆炸式地增长。与日俱增的信息在丰富了网络上信息量的同时,也加大了人们从互联网获取目标信息的难度。智能问答系统作为一种新型的信息服务方式,能够理解自然语言问题并回答,可以更方便、直接地帮用户获取信息。表格具有数据量丰富和结构明确的特点,在网络技术发展的过程中成为了主流的数据载体。为了方便用户从表格中获取信息,表格智能问答——即以表格作为智能问答的答案来源,成为
随着5G时代的到来与数字化社会的快速发展,人们的生活越来越依赖网络。与此同时,方便人们表达自我与网络社交的社交媒体平台也飞速发展。越来越多的用户进入社交媒体平台,留下了丰富的个人动态、个人信息等数据,这些数据都是用户自主产生,具有极大的真实性与可靠性。通过分析用户在社交媒体平台产生的数据,可以做到尽可能全面、准确地描绘用户画像。用户基本属性和用户兴趣是社交媒体用户画像重要的组成部分,对于社交平台运
流行性感冒极易于每年秋冬季在人群中流行传播,严重影响人们的生命安全和生活节奏,流感疫苗可以帮助人体提高免疫力,有效保护人体避免感染流感病毒。目前各国公共卫生机构的一项重要任务就是制定各种流感疫苗接种政策,从而提高流感疫苗在人群中的普及率,保障人民的生命健康安全。由于个人对流感疫苗的了解程度较低或其他原因,有不少人对接种流感疫苗持犹豫或拒绝的态度,这对流感疫苗的接种工作造成了一定的困难。因此需要分析
中国已成为全球第二大经济体,而股票市场则是我国经济十分重要的环节,改革开放进入二十一世纪以来,我国的股票市场不断发展与完善,股票趋势预测的话题备受关注,若能准确地判断股票在未来的波动趋势,这将产生巨大的价值,带来收益的同时也能规避风险。计算机技术的发展,使得使用神经网络技术对股票趋势进行预测成为热门研究领域,如使用长短期记忆神经网络模型、循环神经网络模型、支持向量机模型等,基于股票的历史数据,对股
随着大数据时代的到来,数据资源的价值逐渐受到关注与认可,人们对于数据交易的需求也在日益增加。然而,我国目前的数据交易仍面临着诸多问题,其中,数据交易过程中的数据安全问题是重中之重。类似于传统的商品交易,数据交易也是多方参与主体相互促进、相互制约的演化博弈过程。因此,本文从数据安全角度出发,展开对数据交易四方参与主体的演化博弈研究。本文基于数据安全角度,首先,结合数据交易的发展现状和现有研究,将政府
随着信息技术的快速发展,人们同时扮演着信息的消费者和生产者两个角色。作为一种从海量数据中快速发现信息的技术手段,推荐系统逐渐成为解决信息过载问题的主要方式之一,被广泛应用于电子商务、音乐/视频服务、社会媒体、广告策略等众多领域。面对推荐场景中日渐丰富的多模态信息,传统推荐方法无法有效挖掘用户深层次的偏好特征,很大程度上不能满足用户个性化推送的需求。近些年,研究者们将用户评分、评论、浏览等数据进行特
近年来,Web of Science、Google Scholar等文献数据库不断更新完善,为研究者们提供了丰富的文献参考。文献量大、研究因素复杂成为了许多研究领域的一个特点。研究者在研究初期需要快速准确地对大量文献内容进行梳理与科研统计,了解研究领域的发展趋势和方向,以开展新研究。其中,研究两代人社会地位变化的“代际流动”(Intergenerational mobility)领域,文献量日益增
在我国大力推行建设数字强国的背景下,将计算机技术与金融知识相结合,分析处理海量数据并从中提取规律,从而构建量化交易策略,已经成为许多投资者普遍选择的投资方式。在人们的物质生活得到了极大提升之后,越来越多的人参与到股票投资之中,程序化的股价研究既能规避投资者因情绪变动而出现的主观误判,又能在庞大的数据中挖掘出人力无法发现的隐藏规律,因而被众多专家学者所关注。投资者希望能够制定出一种智能化交易策略,从