面向问答社区的答案推荐方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:Richard0936
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答社区为用户提供了一个解决疑难问题,分享知识、经验、见解的交互平台,用户不必烦恼于如何提取关键字来表述他们的信息需求。问答社区包含的内容极为丰富,涉猎的话题也非常广,形成了一个庞大的知识库,并且问题更多的是寻求意见、建议,征集看法的讨论型问题,各个答案都蕴含着对问题有价值的信息,这使得问答社区需要智能化、精准化的个性化推荐服务,以解决当前问答社区中的“信息超载”问题。当前面向问答社区的答案推荐研究主要基于答案的质量,没有充分考虑到不同用户的兴趣偏向;同时,研究更多考虑答案的外部属性,如作者的权威程度、答案与问题相关程度等因素,没有有效利用答案的文本,研究较少涉及语义维度。因此,本文研究并提出一种面向问答社区的答案推荐方法。首先,为降低推荐方法计算量,提高效率,提出改进UserCF,获得目标用户的候选集。接着,提出一种改进LDA主题模型,用于对用户兴趣建模,该方法的改进针对原始LDA主题模型中存在无意义主题的情况,考虑无意义主题下各个词语之间相似度较低的特点,实现了对无意义主题的自动过滤,消除无意义主题对构建用户兴趣向量的影响。其次,提出一种在多维语义空间中表示用户兴趣向量和答案文本的方法,使用欧式距离衡量两者在语义上的相似度。再次,处理答案特征属性,提出一种答案分数计算方法,为答案推荐结果排序提供依据。然后,将上述成果应用于本文提出的答案推荐方法中,该方法考虑到了用户兴趣迁移、答案文本与用户兴趣向量在语义上的相似程度以及答案评分,使答案推荐结果更加符合用户的兴趣偏向。最后,使用来自于知乎的真实数据集,将本文提出的面向问答社区的答案推荐方法与基于LDA的推荐方法和基于Skip-gram的推荐方法进行对比实验,结果表明本文提出的面向问答社区的答案推荐方法可以为用户推荐满足其兴趣偏向的答案,取得了较好的效果。
其他文献
随着网络通信技术的进步,以太网技术也得以蓬勃发展,已经在局域网、城域网、广域网等方面获得了广泛应用。从上世纪80年代的10Mbps以太网技术到如今光纤以太网技术,在短短几十年时间,以太网技术的发展十分迅速,这都得益于以太网相关芯片设计技术和工艺水平的进步。为适应以太网技术快速发展,以太网物理层芯片新的种类不断涌现,在性能方面要求也越来越高。锁相环电路是以太网物理层芯片的重要组成部分,一个性能好的锁
房地产业是我国当前国民经济的基础产业和重要支柱产业,保持房地产业的健康发展对于维持宏观经济稳定具有重要意义。房地产业的快速发展既能够带动整个社会宏观经济的发展,也可能引发一系列民生问题。因此,对于房地产泡沫测度以及形成原因的研究将有助于房地产市场平稳健康发展。以往文献大多以全国或者特大型城市的房地产市场为研究对象,对于以省域宏观经济发展现状为背景的房地产市场研究较为匮乏,因此本文以安徽省房地产市场
学位
山水元素,是以自然形态出现的,是我国传统艺术元素之一,长久以来,山水元素在陶瓷装饰上大多以传统的表现形式出现,随着陶瓷创作理念的转变,陶瓷装饰创作不再局限于传统的形式和表现手法,本设计将山水元素运用现代装饰手法,与陶瓷设计相结合,给观者展现出一个山水悠然、怡然自得的意境。本课题主要分为五个部分,第一章引言部分,对选题的背景、目的及意义进行叙述;第二章资料收集与分析,对山水元素意境、用笔、设色及在陶
自然语言处理的目标,是让计算机能够在理解文本内在含义的基础上处理文本。机器阅读理解是指机器根据给出的文章内容,回答提出的问题,跟人类的阅读理解测试类似。近年来,随着深度学习的发展和人工智能的兴起,作为自然语言处理领域智能化的代表,机器阅读理解受到了工业界和国内外学者的广泛关注。中文机器阅读理解因为起步较晚,发展滞后于国外。CMRC 2018数据集的出现,填补了中文片段抽取型机器阅读理解数据集的空白
社会化媒体是一种新型的网络媒体,主要目的便是鼓励用户多与其他用户交流,增加人们之间的沟通和联系。随着众多社交网络的兴起,越来越多的民众被这些社会化网络以一种网络的
高校学生党建工作进社区是新时代下高校党建工作的积极探索和创新发展。随着高校后勤改革和高等教育体制改革,学生社区成为集学生学习、生活和学校教育、管理、服务于一体的特殊区域。新时代要求党的基层组织提高做思想政治工作能力,高校学生党建工作进社区是遵循党的建设规律、思想政治工作规律、学生成长规律,丰富高校党建工作内涵、促进大学生全面成长成才的有效途径。本文在对高校学生党建工作进社区内涵梳理的基础上,以浙江
近年来,上假肢行业蓬勃发展。究其原因主要是上假肢潜在消费群体的增加。一方面由于人口老龄化问题的加剧,老年群体对上假肢的需求量很大。另一方面,由于社会发展较快,工业事故、交通事故以及自然灾害的频发,残疾人群体的人数增长迅速,该群体中越来越多的人迫切需要上假肢的协助来完成日常生理活动。本文中主要是针对一种上假肢的控制机理和控制系统进行了研究。在控制机理上,首先,根据上假肢的机械结构特点,使用DH建模方
桥梁快速预制拼装技术具有现场作业时间短、施工效率高以及对周边环境影响小等优点,是当前桥梁施工的发展方向和研究热点。在桥梁预制拼装技术中,各预制构件之间的连接方式与可靠性能是关键问题。本课题组提出一种施工速度快、可靠性强的“预留灌浆孔连接”新方式,并通过拉拔试验获得了其抗拉性能和最小锚固长度,但其抗震性能尚未研究。本文采用拟静力试验和有限元分析对其抗震性能进行研究,为该连接方式的工程应用提供试验依据
学位
移动机器人在未知环境下的自主定位与导航技术是近年来的研究热门,本课题针对移动机器人采用视觉传感器完成定位和用于消除定位过程中累积误差的回环检测问题进行研究,并对机器人的点到点路径规划问题以及多机器人路径规划问题进行分析,具体内容如下:首先,针对移动机器人的视觉定位技术,采用基于特征法的视觉里程计设计方法,在该方法的特征提取与描述环节分别采用ORB、SURF、SIFT三种算法,对基于这三种算法的视觉
文本分类是自然语言处理领域中十分重要的研究任务之一,随着互联网技术的发展,文本分类在各种应用系统中扮演着至关重要的角色。而中文新闻文本的特点严重影响着分类任务的结果,其特点包括:文本句子由各种短语组成,对这些短语结构的特征提取有助于学习文本的特征表示,从而提高分类准确率;中文新闻文本篇幅较长、内容多,为了提高文本特征表示对原始文本蕴含意义的表达能力,要求分类模型能充分学习长文本的上下文依赖关系;文