基于词嵌入模型的内容关联方法设计与应用

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:darkcome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中,文本内容之间的关联十分常见。它既可以是论文文献系统中,篇章之间的引用;也可以是在线论坛里,读者评论与原始文章的对应。这些关联为用户提供了一个很好的联系通道,并且增加了人们对文本内容理解的客观性与全面性。还可以为接下来的工作比如信息检索、摘要和内容管理提供有力的帮助。然而,日益增长的语料数据规模决定了这项任务无法仅仅依靠于人工。因此,探索一种自动化的内容关联任务实现方法存在必要性。目前为止,内容关联的大部分实现方法都是基于传统语法或语义特征的相似度计算,产生的主要问题来自于文本及单词的表面浅层特征的缺陷。而近些年来,词嵌入模型在自然语言处理任务中特别在挖掘深层语义方面呈现出优异的表现。在本论文中,我们提出一种引入词嵌入模型作为特征的内容关联方法。先对模型结构原理进行深入学习,然后详细评估了不同参数下的训练出的词向量结果,最后对英文生物领域论文文献和中英文在线论坛(天涯杂谈、英国卫报)数据三种语料进行了实验,并与传统方法进行比较,证实了我们提出方法的有效性。
其他文献
宏蜂窝网络与small cell网络组成了异构无线网络。资源管理技术是目前解决异构无线网络面临问题的主要技术。然而由于small cell具有覆盖范围小以及数目众多等特性,因此常用
随着移动互联网时代的到来以及飞速发展,语音视频、手机游戏、高清直播等业务在丰富人们的生活,提供便利的同时,也对信息的获取和传输的速度和质量提出了越来越多的要求,是下
随着移动互联网技术的蓬勃发展,无论是传统企业还是互联网公司都将战略重心转移到了移动互联网平台上。越来越多的基于手持移动设备的移动应用也已经渗透到了我们工作和生活
物联网被视为继计算机、互联网和移动通信网络之后的第三次信息产业浪潮,因其广阔的行业应用前景而受到了各国政府的重视。学术界通常将物联网系统划分为三个层次——感知层
在通信技术发展快速的今天,人们已经步入了移动互联网时代,各种各样新兴的网络服务正在逐渐进入人们的视野,在这些服务逐渐改变了人们生活习惯,为人们生活带来巨大的便利的同
随着智能移动终端在全球范围内的普及,无线通信技术高速发展,数据编码技术、流媒体技术不断的更新换代,移动视频实时传输应用已成为视频传输领域的主流趋势,引起了军事、商业
近年来,移动智能终端的发展使移动通信数据业务量剧增。大规模多输入多输出(Multiple Input Multiple Output,MIMO)技术能够进一步挖掘移动通信空间资源的复用效率,因此成为
无线光通信是一种以激光为信息载体,以自由大气为传播媒质的通讯技术,又叫做自由空间光通信(Free space optical,FSO)。FSO因其体积小、功耗低、频谱资源丰富、抗电磁干扰能
弹性光网络(EON)因为具有频谱资源分配灵活和资源利用率高等优点,渐渐代替了传统波分复用(WDM)光网络走入人们的视野。对于EON,一方面流量疏导对于网络资源的优化起到至关重
下变频是各类通信系统信号接收部分不可或缺的技术之一,以保证系统中后续设备顺利工作。微波光子学技术有高带宽、低损耗及抗干扰等优点,而非均匀带通采样变频链路结构简单、