【摘 要】
:
文本匹配是自然语言处理领域的关键问题。很多自然语言处理任务,如信息检索、机器翻译和对话系统等,都可以在不同程度上归结为文本匹配问题。所以文本匹配模型的进步,对自然
论文部分内容阅读
文本匹配是自然语言处理领域的关键问题。很多自然语言处理任务,如信息检索、机器翻译和对话系统等,都可以在不同程度上归结为文本匹配问题。所以文本匹配模型的进步,对自然语言处理领域诸多问题的解决都有显著的促进作用。传统的文本匹配模型,以人工定义的特征为基础,所以对特征的设计有显著的依赖。而且得到广泛应用的特征,大都进行精确匹配,同时忽略词之间的语义关系。这就降低了模型对文本的理解能力,同时限制了文本匹配的表现。随着深度学习的快速发展,大量深度文本匹配模型被提出。这些模型多以词嵌入技术为基础,尝试从文本中提取更丰富的层次化的结构特征,以帮助模型理解文本,提升文本匹配的准确度。准确的文本匹配以文本语义匹配为基础,而文本语义是词语义与词间关系的有机整体,所以综合考虑词语义和词间依存关系,对于准确的文本匹配有重要意义。目前的文本匹配模型,基于精确匹配的传统模型和基于神经网络的深度文本匹配模型,对词语义和词间依存关系的利用尚不够充分,限制了这些模型的表现。为了更充分地利用词语义和依存关系,本文首先综合词嵌入和词间依存关系,为文本构建融合词语义和依存关系的语义表示。通过余弦均值卷积,描述两段文本各处的语义匹配程度;通过K-Max池化,过滤噪声并对数据维度加以统一,得到匹配程度矩阵以描述两段文本各处的匹配程度。最后通过长短程记忆网络有监督地学习匹配程度矩阵与语义匹配程度之间的映射关系。实验结果表明,构建融合词语义和词间依存关系的语义表示,将其应用到文本匹配的过程中,显著提高了文本语义匹配的准确度。
其他文献
随着深度神经网络近来的使用,单张图片的深度估计已经逐渐取得了显著的进展。在普遍的单目深度估计问题中,为了应对庞大的数据,深度回归网络是一种典型的方法。然而,这样单纯
随着电子元器件逐渐向集成化和小型化的方向发展,高功耗问题日益严重,传统的基于电子电荷属性的器件已经不能满足发展的要求,摩尔定律也不再适用,从而利用电子的自旋属性实现
空气管路系统广泛应用于工业、航空航天、军事等领域之中,是中央空调、大型输气管道、通风管路系统等的重要组成部分。受外界因素的干扰,管路中不可避免的会传递噪声,噪声的
自三峡水库2003年开始蓄水后,人为调度运行的干预使得原有河道的水文特性发生了极大的改变,各级支流回水区流速减缓,水体滞留时间的增长,导致物质的传输速率减缓,营养盐大量
随着城市高速发展,我国经济与城市建设也得以高速发展,城市规模扩展迅速,城市人口急剧增加,各城市有限的土地已经无法满足城市建设发展要求,致使我国许多城市出现交通拥堵、
为了明晰有机物覆盖对不同根序细根形态和化学计量学特征的影响,本文以南京市玄武区苜蓿园旁的16年生女贞人工林为研究对象,布设了3种强度的有机物覆盖处理(覆盖半径为80 cm,
四氮唑及其衍生物在农药化学、结合化学、药物化学中占有很重要的地位。近些年来,一些含有四氮唑的化合物被发现具有各种各样的生物学活性。比如:具有抗高血压、抗炎等。因此
非点源污染是当前水污染的主要原因。在降雨径流的驱动下,空间各单元上被侵蚀的土壤及其携带的氮、磷等污染物将产生输移进入受纳水体,形成吸附态非点源污染负荷。吸附态非点
目的:本研究通过检测亮氨酸拉链肿瘤抑制因子2(LZTS2)和细胞周期素D1(Cyclind1)在上皮性卵巢癌、交界性卵巢肿瘤、卵巢良性肿瘤和正常卵巢组织中的表达水平,来探讨LZTS2及Cyc
癌症已成为危害人类健康的重要疾病之一,据统计中国每年新发恶性肿瘤病例约300多万例,死亡病例200多万例。为了开发新的抗肿瘤药物,2009年,Gupta等通过高通量筛选发现盐霉素