【摘 要】
:
句子相似度计算在自然语言处理领域是一项基础而核心的研究课题,它的研究状况直接决定着其它一些相关领域的研究进展。例如:在自动问答、机器翻译、智能检索等领域,句子相似
论文部分内容阅读
句子相似度计算在自然语言处理领域是一项基础而核心的研究课题,它的研究状况直接决定着其它一些相关领域的研究进展。例如:在自动问答、机器翻译、智能检索等领域,句子相似度计算都是其中关键的技术。本文分别对义原、词语、句子三个层次的相似度计算进行了研究,其中重点研究了句子相似度计算。针对目前句子相似度计算方法的种种不足,提出了融合多元信息的句子相似度计算方法,并通过实验,验证了该方法的有效性,最后结合金融领域自动问答系统,给出句子相似度计算在常见问题库(FAQ)中的应用。本文主要工作有如下几个方面:1.研究了词语相似度及其计算方法,利用《知网》提供的丰富语义信息,计算义原相似度,在此基础上改进了基于《知网》的词语相似度计算方法。2.提出了融合多元信息的句子相似度计算方法。该方法从不同的角度综合考虑句子的关键词信息、语义信息、句法结构信息,并从中提取句子长度、相同关键词的个数、关键词顺序和关键词距离等多元信息,运用加权求和的融合手段,确定句子间的相似度。3.融合多元信息的句子相似度计算方法中需要解决多元信息之间的权重分配问题,本文采用遗传算法寻求最优权重组合,避免了通过经验确定权值的不可靠性和主观性。4.设计了一个金融领域自动问答系统(BAQS)模型,把句子相似度计算用于金融领域自动问答系统中常见问题库(FAQ)的问句匹配,并给出了句子相似度计算在FAO库中的应用过程。
其他文献
复杂网络上的流行病传播吸引了来自数学、物理和生物等领域的学者广泛关注。淬火平均场理论是分析流行病传播的重要方法之一。在本文中,我们研究淬火平均场理论的有效性以及在
随着汽车电子和智能控制技术的发展,智能车已经成为自动控制领域内的一个研究热点,路径跟踪是智能车控制领域的基础。本文以DM642为核心控制器对智能车的道路识别算法和转向控
在给系统设置脉冲时,我们并不能确保正好在固定时刻上施加脉冲,即我们原本打算在t时刻设置脉冲,却只能在一个很小的时间窗口(t-a,t+a)上讨论问题,其中a是一个很小的正数。在系统
隐马尔可夫模型是一个基于一些参数族{f(·|ε),ε∈Ψ}混合模型y1|{s1=k}~f(yt|εk), 其中混合随机过程{st}是有K个状态的Markov链,在Chopin(2007)关于连续有序的隐马尔可夫模
引言rn作为一名教师,我们的专业素养决定着我们的教学之路的宽广度,精彩度.专业素养包括备课、上课、观课、议课.备课上课非常重要,但观课议课对我们专业素养的提升同样有着
内点法是起源于线性规划的一类重要的优化方法,该算法通过一种变换使迭代点从可行域的内部向最优解逼近,内点法对约束优化问题的求解有比较显著的效果,现在已经被广泛应用于非线
由于遥感器成像系统的分辨率极限,以及大气干扰等方面的影响,往往难以直接获得分辨率高、模糊变形少的高质量遥感图像。超分辨率图像重建技术可以克服图像系统内在分辨率的限制,因而这一技术在视频、遥感、医学和军事等领域得到广泛应用。本文主要研究基于小波的遥感图像超分辨率重建方法,对已有的高分辨率图像进行小波分解后得到描述各个方向上细节信息的小波系数,然后利用这些小波系数对低分辨率图像进行重建,取得了明显的效
Sobolev方程在流体力学、热力学等许多数学物理方面都有着广泛的应用,例如:流体穿过裂缝岩石的渗透理论,土壤中的湿气迁移问题,不同介质间的热传导问题等等.本文共分两章: 第一
文本聚类在文本挖掘和知识发现中起着很重要的作用。这种理论和方法可以对文本进行有效的管理和组织,可以对信息检索的结果进行改善,提供导航/浏览机制,发现相似的文本等。因