【摘 要】
:
【目的/意义】文本相似度计算是自然语言处理中的一项基础性研究,通过总结和分析文本相似度计算的经典方法和当前最新的研究成果,完善对文本相似度计算方法的系统化研究,以便
【机 构】
:
中国工程物理研究院计算机应用研究所;
【基金项目】
:
国防基础科研计划重点项目(JCKY2016212B004)
论文部分内容阅读
【目的/意义】文本相似度计算是自然语言处理中的一项基础性研究,通过总结和分析文本相似度计算的经典方法和当前最新的研究成果,完善对文本相似度计算方法的系统化研究,以便于快速学习和掌握文本相似度计算方法。【方法/内容】对过去20年的文本相似度计算领域的经典文献进行整理,分析不同计算方法的基本思想、优缺点,总结每种计算方法的侧重点和不同方向上最新的研究进展。【结果/结论】从表面文本相似度计算方法和语义相似度计算方法两方面进行阐述,形成较为全面的分类体系,其中语义相似度计算方法中的基于语料库的方法是该领域最为主要的研究方向。
其他文献
美化、亮化高速公路已成为当今建设高速公路不可缺少的一项内容 ,本文论述了沈丹高速公路绿化模式、特点 ,以及通过绿化达到的景观效果
目的探讨循证护理对脑血管病患者的临床应用价值。方法选取该院2011年10月—2012年10月收治的脑血管病患者84例作为研究对象,将全部患者平均分为两组,分别是对照组与观察组,
本文从叙事策略与角色安排、情节设置等方面分析日本影片《入殓师》,通过解读导演在片中设置的意象所承载的叙事表意功能,深刻理解影片所要传达的意义,进一步探寻该片荣获奥
北京是一个现代和传统结合的大城市。随着“人文奥运”口号的提出 ,北京的城市建设任重而道远。当代大学生是北京未来的建设者 ,必将担负起这个重任。了解当代大学生在北京城
文章介绍了慢性胃炎的典型症状、发病原因、分类及对慢性胃炎的治疗及预防。
文章是作者多民族国家建构视野下游牧与农耕族群互动研究的系列论文之一。在概要阐述核心族群的凝聚于蒙古汗国的出现、以蒙古为核心的行国体制的建构及其转变基础上,认为元
为了解贵阳市耕地资源的可持续利用状况,利用贵阳市相关统计资料,采用层次分析法,对其可持续利用状况进行分析与评价。结果表明:贵阳市耕地资源达一般可持续水平,耕地的生产
本文致力于我国智库能力评价研究,通过厘清智库、智库能力等基本概念,界定智库研究基本规范,拓展智库评价研究基本思路,将仍处于探索时期的我国智库研究引向系统化、深层化,
以新三板挂牌公司作为研究样本,研究私募股权基金在现金持有到研发投入再到企业绩效这条传导路径中的作用,结果表明,私募股权基金能帮企业做出更合理的现金持有决策;在一定的
本文从城市现代化和城乡一体化两个层面构建了城市化质量的指标体系。城市现代化包括城市经济现代化、基础设施现代化和人的现代化三个方面,城乡一体化则用城乡居民收入水平