文本相似度计算研究进展综述

来源 :北京信息科技大学学报:自然科学版 | 被引量 : 0次 | 上传用户：ddcrow

【摘要】

：

相似度计算是自然语言处理工作的基石。随着自然语言处理技术的发展,相似度计算的研究价值和应用价值突显。现有的计算方法因其复杂度和精确度的问题,与现实应用的需求并不匹

【作者】

：

王寒茹张仰森

【机构】

：

北京信息科技大学计算机学院

【出处】

：

北京信息科技大学学报:自然科学版

【发表日期】

：

2019年1期

【关键词】

：

距离公式相似度计算方法词语相似度句子相似度篇章相似度 distance formula similarity calculation method wo

【基金项目】

：

国家自然科学基金项目(61772081).

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

相似度计算是自然语言处理工作的基石。随着自然语言处理技术的发展,相似度计算的研究价值和应用价值突显。现有的计算方法因其复杂度和精确度的问题,与现实应用的需求并不匹配。针对现有需求,对于不同粒度的文本,研究出一套适合大规模实际应用的相似度计算方法体系迫在眉睫。从方法论的角度,对目前主流的相似度计算方法进行总结,介绍了不同粒度的文本相似度计算的差别以及近几年的研究进展,总结了目前相似度计算方向存在的问题,并对发展趋势进行了展望。

其他文献

风电机组齿轮箱早期故障弱特征信息提取方法

风电机组齿轮箱故障发展进程中早期劣化特征信息微弱,采用传统的奇异值分解（Singular Value Decomposition,SVD）降噪方法容易造成有用信息的丢失。针对这一问题提出基于μ-SVD

期刊

风电机组齿轮箱μ-SVD及局部均值分解方法弱特征信息提取早期故障预警wind turbine generator gearbox μ-SVD and

一种融合语义角色和依存句法的实体关系抽取算法

针对目前基于语义角色的实体及关系抽取技术效果不理想以及存在无法正确提取多个宾语的缺陷,提出一种基于语义角色和依存关系融合的方法:1)通过语义角色标注的方式抽取主语和

期刊

实体抽取知识图谱语义角色标注依存句法分析entity extractionknowledge graphsemantic roles labelin

基于VSG的阻尼和惯性在功率下垂控制中的应用

针对虚拟同步发电机控制算法在新能源并网中具有稳定系统运行的积极作用,提出了采用传统功率下垂控制算法取代虚拟同步发电机算法中的有功/频率调节和无功/电压调节部分,保留

期刊

功率下垂控制虚拟同步发电机逆变器power droop controlvirtual synchronous generatorinverter

湿式离合器摩擦片接触比对磨损性能的影响

在Archard模型的基础上构建了一种考虑摩擦副接触面积的磨损量计算模型。依据实验结果确定了磨损系数K的函数表达式,讨论了单一工况条件下不同接触比例摩擦片对离合器磨损量

期刊

接触面积湿式离合器磨损量磨损量计算模型contact areawet clutchwearwear calculating model

部分线性回归模型的主成分Liu估计

针对参数回归模型受很多函数假设限制和非参数回归模型受＂维数灾难＂影响问题,构造出半参数线性回归模型。结合半参数线性回归模型的主成分估计和Liu估计方法,提出了半参数线性

期刊

半参数线性回归主成分Liu估计约束条件semiparametric linear regressionprincipal component Liu e

文本相似度计算研究进展综述

其他学术论文