【摘 要】
:
相似度计算是自然语言处理工作的基石。随着自然语言处理技术的发展,相似度计算的研究价值和应用价值突显。现有的计算方法因其复杂度和精确度的问题,与现实应用的需求并不匹
【基金项目】
:
国家自然科学基金项目(61772081).
论文部分内容阅读
相似度计算是自然语言处理工作的基石。随着自然语言处理技术的发展,相似度计算的研究价值和应用价值突显。现有的计算方法因其复杂度和精确度的问题,与现实应用的需求并不匹配。针对现有需求,对于不同粒度的文本,研究出一套适合大规模实际应用的相似度计算方法体系迫在眉睫。从方法论的角度,对目前主流的相似度计算方法进行总结,介绍了不同粒度的文本相似度计算的差别以及近几年的研究进展,总结了目前相似度计算方向存在的问题,并对发展趋势进行了展望。
其他文献
风电机组齿轮箱故障发展进程中早期劣化特征信息微弱,采用传统的奇异值分解(Singular Value Decomposition,SVD)降噪方法容易造成有用信息的丢失。针对这一问题提出基于μ-SVD
针对目前基于语义角色的实体及关系抽取技术效果不理想以及存在无法正确提取多个宾语的缺陷,提出一种基于语义角色和依存关系融合的方法:1)通过语义角色标注的方式抽取主语和
针对虚拟同步发电机控制算法在新能源并网中具有稳定系统运行的积极作用,提出了采用传统功率下垂控制算法取代虚拟同步发电机算法中的有功/频率调节和无功/电压调节部分,保留
在Archard模型的基础上构建了一种考虑摩擦副接触面积的磨损量计算模型。依据实验结果确定了磨损系数K的函数表达式,讨论了单一工况条件下不同接触比例摩擦片对离合器磨损量
针对参数回归模型受很多函数假设限制和非参数回归模型受"维数灾难"影响问题,构造出半参数线性回归模型。结合半参数线性回归模型的主成分估计和Liu估计方法,提出了半参数线性