基于N-gram的句子相似度计算技术

被引量 : 0次 | 上传用户:ruyudeishui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于大规模双语语料库的机器翻译研究中,如何找到最有效的翻译参考一直以来都是人们的关注焦点, 其核心技术就是参考例句的相似度计算。本文提出了一种基于 HowNet 词语相似度的 N-gram 相似度计算方法,在此基础之上,参考机器翻译自动评测中 BLEU 的评价公式,进一步提出了一种新的句子相似度计算方法。该方法结合了 N-gram 和语义相似度计算,可以有效应用到基于实例的机器翻译、辅助机器翻译和交互式机器翻译中。
其他文献
目的通过对老年下肢骨折患者的护理措施的讨论和分析,探讨老年骨科患者的护理的新的理念和完善护理措施。方法应用病例回顾分析的方法,对120例老年下肢骨折患者护理方法和效
第一部分:进展期食管癌19项预后指标的多因素分析目的:评估术后临床病理参数、术前血清炎性指标及肿瘤标志物共计19项指标与我院进展期食管癌患者生存预后的关系,探索Ⅲ~Ⅳ期
钢波纹管涵是一种典型的柔性结构,结构本身具有较高承载能力和良好的变形适应能力,可有效地解决涵洞结构因地基基础不均匀变形导致的破坏问题。目前,国内尚没有设计规范来指导钢波纹管涵结构设计、施工,限制钢波纹管涵在国内公路工程中的推广应用。基于钢波纹管涵在我国使用现状,通过理论分析和数值仿真模拟,系统研究了钢波纹管涵在不同填土高度、管径大小、壁厚、回填材料性质及施工方案等对其工作特性的影响机制,提出了详细
目的探讨电子束熔融制备多孔钛合金融合器的表征、微观结构、体外力学性能、生物相容性,并建立羊颈椎椎间融合动物模型,与聚醚醚酮(PEEK)融合器进行对比观察。方法通过计算机
会议
WRC-15通过了238号决议,设立WRC-19 1.13议题,面向2020年及以后的未来国际移动通信系统发展,开展频率相关研究,在24.25~86 GHz频段范围内为IMT寻求新的频率划分。而为了保证候选频段内5G与该频段现有业务之间互不产生有害干扰,需要开展两业务之间的共存研究。主要针对25.5~27 GHz及37.5~42.5 GHz范围内5G与EESS、SRS、FSS等卫星业务地球站之间的
碳纤维增强铝基复合材料的主要磨损行为是塑性变形,而复合材料的磨损机制主要是粘着磨损和氧化磨损,并随着复合材料的成分不同,磨损的主要机制所占的比例也随之变化。