基于HowNet树层次模型的语义相似度计算方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:ll05
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展和网络资源的日益丰富,从海量文本信息中准确返回用户所需内容的需求越发强烈,人们对计算机处理文本信息的能力要求越来越高。作为文本信息处理和自然语言处理的基础研究内容,语义相似度广泛应用于自动问答系统、基于实例的机器翻译、多文档文摘、信息检索等领域。语义相似度的计算结果直接影响文本信息处理的效果,因此提高语义相似度计算的准确性十分必要。词语是构成句子最基本的语义和语法单位。词语相似度的计算是语义相似度最基本的研究内容,提高词语相似度计算效果能够更好的服务于上层应用研究。本文分析比较主流的词语相似度计算方法,对基于How Net的词语相似度展开研究。在How Net的基本结构和树层次模型的基础上,提出一种改进的基于节点概率密度比的词语相似度计算方法。将改进算法进行实验仿真并与最新算法比较,验证本文提出的算法更接近人工评估的结果。句子是表达一个完整语义的基本结构。句子相似度的计算涉及词法、词义、句法、上下文环境等内容,是一个具有挑战性的问题。针对单一特征的句子相似度计算方法在刻画句子相似度上存在片面性的问题,本文对基于How Net多特征的计算方法开展研究。在How Net丰富的语义和独特的知识表达结构的基础上,综合词形特征、词义特征和句法特征,提出一种改进的基于词语权重的多特征句子相似度计算方法。将改进算法进行实验仿真并与原先算法比较,实验结果表明本文提出的算法效果有所提高。
其他文献
提出了一种以互联网为结构基础的远程控制监视系统,使工作人员能够在互联网的任何一个节点上对转台进行远程控制监视,完成调试与诊断任务.这套系统利用控制逻辑与控制表示逻
目的:了解掌握剑河县饮食业餐饮具消毒卫生状况。方法;采用专用大肠菌群快速纸片进行检测。结果:10年餐饮具消毒卫生抽栓结果总合格率为48.2%,1996年餐饮具检测合格率为40.8%,街头饮食
近年来,我国“工业4.0”概念建设发展迅速,全面提升制造业企业的信息化水平已经成为实现这一战略目标的首要任务。而现阶段我国大部离散型电子产品生产企业生产产品种类繁多,
叶绿素(Chlorophyll,Chl)是光合生物中含量最多也是最主要的一类光合色素,它不仅是光合器官许多色素蛋白复合物的主要组成,而且还参与了光合作用的许多生理生化活动。因此,叶绿素
目的:观察急性白血病细胞中VEGF及P53的表达,并分析其在治疗和预后中的作用.方法:采用免疫组化(SABC)法检测VEGF及P53在急性白血病细胞中的表达.结果:VEGF及P53在急性白血病
随着中国加入世贸组织日期的临近,商业银行为了迎接与外资银行的竞争,应采取相应内容的自身再造,重塑新的企业形象,寻求新的利润增长点,实现总体效益的实现.
在我国农业领域,如何顺应知识经济浪潮,发展知识型农业经济,提高土地产出率,并保持农业可持续发展,这时摆在我们面前的新课题,也是知识经济范畴的软科学。因此,要发展知识型农业经济