基于区间直觉模糊集的语义相似度研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:xtopg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义相似度是中文信息处理的关键技术,在自动分类、自动聚类、机器翻译、信息检索、信息过滤等领域有着广泛的应用。传统的语义相似度算法难以表达丰富的语义信息,计算结果与人的主观认识有一定的差距。区间直觉模糊集具有强大描述模糊信息的能力,它采用区间直觉模糊数揭示语义模糊信息。因此,基于区间直觉模糊集的语义相似度研究能够更好的表征语义,挖掘语义信息,提高语义相似度计算的准确性,突破传统语义相似度在语义表达上的瓶颈。本文首先介绍了语义相似度研究的国内外现状,提出了目前语义相似度的主要缺点是没有充分体现语义信息。文章引入了区间直觉模糊集表示语义信息,并详细阐述了如何使用区间直觉模糊集表示层次信息、深度、密度、语义传递信息等。在此基础上,本文构建了模糊矩阵,把语义相似度的问题转化为模糊矩阵的问题。结合《知网》中的“词语由义原整合”的思想,实现了基于区间直觉模糊的词语相似度计算。最后,采用30对词语对算法进行了测试,证明了算法的有效性。本文的主要研究内容为:(1)分析了语义相似度研究的必要性,并对国外研究现状进行了文献调研和分析。(2)分析并归类了目前的主要的语义相似度算法,并提出了目前语义相似度算法的不足之处。(3)介绍了区间直觉模糊集与区间直觉模糊数、区间直觉模糊关系、语义传递包的计算以及《知网》等基础知识,为基于区间直觉模糊集的语义相似度计算奠定了基础。(4)提出了基于区间直觉模糊集的语义相似度算法思想。综合考虑了层次结构、深度、密度对语义关系权值的影响,建立模糊矩阵,表征层次结构中的语义关系。结合《知网》中的单位——义原,把词语表示为义原,计算并整合词语表示式中所有的义原相似度得到词语的整体相似度。(5)对算法进行验证和分析。与刘群的测试数据和主观经验对比,以此验证本文中提出算法的合理性和有效性。本文对基于区间直觉模糊集的语义相似度研究展开了研究和讨论,提出了语义相似度算法并进行了有效性验证。继续完善语义相似度的各环节,并把本算法推广应用到句子相似度、文档相似度中去,是我们今后工作的目标。
其他文献
故事是孩子最易触摸,最易理解,最愿探究的区域,故事最能诠释孩子的天性——童心.从学生、班级、学校三个层面开展故事特色活动,用孩子的视角去影响孩子,让孩子成为孩子.通过
随着近年来产业升级和技术革新,交通运输业正向着多元化、信息化、智能化、国际化方向发展,未来对高校培养的交通运输类人才有了新的要求.新工科作为新时期我国工程教育改革
数据挖掘是随着信息技术不断发展而形成的一门新兴的交叉学科,是信息处理和数据库技术领域的前沿研究课题。聚类分析是数据挖掘的一个非常重要的研究分支。聚类是一种无监督
期刊
为了使学习者在计算材料学中对材料结构特性有一个清晰的物理图像,开展现代教育技术辅助计算材料学的教学和研究,利用量子输运程序Nanodcal可以对相关材料进行模型构建和计算
由于知识产权在全球市场竞争中的作用越来越大,世界各国越来越重视将其作为实现开拓和占领国际市场并获得竞争优势的战略武器,基本上形成了以专利战略为龙头,辅之以商业秘密战略、商标战略、版权战略等一体化知识产权战略的进攻模式。我国知识产权工作起步晚,知识产权在经济和社会发展中的作用远未体现,学习借鉴发达国家的成功经验对我国建设创新型国家显得尤为重要。多年来,日本、美国专利申请件数一直保持世界前二的优势位置
随着社会发展和知识经济时代到来,供应链企业之间的竞争也日趋激烈,竞争的方式逐渐向企业知识管理的方向转移,知识管理是企业在竞争中的优势资源,也正在逐渐显现其价值。本文把基于供应链的企业知识管理作为研究对象,举例分析知识管理在国内外企业中的应用,并根据其存在的问题构建了链式知识管理体系,并提出相应的建议。本文分析了国内外供应链中的企业知识管理的研究现状,其次把相关的概念和理论作为基础支撑。然后针对基于
学位