基于词汇语义树的语义检索排名算法

来源 :云南师范大学 | 被引量 : 0次 | 上传用户:ptf_phoenix
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于目前大多数检索系统检索效率并是很高,以及对语义检索系统并没有进行充分研究的现状,本文提出一种全新的语义检索模型,其中的核心是语义相关度排名算法,它利用文本的主题词集合来代表文本的语境,用词与集合中所有主题词在语义上相关的整体聚合程度或收敛程度代表词与此文本语境的语义相关度,由于文本语义由主题词集合表示,通过集合之间的所有主题词的这种语义相关度的汇总结果来进一步求得文本之间的语义相关度。借助语义树这一词汇语义结构设计了一个新的语义计算数学模型实现了对这些语义相关度权值的计算。由于查询信息和文档内容都是文本表示形式,利用这一语义计算数学模型最终求得文档与查询信息的语义相关度权值,根据此权值排名各语义相关文档,此即为用户的查询结果。 根据这一语义计算排名算法模型,建造一个英文信息检索实验原型系统。在具体实现它时,借用了WordNet这一现有的词汇语义词典系统来构建语义树,并且对系统的整体框架和数据结构以及内部结构进行了特别的设计,以使最终的实现系统的实际运行效率达到最佳,由此用户在查询信息时能够获得好的查询体验。 针对实现系统,做了大量深入和细致的实验,通过这些实验结果及其分析可以验证此语义计算排名算法的合理性和正确性,同时它较好的实际检索效果使它具备一定的实际应用价值,具有广阔的实际应用前景。 通过分析可以发现此系统还存在一些缺点和不足,针对这些不足之处,提出了一些以后的工作,希望通过以后工作的改进和提高,使此系统得到进一步的完善。
其他文献
P2P(Peer to Peer)作为年轻而又古老的技术,在资源共享和协同协作方面有着崭新的应用,目前已经成为Internet一个新的发展起点。但是该技术在计算机网络安全尤其是在信任管理和
随着PTN技术在新一代骨干网络中的应用推广,对PTN网络的运行维护提出了更高的要求。PTN技术是面向连接的分组传送技术,而面向连接的特点意味着能够提供电信运营级的服务,要求有
面对快速发展的计算机通信技术和瞬息万变的市场需求现代IT企业希望开发的软件具有高伸缩性和灵活性可以根据市场的变化快速调整扩充现有软件功能适应市场需求以即时响应竞争
本体作为解决网络资源语义异构问题的重要途径,其构建方法没有统一规范和标准,人们在开发新本体同时,也带来了本体异构的问题。本体映射便是解决本体异构问题的手段之一,其关键过
随着社会信息化的发展,DVD类产品成为新一代数字视听技术和数字化信息存储设备的典型代表和潮流。DVD已经成为音像制品的一种标准,而且DVD机还要兼容VCD、CD等光盘,因此DVD播放
VoIP是一种通过Internet传送语音信号的技术,现有ITU-T提出的H.323以及IETF的会话初始化协议(SIP)两种标准。H.323是ITU推出的为在分组网上提供多媒体业务的协议族。它是一种
随着计算机网络和通讯技术的不断进步,新的理论、标准和技术层出不穷,无线通信从3G网络到无线网络的接入,再到无线局域网IEEE802.1lx,网络变得无处不在,它和我们的日常生活也越来
将人工智能的理论和方法用于故障诊断,发展智能化的诊断方法,是故障诊断的一条全新的途径。随着人工智能学科的不断发展,许多新思想、新理论、新技术将不断涌现,如何将这些新理论
数据库管理系统的配置参数中缓冲区的调优是性能调优最关键的因素。为了缓解缓冲区争用问题,将缓冲区分为数个独立的缓冲池,为不同性质的数据库对象分别建立独立的缓冲池,也
计算机技术、多媒体技术以及INTERNET技术的飞速发展产生大量的图像信息,因此如何有效、快速地从大规模的图像数据库中检索出需要的图像是一个目前急需解决的问题。基于内容的