论文部分内容阅读
基于目前大多数检索系统检索效率并是很高,以及对语义检索系统并没有进行充分研究的现状,本文提出一种全新的语义检索模型,其中的核心是语义相关度排名算法,它利用文本的主题词集合来代表文本的语境,用词与集合中所有主题词在语义上相关的整体聚合程度或收敛程度代表词与此文本语境的语义相关度,由于文本语义由主题词集合表示,通过集合之间的所有主题词的这种语义相关度的汇总结果来进一步求得文本之间的语义相关度。借助语义树这一词汇语义结构设计了一个新的语义计算数学模型实现了对这些语义相关度权值的计算。由于查询信息和文档内容都是文本表示形式,利用这一语义计算数学模型最终求得文档与查询信息的语义相关度权值,根据此权值排名各语义相关文档,此即为用户的查询结果。 根据这一语义计算排名算法模型,建造一个英文信息检索实验原型系统。在具体实现它时,借用了WordNet这一现有的词汇语义词典系统来构建语义树,并且对系统的整体框架和数据结构以及内部结构进行了特别的设计,以使最终的实现系统的实际运行效率达到最佳,由此用户在查询信息时能够获得好的查询体验。 针对实现系统,做了大量深入和细致的实验,通过这些实验结果及其分析可以验证此语义计算排名算法的合理性和正确性,同时它较好的实际检索效果使它具备一定的实际应用价值,具有广阔的实际应用前景。 通过分析可以发现此系统还存在一些缺点和不足,针对这些不足之处,提出了一些以后的工作,希望通过以后工作的改进和提高,使此系统得到进一步的完善。