基于全文检索系统的文档关联研究与实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:mao_320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文的主要内容为:1.提出了一种基于全文检索的文档关联方法.该方法结合了中文分词、文档分析等多种技术的特点,将文档的内容和属性进行结合,建立了文档间的相互关联关系.2.将中文分词技术应用于全文检索和文档关联研究,尤其是使用了改进的复合词生成算法,提高了文档关联算法的准确率.3.详细介绍了一种为全文检索和文档关联技术开发的Com组件.该组件可以应用于全文检索系统的建立和文档关联技术的实现.可以帮助用户建立文档信息的全文索引和属性查询,并将相关的关联文档按照关联度排序提交给用户.该文的研究得到国家自然科学基金的资助.
其他文献
该文主要研究了基于内容的彩色图像特征提取及匹配技术.具体内容包括以下几个方面:1.提出了一种利用小波变换提取颜色特征的方法,该方法符合人的视觉特性,检索速度也得到提高
为了使对象能够更好地自动适应环境的变化,更好地处理和描述面向对象系统中对象与对象之间的关系,更好地组织和管理面向对象系统中的各种对象,并使程序设计更加符合客观世界的本
在野外的地震勘探作业中,勘探仪器采集的地震数据一般都存储在磁带介质上,然后把磁带需要运送到数据处理中心,进行分析和处理。作为数据交换、存储介质的磁带发挥着不可或缺
单亲遗传算法采用序号编码,取消了交叉算子,代之以隐含交叉算子功能的基因换位等遗传算子,简化了遗传操作,并且不要求初始群体具有多样性,但当群体进化到一定代数时,个体浓度
PVM(Parallel Virtual Machine)是由软件实现的基于消息传递模型的并行虚拟机.它支持异构的UNIX计算机用异构网络联接成一个"虚拟"的并行计算机,使它能像一台大型并行计算机
该文主要对序列模式挖掘算法进行深入的研究,通过对普通关联规则算法的研究和改进,得到基于关联规则算法的序列模式挖掘算法,从而可以挖掘序列模式形式的知识.该文主要的研究
该文提出了将组合问题归结为状态空间搜索问题的数学模型和通用算法.这一结果将传统的显式图搜索与隐式图搜索,求一个解的局部搜索与求全体解的遍历搜索,全部统一到同一个模
该论文以嵌入式系统的低能耗设计为研究方向,针对 ESW IP 重用中的能耗评估,首次提出并深入研究了面向对象能耗模型及其应用方法,进而提出了一种完整的嵌入式软件设计方法学,
软件工程在实践中是发展的,随着软件新技术的不断涌现、系统开发规模的不断扩大、复杂性增加,许多新的软件开发模式与开发方法出现并得到应用实践.在以往的工程实践中我们发
该文研究和分析了多种多级互连网(尤其是结构简单规范的Ω网)的现有成果,包括网络结构及相应的路由算法.并在此研究基础上,根据Ω网上的置换和多播的特点,提出了一种基于Ω网