基于单汉字索引的全文检索系统的优化研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wxcplayer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于按照单汉字建立倒排索引的全文检索系统,最需要解决的问题是如何提高其存储效率和运算速度.本文针对此问题提出了以下优化方法:一是利用参数化的Golomb编码对倒排文件进行压缩;二是对求集合交集的逻辑乘算法进行改进;三是运用并行计算和双缓冲技术.实验结果表明,经过优化后的单汉字全文检索系统已达到实用化的程度.
其他文献
本文描述了一种基于实例比较,辅以语义模式匹配的英文选词模型的设计.首先,我们讨论了汉英翻译系统英文生成中选词的重要性,然后比较了几种可能的选词策略并提出我们的选词模