论文部分内容阅读
能够快速有效地检索网络上或站内大量的各种信息资源,是提供高质量检索服务的基础。CLucene是Lucene的c++版本的实现,它是一个优秀的开源全文本搜索技术框架。分析了CLucene的系统结构,详解了CLucene中的索引和检索机制,在CLucene的基础上,解决了对WORD文档的文本抽取问题,增加了CLucene的中文支持功能,实现了一个基于CLucene并支持中英文WORD文档检索的应用实例。