通用格式的Lucene文档解析器框架的构建

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:hzj123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Lucene是一款优秀的开源全文本搜索技术框架。首先介绍高性能的全文检索工具Lucene,详细分析Lucene的系统结构、程序运行逻辑和各个模块功能,以及在Lucene上的扩展;然后针对Lucene在不同类型文档解析方面的不足,提出一种通用的文档解析器框架,并给出具体的应用实例。
其他文献
介绍信息交换平台的体系结构设计和基于。NET环境的原型开发等技术。就如何设计和实现一个基于.NET架构的信息交换平台进行了深入研究和分析,从系统结构、主要组件、数据交换过
在J2ME平台下,利用J2ME的JSR179定位开发包作为开发定位程序的API,用Google API获取地图,以即时获取路线规划中所有拐点的信息,设计出GPS电子地图。该电子地图具有实时定位、兴趣点添加、删除、查询、锁定、路线规划以及离线地图定位等功能。实践证明该软件能在中低端手机中流畅运行,是一款通用的电子导航地图软件。
工作流管理系统最主要的功能是要能够对业务流程的变化做出有效的反应。然而,当前的工作流管理系统并不能灵活应对业务流程的频繁变化,因为它们对所建的工作流模型几乎没有任
中尺度气象站网覆盖面积广,探测数据时空分辨率高,可服务于工农业生产和灾害监测预警。针对观测网发报终端数量大,报文频次密集且长期连续发报,传输实时性、可靠性要求严格的
根据S-P表的主要性质和S线、P线绘制特点,通过自定义PowerBuilder数据窗口Line对象Visible属性表达式函数,实现S-P表评价分析数据的整理、编排以及S线、P线自动绘制功能。
标签技术如何与个人信息管理模型有机结合是个人信息空间管理系统中数据管理与共享的前提,针对传统个人信息管理中存在信息搜索效率低、无法共享的问题,提出基于标签埘组织本地
针对计算机网络课程教学抽象难懂,实验条件要求高及设备昂贵的特点,在实际授课过程中,提出应用网络模拟与仿真的方法来辅助教学,在网络仿真器NS2的基础上,应用可以自动生成有线及
为消除多企业权限管理不当造成的混乱,在对基于角色的访问控制模型分析的基础上,结合新圩镇工艺专业镇创新平台的建设需要,引进企业角色的概念,提出一种基于企业角色的访问控
标准洪泛机制在内容搜索方面有很高的效率,但同时产生了大量的冗余消息,严重制约网络的可扩展性。针对标准洪泛算法中高跳时冗余消息数量迅速增加而覆盖范围增长缓慢的问题,
采用.NET技术开发一个基于B/S模式的信息交互系统,实现B/S模式下数据的管理和企业间信息的及时传递。本文重点介绍本系统的框架设计和系统业务逻辑组件等关键技术。