【摘 要】
:
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统
【机 构】
:
南京大学中美文化研究中心图书馆 南京 210093
论文部分内容阅读
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。
Designing a Web site full text search system based on open source search tool Lucene, detailing the design idea and architecture of the system, and giving specific codes and implementation steps for key technologies such as Chinese and English word segmentation and adding document index; Finally, Perform simple performance tests and compare search results with general search engines for recall and accuracy.
其他文献
针对传统矢量空间模型文本特征值的计算,给出将文本的评价由基于语法的词条空间转化为概念空间的方法和策略:基于领域本体,依据本体概念间的各种关联,先以一定的映射规则,将
运用实证分析、文献和调查等方法,对西北地区实施全民健身计划的对策进行研究.结果显示,西北地区经济、社会发展较为滞后,人口健康状况不容乐观.要实现可持续发展,必须将提高
针对《中图法》的类目设置缺乏简练性,主要是不能被使用的休置类目太多;一些类目的设置照搬学科分类,造成类目划分太细,有类无书;多重列类过多过细罗列,大量类目虚设,脱离图
随着新媒体技术的快速发展,微课作为一种新型的教学形式,其在现今的初中英语教学中使用越来越普遍,绝大多数英语教师都运用微课来辅助英语课堂的教学,但如何更好地将微课与初
随着市场经济的蓬勃发展,中国企业的发展已进入了一个新阶段,促使企业的规模越来越大,分支机构众多、组织机构复杂,建立全面预算管理是最佳选择,是企业强化经营管理,增强竞争
农业培训的兴起、农业论坛的出现、农业品牌的提升、电商运营的迅速扩展……一时间,这些都成为新时代农业的代名词。 新时代,一切都有了全新定义。农业人有了新思维,通过新渠道,打开新思路,发展新农业。“新”代表希望和未来,具有强大的生命力和远大的前途。然而,“新”的萌芽阶段总是不完善的、弱小的, “新”的道路是艰难的、曲折的。 个人的力量比不过一个团队,中国农业急需一个专属于自己的联盟,它代表着农业人
语文教学必须树立大教学观,要立足于文本积极开展拓展阅读,在增加学生知识的同时,提升学生的综合感悟能力以及创新思维能力.阅读拓展可以向多学科拓展、课前拓展、课内深化拓
在社会急剧转型时期,诚信缺失严重危害着社会主义市场经济的健康发展,蚕食着政府在公众中的形象,损害着人际关系的和谐.中国作为一个不断壮大的世界经济体国家,在复杂多变的
介绍本体学习的概念和发展,分析现有的本体学习的体系结构,研究中文本体学习这一领域存在的主要问题,包括中文语料特有的分词、词性和行文灵活问题等,基于中文本体获取中存在