LUCENE搜索算法剖析及优化研究

来源 :图书馆杂志 | 被引量 : 0次 | 上传用户:colawind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了开源搜索引擎Lucene的索引与搜索过程,剖析了Lucene的基于向量空间模型的文档相关度模型和基于TF-IDF的权重计分算法,在分析其文档相关度分值计算公式的基础上,指出了可通过修正评分机制和优化向量空间模型的算法来改进Lucene的搜索功能和性能的途径。并提出了一种基于离散随机最优化的快速搜索算法,以期提升Lucene在大文档集实时搜索时的性能。
其他文献
本文结合中国国家知识产权局(SIPO)各版《审查指南》中的相应规定,分别从专利申请的“充分公开”、SIPO的“充分公开”判定标准和对于SIPO“充分公开”判定标准的分析三个方面
中国和印度都是高等教育大国,在办学体制、投资体制和管理体制上各有特点,又有相似的地方。通过比较,可以相互借鉴。
Markowitz均值-方差模型是经典的金融投资组合优化模型,旨在寻找具有较高收益和较低风险的最优资产配置比例。本文引入二次规划算法和遗传算法,并应用二次规划算法、遗传算法
对于科学技术与道德的关系,历史上形成了不同的观点和派别,大体上可归结为乐观主义和悲观主义两派。在现代社会中,二者的关系日益密切,它们互相影响、互相作用。科学技术会促
对英国 6所学校 11岁到 15岁的 10 87名中学生的科学创造力进行了研究 ,结果表明 :英国青少年科学创造力及其各成分的发展存在着显著的年龄差异 ,随着年龄的增大 ,科学创造力
《诗经·豳风·七月》的创作年代问题是一个颇有争议而至今尚无定论的问题。这与对它的研究采用的方法有关,而这些方法依据的材料有些是不可靠的,有些是不充分的。依据天文学上
顾客与企业之间的关系正在发生变化,顾客已经不再是产品和服务的被动接受者,他们拥有引领产品需求和创新的能力,顾客参与到产品创新中已经成为企业生存和发展的关键。本文在
<正>近年来,国外标准要求越来越高,技术壁垒日益苛刻,而国内企业技术力量相对薄弱,信息掌握不全,企业的发展、地方经济的发展面临着巨大的考验。莱州检验检疫局综合档案室在
<正>(上接2014年38卷1期22页)3.2虚拟低音增强随着市场上音频重放设备日趋小型化、便携化、低功耗化,人们对于小型扬声器的重放音质要求越来越高。由于受尺寸和重量的限制,小