基于Lucene的全文检索研究与应用

被引量 : 0次 | 上传用户:zjian26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广东电信号码百事通平台的质检系统需要实时检索千万级以上的话务数据,基于数据库的实现方式已经无法满足应用的需求,必须采用新的技术来突破系统性能的瓶颈。Lucene作为Apache软件基金会的一个顶级项目,是一个纯Java语言实现的开放源代码的全文检索引擎工具包。虽然Lucene不是一个完整的全文检索引擎,但可以通过遵循Lucene的框架规范,扩展Lucene的功能,即可在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。本文在对Lucene全文检索原理的分析基础上,着重研究了如何提高Lucene对海量索引数据实时检索、更新的性能,并研究如何在内存中实现实时增量索引、对内存索引的实时检索。除此之外,还对如何提高质检系统的可用性和容错性进行了研究,提出了具备一定容错能力的机制。最后,本文给出了新的基于Lucene全文检索的质检系统设计方案和具体实现。
其他文献
从宗族、宗教、水利组织、市场体系和婚姻圈以及象征、信仰等方面对美国学者杜赞奇在《文化、权力与国家》一书中所提出的"权力的文化网络"这一重要概念进行分析和评述,指出
托马斯.杰斐逊是美国资产阶级民主思想的集大成者、资产阶级民主革命家、美国民主的象征。但是他作为资产阶级民主革命家的背后还是一位扩张主义者,在他对民主自由追求的言论
生存和发展是一个全球性的问题,环境保护日益成为经济发展不可忽视的问题。自上世纪80年代以来,西方发达国家以福利经济学和制度经济学理论为依据,特别重视和加强了税收政策
配送车辆的路径规划问题,是物流配送优化中的一个关键环节,也是困扰物流配送企业由来已久的难题。从文献查阅来看,目前对车辆路径规划问题的研究大都集中于单向的物流配送,而
互联网的出现和发展,使媒体产业发生大变局,并出现产业加速融合的趋势。对于传统媒体的报纸来说,以网络为代表的新媒体异军突起,对于报纸的冲击是巨大的,不仅从它的手中夺走
<正>一、教案文本解读中的几个理论问题我们在第2期讨论了教案中的教材分析与教学重难点之间的关系,这期将深入探讨几个理论问题:(1)学情分析应包含哪些内容?(2)课堂教学目标
目的:研究采用中等强度范围一次递增负荷跑台运动过程中的主观感觉等级(RPE)和心率(HR)来预测最大耗氧量(VO2max)的可靠性。方法:体育专业大学生22名(男生10名,女生12名)在中
<正>时代的发展和变化,促进各种事业、文化、思想的发展,在社会生活中,人们是消费者也是生产者,当前人们的影视文化消费占据消费支出中的大部分比例,电视产业在众多消费主体
以老子、庄子、列子、鹖冠子等为代表的道家学派,虽然与儒家共同完成了东方"身心一元"的理论阐释,但其身体观的思想体系自有其独到之处。道家身体结构观用气论来弥合身心界限
当今应用于振动测试的工具较多,本文设计实现了一种基于虚拟仪器技术的振动测试方案。该振动测试系统集计算机、数据采集卡和应用软件为一体,充分利用了计算机快速处理数据的