基于Lucene的本地搜索引擎研究与实现

来源 :计算机科学 | 被引量 : 0次 | 上传用户:jorry1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了改善计算机传统搜索在效率和返回结果上的不足,基于Lucene全文检索高效、准确的特点,采用非结构化文档结构化的思想,提出了文档内容自然分片索引的方法,实现了一个针对本地资源的个性化搜索引擎。
其他文献
总体布局完成之后的核心任务就是单元位置的合法化,即在将所有的单元安放到布局区并且与合理位置(site)对齐的同时,消除单元间的重叠。为了高效地实现大规模ASIC(Application Spec
基于编译指导的自动向量化已经成为编译器开发SIMD体系结构性能潜力的必然选择。OpenMP 4.0规范新增了SIMD编译指导语句,在开发中的GCC 4.9版本已经开始着手支持OpenMP4.0规
目标关联是遥感影像融合处理的重要步骤,本质上是目标配对问题。针对低分辨率遥感影像中阵群目标的特点,提出了一种基于点模式匹配的阵群目标关联算法。首先提出一种新的基于点集的不变特征——相对形状上下文特征,然后建立了以相对形状上下文特征的统计检验匹配测度为基础的阵群目标关联数学模型。为了求解该模型,在构造新的相容性度量函数来初始化关联概率矩阵后,利用松弛标记法通过迭代逐步更新关联概率矩阵,同时通过行列双
将原始图中节点分配到多个分组并根据原始边来确立分组间关系,这样得到的图称作汇总图。汇总图的规模可以由用户设定,用户可以通过浏览小规模的汇总图来获得原始图的相关信息
针对高可信软件提出一种软件脆弱性自动测试方法。与传统测试方法不同,该方法对待测试程序进行预处理,使用自动机学习算法构造软件与环境交互的抽象机模型,在符号化执行迭代过程中利用抽象机模型指导符号化执行,并动态生成测试数据,同时精化交互抽象机用于后继的符号化迭代测试。解决了传统符号化执行测试技术中缺乏指引、具有较高盲目性的问题,同时也提高了符号化执行测试的效率和代码覆盖率。
对沈群等提出的同时基于椭圆曲线和因子分解双难题的数字签名方案给出了攻击分析,本文证明椭圆曲线或因子分解难题有一个可求解,则沈群方案可被攻破。同时给出了一个新的基于
以无干扰理论为基础,提出了一种基于污点数据流的软件行为可信分析模型。该模型通过跟踪程序外部输入的污点数据,提取可能引发系统不可信的关键系统调用,并建立污点传播调用序列
汽车电子的开发需要根据特定硬件平台资源情况对基础软件功能进行裁剪,而汽车电子的基础软件模块具有配置需求量大、复杂度高等特点。因此,设计一种具有高可配置性、通用的配