【摘 要】
:
Lucene是一个高效的全文检索工具包,本文主要研究了Lucene的体系架构及其在中文检索上的应用。通过对基于最大匹配算法的中文分词器的设计与改进,并引入文本解析器与构建同义
论文部分内容阅读
Lucene是一个高效的全文检索工具包,本文主要研究了Lucene的体系架构及其在中文检索上的应用。通过对基于最大匹配算法的中文分词器的设计与改进,并引入文本解析器与构建同义词词库引擎,使得Lucene对中文的检索更加个性化。通过检索结果 的对比表明,改进后的中文分词器对检索功能的扩展有了极大的提高。并最终构建出了一个高效的中文全文检索系统。
其他文献
对CCSDS算法进行了优化,提出了OCPC算法。该算法采用两种预测模式根据像素点位置自适应地选择预测方法,并且编码采用Golomb Rice编码方法,编码中仍然采用自适应编码K的计算方法。最后对OCPC算法的压缩特性进行了验证,取得了优越的压缩性能。
为了直观、逼真地展现地下油藏构造的真实形态及储层物性参数的分布规律等,设计并实现了一种基于开源软件OSG的油藏三维可视化系统。该系统充分利用OSG的特点和功能,完成了三维油藏模型漫游、缩放和任意剖切等交互操作功能。同时重点研究实现了绘制油藏彩色模型、提高网格模型视觉效果等技术。将该系统应用于中石化胜利油田实际油藏区块,取得了较好的效果。
针对车载疲劳驾驶检测的应用,设计了基于TMS320DM642嵌入式平台的疲劳检测系统。首先在YCbCr空间进行肤色分割,之后采用基于人眼特征的改进混合投影算法定位人眼区域,然后计算人眼区域的高度并判断人眼的睁闭状态,最后利用PERCLOS算法对疲劳程度做出检测。实验结果表明,该系统准确率高、实时性好,能很好地满足车载疲劳驾驶检测的需要。
提出了将加速鲁棒特征SURF与混合匹配法相结合实现对非特定目标的跟踪,跟踪目标既可以是特定目标,亦可在跟踪过程中进行目标切换。首先提取目标图像和待匹配视频的SURF特征点并生成特征向量,然后采用欧氏距离和Hessian矩阵迹相结合确定特征点匹配对,实现目标的定位与跟踪。选用VS 2008平台进行仿真实验,结果表明,该算法既保持了跟踪目标的尺度不变性,又实现了跟踪过程的可控性。
激励信号源是电磁超声检测系统的核心模块之一,其输出信号决定了电磁超声检测仪检测的质量。按照电磁超声检测系统对激励源的要求,设计了相应的正弦脉冲激励源。该设计系统主
传统抛物线方程方法求解起伏地形路径下的电波传播无法反映反射和散射效应,对刃峰地形、类似高斯型地形等起伏地形,采用分步傅里叶变换方法求解双向抛物线方程方法并考虑前向
研究了森林植被分割经典算法,为有效处理森林植被纹理尺度问题,提出了一种基于蓝噪声理论描述遥感图像森林植被纹理特征的森林植被分割方法。这是一种新的植被纹理刻画方法和纹理尺度计算方法,利用得到的纹理尺度设计特定的结构元进行数学形态学运算,提取森林植被信息,得到分割结果。实验结果验证了新方法的准确性和适应性。
宏蜂窝和小蜂窝混合的异构网络必然将会成为一种满足日益增长的移动业务量需求的手段。然而,大规模部署小蜂窝接入点(SAPs)也会导致相当大的能量消耗的增长,随着环境意识的增强
针对无线传感器网络典型分簇协议LEACH簇首随机选择和频繁分簇的问题,提出一种基于LEACH的改进协议。簇首的选择分为奇数轮和偶数轮,在奇数轮簇首的选择时,节点生成一个随机
针对微波加热物料难以建立准确模型的问题,采用粒子群算法优化BP神经网络后,对微波加热物料的温度变化构建系统模型。在该模型上,对温度的变化趋势进行预测。实验结果表明,经