基于Lucene的烟草个性化搜索引擎的研究与实现

来源 :工业控制计算机 | 被引量 : 0次 | 上传用户:ahhscyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了Lucene搜索引擎框架在烟草行业的信息获取和搜索方面的系统应用。如何在异构的海量数据中获取与烟草行业相关的数据是实现烟草行业信息化管理技术的一个重要分支。通过对不同文件格式的数据处理、烟草行业相关站点的数据抓取、搜索引擎创建和数据检索四个模块框架来实现系统。Web页面基于Heritrix烟草信息数据抓取,其中的非结构化数据或者半结构化数据和不同的文件格式通过Tika工具统一转为为文本,通过Lucene对结构化和非结构化数据创建索引以实现数据检索,由此实现烟草信息搜索引擎系统的实现。
其他文献
应用Solidworks Simulation建立了反应堆保护系统机柜有限元模型,并计算其在自重及地震载荷下的模态和应力情况,并依据ASME锅炉和压力容器规范应力限制要求,判定分析结果是否
滤池自动控制是水厂自动化改造的重要组成部分。详细阐述了水厂虹吸滤池自动控制系统的系统组成、控制流程和程序设计。基于PLC的滤池自控系统,具备有安全性、可靠性、实用性
在电动汽车充电桩的研究中,由于开关电源是通过整流器与电网相接,传统的整流器一般是非线性电路,在电网中会产生大量的电流谐波和无功功率而污染电网,为提高系统功率因数。将
为了促进分布式光伏并网发电系统的发展,进一步提高分布式光伏并网系统的效率的同时保证系统的稳定性,设计了一种单相非隔离两级式光伏并网系统。系统由前后两级变换装置组成
针对航空发动机装配车间因订单变更,机器故障等随机扰动造成静态调度结果失效问题,建立了重入式混合车间FIow-shop动态调度模型,综合考虑了机器,班组能力等多种资源约束;提出了一种
提出了一种新的智能锚杆检测仪。通常的锚杆的拉拔试验法在现场操作时存在许多问题,为解决这些问题,采用了这种独特的拉拔力检测的试验方法。该试验方法没有使用常规的液压加载、压力表读数的方案,而是采用电动扭力扳手对被检测的锚杆施加扭矩和轮辐式压力传感器对拉拔力大小进行检测,同时增加了便于安装夹具的铝合金升降机和可以存储打印试验结果的微机处理系统。试验证明该试验检测仪提高了检测时的效率,增加了检测过程中的安
文章考虑时变时滞的中立型Lurie系统的绝对稳定性问题。系统的中立时滞是常时滞,离散时滞是变时滞,系统的变时滞上界为一个未知的常数。在无限的扇形区间条件下,将变时滞区间
SaaS作为一种云服务方式,在面对云环境内部大量的任务以及请求的时候,如何进行有效的任务调度和高效率的资源分配是目前亟需解决的难题。通过任务的调度和资源分配,使系统的性能
WinCC运行于个人计算机环境,可以与多种自动化设备及控制软件集成,具有丰富的设置项目、可视窗口和菜单选项,使用方式灵活,功能齐全。Web Navigator发布使得WinCC的工程在任
针对管网叠压供水系统的非线型、大时滞、数学模型难确定的特点,利用模糊算法设计了可进行在线参数整定的FuzzyPID控制器。该控制器能够根据不同的工况选出合适的控制参数,对