基于关键词筛选分词算法的企业级搜索引擎

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户:voodoochildzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与数据库学科不断发展,数字化信息已经成为当今存储数数据的首要选择,并且借助大型搜索引擎,使用户可以快速找到对应信息。应用于企业级的高效搜索引擎成为当前研究的重要课题。本文提出了基于关键词筛选KWS(Key Word Selection)的搜索引擎机制,针对电网与大型发电厂智能管理系统的数据结构,通过构建双字哈希词典和双字耦合消歧分词与结果的语义筛选,将筛选后的分词结果放入Sphinx和MySQL数据库进行全文搜索并加以缓存,既提高了搜索速度又提高搜索的准确度。
其他文献
1 基因治疗概述1.1 基因治疗的定义  基因治疗的传统含义是指单纯校正突变基因来对遗传性疾病进行治疗。目前认为所谓基因治疗是指将外源性目的基因通过基因转移的途径导
知识经济时代,经济与文化的联系不断加强,文化对经济的促进作用越来越为人们所重视。福建作为改革开放和对台统战的前沿地带,发展文化产业有其特殊的意义和目的。下面将就福
<正>建筑工程施工就是指把施工图纸的点、线、面图形转化为建筑实体的过程。施工图纸是投资概算、建设工程招投标、造价分析、建筑施工及验收、竣工后维护运营的基础,由此可
积极财政政策是针对一个时期国家经济状况而采取的应对之策,而目前从需求方面看,积极的财政政策还要再坚持一段时间.因为在建的国债投资项目需要继续完成,供大于求的局面还没
WEPP是美国农业部组织力量开发的新一代土壤侵蚀预测预报模型。该模型是一个独立的计算机应用软件,具有良好的操作界面。运用该模型可以对坡地、末端小流域的侵蚀和水文过程进
提出了一种基于UUV模型的海流估计方法。结合UUV的动力学模型,根据实际系统状态与模型系统状态得到UUV航行环境的海流信息,避免了海流估计对开环操纵性试验的依赖。此外,针对
焦柳线慈利车站电气集中施工是由我们承担的:由于是电化预留,故轨道电路采用电化区段25Hz相敏轨道电路。在开通后两天内连续烧毀了二个电容,据目击者讲,电容烧毀时浓烟很大,
将模拟退火算法嵌入到粒子群优化(particalswarmoptimization,PSO)算法中,并对PSO产生的最优适应值进行重新评价,以此构成混合粒子群优化算法(PSO-SA).将PSO—SA算法应用于巡航导弹的
为了找出不同数据类型适用的数值预测方法,提出了基于模型树、神经网络、回归方程及SMOReg四种常见的数值预测算法在多个具有不同数据类型的数据集上比较研究。通过实验结果
面对水资源短缺、水污染等不断涌现的水资源问题,本文将以湖南省为例,选取2013年湖南省社会经济发展、人口状况、水资源利用状况等方面的13项指标数据,利用主成分分析法从这1