【摘 要】
:
搜索引擎作为互联网上最主要的信息搜索工具,在各个领域都已得到广泛应用。然而。由于网络信息量迅猛增加和网络信息组织的无序性,传统搜索引擎已经无法满足人们对信息服务个性
论文部分内容阅读
搜索引擎作为互联网上最主要的信息搜索工具,在各个领域都已得到广泛应用。然而。由于网络信息量迅猛增加和网络信息组织的无序性,传统搜索引擎已经无法满足人们对信息服务个性化、智能化的需求。本文提出了智能搜索引擎的解决方案——通过机器学习获得用户的兴趣爱好,根据用户个性对信息进行过滤。并就方案中涉及到的一系列理论和技术问题进行了研究,主要包括: 提出了智能搜索引擎框架,在主动搜索和元搜索的基础上增加了中文信息处理模块,实现了搜索引擎的智能化和个性化服务; 对汉语分词技术进行了研究,综合各种分词方法实现了一套适合于智能搜索引擎系统的分词系统。针对歧义字段的划分问题,提出了歧义字段划分的三个原则,在三原则的基础上给出了“二字续分法”分词的方案,该方案能够快速有效的分解大部分的歧义字段,具有很高的实用价值。 神经网络分词是今后分词技术发展的一个趋势,本文对分词神经网络进行了研究,建立了分词神经网络的实验系统,利用分词神经网络进行了歧义字段划分的实验。 中文文档的排序与过滤是中文智能搜索系统开发的一个重要环节。本文结合智能搜索系统介绍了一种基于词频统计的文档过滤算法,该算法对传统的向量空间模型法作了改进,能够根据用户的兴趣爱好很好的对文档进行相关度的排序与过滤,取得了较好的效果。
其他文献
本论文研究了抗菌聚丙烯及耐酸碱腐蚀聚丙烯的制备。通过测试在不同类型改性剂和配比下材料的抗菌性和耐酸碱腐蚀性,确定最佳的选料配比,并对改性材料的力学性能和结晶性能作
目的观察研究多西环素联合液氮擦冻治疗酒渣鼻的疗效,探讨酒渣鼻治疗的新途径。方法将152例患者随机分为两组:治疗组78例,对照组74例。治疗组口服多西环素胶囊联合液氮涂擦;对照
采用数值计算与试验测量相结合,研究滑块与平板之间的正交各向异性摩擦特性。基于摩擦因数测量试验台,设计4种不同工况,测量出复合材料与聚四氟乙烯之间两个正交主方向的摩擦
目的最大量的提取三峡隔山牛皮消的活性成分。方法采用微波萃取技术对隔山牛皮消的活性成分C21甾体酯苷进行提取,通过4因素3水平的正交试验,用分光光度法测定三峡隔山牛皮消
对于镀膜工序来说,基底的清洗是必不可少的一个环节,基底清洁程度是影响镀膜产品质量的关键因素之一,保障元件镀膜前表面高洁净度,降低薄膜内的杂质污染物,镀膜前的洁净清洗
<正> 在配合饲料的工艺中,饲料的混合是一项很重要的工序,因为它直接关系到配合饲料的质量,所以这个过程必须由饲料搅拌机来完成。目前国内外所用的饲料搅拌机种类繁多,其性
在分析生态补水对水环境影响的基础上,从水文、水力、水质角度提出改善效果评价体系,具体的评价指标包括生态补水量系数、重要节点补水效率、换水周期变化率、区域水质改善度
目的:探究不同疗程高压氧(HBO)治疗对脑出血(ICH)大鼠血肿周围水通道蛋白(AQP4)及超氧化物歧化酶(SOD)表达的影响。方法:将52只雄性SD大鼠随机分为3组,正常组(12只)、脑出血
为了研究肠道损伤与肠道黏膜细胞TJ结构的关系,以池塘养殖条件下的草鱼为研究对象,在对肠道损伤进行外观形态、组织切片和血清指标评估的基础上,分别选取肠道健康和肠道损伤
<正>2019年4月24日,由中华人民共和国文化和旅游部、国家文物局主办的"归来——意大利返还中国流失文物展"在中国国家博物馆开幕。中国和意大利同为文明古国,拥有悠久的历史