基于本体的苹果病虫害垂直搜索引擎研发

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:yd476789385
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,网络信息的急剧膨胀给果农提供丰富病虫害信息资源的同时,又在有效使用方面面临新的挑战。针对现有搜索引擎查准率低、基于关键字的信息检索技术不能满足用户在语义上的需求,本文在领域本体的基础上展开对苹果病虫害垂直搜索引擎的相关研究。本文主要研究内容及结论如下:(1)苹果病虫害本体的构建。针对手工本体构建效率低,对领域专家依赖性太强等问题,采用基于文献的领域本体构建方法构建苹果病虫害本体。首先,本文对领域语料进行中文分词和数据清洗,通过相关性判断得到领域概念。然后,利用关联分析和聚类技术得到领域概念间的关联关系。最后,利用关系数据库对领域本体进行存储。该方法减少了对领域专家的依赖性,提高了领域本体构建的自动性。(2)苹果病虫害垂直搜索引擎的构建。针对苹果病虫害信息检索准确率低的问题,将领域本体引入垂直搜索引擎的构建中。首先,进行信息的采集和过滤。选取高质量的URL作为初始种子,用爬虫爬取相关页面并对页面进行分析,抽取出页面中的链接,并利用正则表达式对链接进行过滤,将过滤后的URL放入URL库;抽取网页正文进行主题相关性判断,将相关性高的网页存储在计算机中,按倒排索引策略动态建立索引。然后,实现信息的扩展查询和相关词的可视化推荐。最后对优化的主题爬虫、信息抽取性能和苹果病虫害垂直搜索引擎进行测试。实验表明,优化的爬虫速度提高了12.7倍。基于包装器的信息抽取的查准率保持在94.6%以上,F-指标性能在87.5%以上。本文研究的搜索引擎返回结果数目适当,相关度比较好,比普通搜索引擎高22%,比“农搜网”高5.2%。(3)原型系统的设计与实现。为了方便对信息检索平台的使用和管理,设计并实现了基于本体的苹果病虫害垂直搜索引擎原型系统,实现了领域本体的构建、网页的动态抓取、动态建立索引、扩展查询和相关词可视化推荐等功能。
其他文献
张润民主任承仲景真谛,恪守经典,全面继承,临证时又善于发挥,应用经方小柴胡汤治疗妊娠期发热、睡眠障碍,小青龙汤治疗慢性支气管炎,真武汤治疗慢性心力衰竭、慢性肾衰竭,古
目的:通过临床病例及实验,研究多层螺旋CT血管成像(MSCTA)在诊断闭塞性动脉硬化(ASO)中的价值,并对照下肢动脉造影(DSA)比较MSCTA各种重建方法的诊断价值。方法:ASO患者60例,
我国传统技术利用马铃薯、木薯、白薯等诸多类淀粉加工成粉条、粉丝、粉皮等为广大人民所喜爱,近年由于火锅在各地盛行,人们更喜欢将上述食品涮着吃,粉丝和粉条由于过细,容易
目的:采用亚毫米层厚(0.5mm)的多排螺旋CT(multidetector row CT,MDCT)高分辨扫描和多断面重建(MPR)及曲面重建(CPR)技术,多方位显示翼腭窝及其通连结构的正常形态并进行测量分
1,3-偶极环加成是化学反应中合成五元杂环化合物的经典反应,又被称为Huisgen反应。该反应是指1,3-偶极体与烯烃、炔烃及其衍生物之间的环加成反应生成五元杂环化合物的过程。1,3-偶极体一般分为丙烯基偶极体和炔烯基或丙二烯偶极体,例如甲亚胺叶立德、羰基亚胺、腈氧化物、腈亚胺等等。由于1,3-偶极环加成反应受溶剂介电常数和极性影响较小,反应容易进行,反应条件温和,该反应在有机合成杂环化合物中得到
我国的经济发展整体形势在近些年可谓越来越复杂,伴随着国家出台的各种措施,很多企业遇到了发展的瓶颈,当然有很多企业迎来了发展的新机会,如国家的去产能政策导致了很多能源
管板系管壳式换热器的主要受压元件,承受管/壳程两侧介质的压力与温度及腐蚀作用。随着炼油化工装置长周期运行应用不锈钢管壳式换热器或不锈钢管束更换碳钢管束的增多,管板
目的:探讨左金丸对人肝细胞色素P450的CYP1A2/2C8/2C9/2C19/2D6/3A4亚型的体外抑制作用。方法:左金丸、黄连和吴茱萸的水提物分别与CYP1A2/2C8/2C9/2C19/2D6/3A4/3A4亚型的7
夏津县是全国著名的优质棉生产基地,1998年在全国率先建成占地面积1000亩,集收购、加工、销售为一体的全国一流的棉花交易市场,并依托棉花资源优势,全县棉纺织产业迅速发展。
施工阶段的投资控制虽然在整个住宅开发项目的投资控制各环节中并不是关键的阶段,但却是资金投入实际发生的密集期,是投资的主要实施阶段。它具有控制过程长、节点多、动态变