林业企业黄页Deep Web数据集成研究

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:a499716595
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网技术的飞速发展,Web信息急剧膨胀,传统搜索引擎注重查全率而查准率不足,导致Web信息搜索越来越困难。特定领域的Deep Web网站上蕴藏着丰富的主题信息,但是这些Deep Web网站通常是分散的、不易检索的,因此,Deep Web数据集成技术逐渐成为研究热点。它不但可以解决传统搜索引擎不能索引Deep Web数据的局限,还能把各个孤立的Deep Web数据集成到一起,提供面向主题的一站式搜索服务。林业Deep Web情况亦然,用户难以利用传统的技术全面快速地收集Deep Web中的企业信息,使用Deep Web数据集成技术对林业企业黄页进行集成,提供高效专业化的Web信息服务,能够让用户更快的找到相关信息,不仅促进林业信息化发展,同时,也有利于推动林业经济的发展。本文通过对林业企业黄页Deep Web特征的分析,提出根据层次结构制定导航规则的Deep Web爬虫模型,设计出数据抽取的模板。同时,本文还对用户身份验证、导航URL提取、翻页URL提取、页面属性字段的提取、数据去重等Deep Web数据集成关键技术做了探索性的研究,通过实验对各种方案进行了尝试和比较,然后给出了最优的解决方案,并最终开发出高可用性的林业企业黄页Deep Web数据集成系统。最后,本文对系统的改进做了一些展望,为进一步的研究提供了基础。
其他文献
文章采用多角度建议区域Faster-RCNN准确定位图像中葡萄叶片,提出一种基于卷积神经网络的病害检测方法,检测图像叶片病害。相比直接检测图像病害,可去除背景因素对病害区域干扰,
土地是人类赖以生存,并以此为发展基础的有限资源。随着我国土地资源供需矛盾日益突出,土地规划的科学性、利用的规范性、管理的制度性尤为重要。目前我国法制体系不断完善,
东盟是"一带一路"国际合作的优先方向和重要伙伴,中国-东盟建立战略伙伴关系15年来经贸合作发展迅速、成果丰硕,在贸易保护主义、逆全球化抬头形势下大力拓展中国-东盟产能合
从物流企业运用作业成本法的背景分析入手 ,从必要性和可行性两个方面论证了作业成本法比较适合物流企业的成本控制与管理。物流企业运用作业成本法进行成本控制与管理尚处于
应用索氏提取法抽提茶叶中咖啡因,验证6种不同品种茶叶中咖啡因的纯度,在相关实验的基础上,改进了提高产率的方法。
为研究企业的法律和道德责任,消费者的信心、信任、偏好和忠诚度,采用定量分析方法研究,问卷调查法为主要方法,以秦皇岛为代表收集数据。结果表明,如果企业履行法律和道德责
在工业化、城市化进程中,农村劳动力的城乡转移已成为一种普遍趋势。这种农村劳动力的城乡转移在促进城市地区社会和经济发展的同时,对农村地区社会、经济的发展也产生了深远
随着以博客传播为基础的互联网2·0时代的到来,新媒介传播已经从以技术为导向的独白式的传统线性传播模式,转向以关系为导向的、对话式的全息传播模式。本文比照“媒介即讯息
本次课题对湿催化氧化法处理黑索今炸药废水进行了较深入的研究。 通过对比实验,初步确定湿催化氧化法处理黑索今废水是可行的。通过正交实验,得出各影响因素的主次关系是
本论文在对我国农村公共产品供给历史进行梳理的基础上,以豫北地区的H镇作为个案研究对象,通过实地调查来获取农村公共产品供给的真实信息,并从乡村治理的角度出发,对该镇公