基于层次树模型的Deep Web数据提取方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:kahn419
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络在成为信息查询和发布平台的同时,海量的信息隐藏在查询受限的Web数据库中,使得人们无法有效地获取这些高质量的数据记录.传统的Deep Web搜索研究主要集中在通过关键字接口获取Web数据库内容.但是,由于Deep Web具有多属性和top-k的特点,基于关键字的方法具有固有的缺点,这就为Deep Web查询和检索带来了挑战.为了解决这个问题,提出了一种基于层次树的DeepWeb数据获取方法,该方法可以无重复和完整地提取Web数据库中的数据记录.该方法首先把Web数据库模型化为一棵层次树,Deep Web数据获取问题就转化为树的遍历问题.其次,对树中的属性排序,缩小遍历空间;同时,利用基于属性值相关度的启发规则指导遍历过程提高遍历效率.最后,在本地模拟数据库和真实Web数据库上的大量实验证明,这种方法可以达到很好的覆盖度和较高的提取效率.
其他文献
1 教育的终身性,决定了语文教学在医学职教中的奠基作用展望21世纪,提高劳动者素质和专业人才素质将是一个动态过程.人们必须为不断更新和扩充知识面而努力学习,以适应科学技
进入21世纪以来,关税作为贸易保护手段的作用日益降低,随之而产生的各种非关税壁垒措施层出不穷,其中绿色壁垒以鲜明的时代特征,日益成为阻碍国际贸易发展的重要关卡。对于绿
为使护生在实习过程中即确立"安全第一"的意识,养成良好的职业素养,带教教师应在临床带教中实施安全护理教育,强化护生的安全护理意识.笔者就对护生的安全护理教育谈几点具体
<正>五代吴越,辖两浙、苏南十三州,越窑地处吴越境内。钱氏统治时期,吴越社会安定,经济繁荣,物产富庶,越窑生产获得了前所未有的发展,窑场不断扩展,产品产量与质量登峰造极,
会议
在康德的道德形而上学体系中,正义与美德作为两个核心价值并存,共同构建了康德伦理学的思想体系。在道德形而上学基础上两者是统一的,无论是法权责任还是德性责任都建立在纯
为探明毛乌素沙地3年生臭柏(Sabina vulgaris)实生苗在不同光照和水分条件下的光抑制响应机制,研究了各处理臭柏实生苗的最大光化学效率(F_v/F_m)及叶绿素(Chla+Chlb)和叶黄
以"不能量化"来证伪劳动价值论的观点,肇始于对马克思"价值转型"理论的质疑,其典型代表就是"庞巴维克质疑"。"庞巴维克质疑"的要害在于:劳动价值论所定义的价值,与现实经济活
长年在高校教新闻写作课,常常在课堂上组织学生围绕某些作品进行讨论。有一次有位同学提出的观点使我感到有新意,并在一定程度上加以认可,他认为新闻的好坏、得失、高低不在
<正>1育苗选用高产抗病优良品种盛德3000,该品种高抗叶霉病、病毒病、灰叶斑病,硬粉果,果形美观亮丽。采用72孔穴盘育苗,苗龄30 d,小苗移栽,育苗基质选用商品基质和商品微生
实践性教育作为培养实用护理人才的核心,已受到医学院校的普遍重视,就如何扎实有效地开展基础护理技能教学从5方面进行探讨.