基于Web数据库特征的Deep Web独立数据样本采样方法

被引量 : 0次 | 上传用户:sheep1230_yuzt1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着Deep Web研究的不断深入和人们对Web数据集成系统要求的提高,对Web数据库进行采样的质量要求也越来越高.为使样本能充分服务于数据集成系统中的数据源选择、查询优化等操作,给出了Web数据库特征的定义及其形式化描述,并针对查询接口中的分类属性、文本属性以及属性组合分别给出相应的能够反映Web数据库内部数据分布特征的独立数据样本采样方法.针对属性值之间存在依赖关系的文本属性,定义了依赖关系矩阵并基于该矩阵给出了文本采样中的样本分配方法;为了方便采样,给出了采样树的定义并基于采样树给出了针对多属性组合的采样方法;另外,基于样本与数据源在特征匹配的度量,还给出了相应的采样质量评价方法和采样效率评价方法.实验测试表明,提出的方法能够较好地完成数据采样,提供高质量的采样结果.
其他文献
在初中德育过程中,教师要以生为本,制订适合学生的教育策略。在这个过程中,教师要努力改善学生的学习状态,创建良好的学习环境,通过不同的方法进行德育。同时,教师要加强师德
本文在环境气候、服装气候的基础上,介绍了体热发散方式及人体体温调节方式, 进而归纳了影响服装保暖的各种因素,逐层递进地阐明一般保暖机理、积极保暖机理及智能化服装的保
病例1:女,26岁。因腹痛、咳嗽、胸闷3月,加重20d入院。查体:半卧位,消瘦,胃镜检查病理结果胃体印戒细胞癌。超声检查:左颈内静脉内充满强弱不均的团状回声,加压后血管未被压瘪,彩色多
本文介绍了纺织行业中无纺布技术及其分类,并详细介绍了无纺布技术在现代造纸技术中的应用和前景。
本文结合贝叶斯决策理论和统计学习思想,将概率神经网络(PNN)应用于音频分类,选用较少的音频特征将音频信号分为语音、音乐和静音三种类型,最后分析了PNN的分类性能及其泛化
社区挖掘算法能够在复杂社会网络中发现社区,却无法精确区分社区边界点,也没有考虑挖掘结果可视化.力导引布局算法是社会网络信息可视化领域的主流布局算法,但是无法反映网络
<正>~~
期刊
急性一氧化碳中毒(Acop)是多发病、常见病,并发中毒性脑病是一氧化碳中毒的严重并发症,直接影响着患者的预后和生活质量。用回顾性分析法,探讨一氧化碳中毒并发中毒性脑病与同
目的:探讨剖宫产患者的围手术期安全管理及护理。材料与方法:我院对剖宫产患者安全管理及术前、术中、术后的护理。结果:剖宫产患者围手术期经过严格的管理流程及优质的护理服务
<正>稳定同位索比值的测量在地质学、气象学和地球科学的研究中具有重要的应用价值。在水循环研究中,有关大气中的水汽同位素比值的测量对于揭示水汽来源以及水汽输送过程都
会议