概率数据库可扩展查询技术

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:likuaiji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化进程的推进,在信息检索、模糊物体匹配、数据集成、传感器网络、社交网络等应用领域存在着大量的不确定数据。然而传统的关系数据库只能处理确定的数据,对于概率数据的查询处理显得力不从心。因此,如何高效地实现概率数据查询处理的问题成为现阶段数据库系统一个崭新的问题,这促进了概率数据库理论与技术的研究。近年来,概率数据库领域的热点问题一直集中在概率数据库的数据表示模型以及高效查询算法上。BIDL(Block Indenpent Disjiont with Lineage)模型在BID(Block Indenpent Disjiont)模型的基础上加入世系信息lineage。世系信息不仅可以记录数据的来源,而且可以方便用户提供反馈信息。概率数据库的基础查询算法总体上分为两类,即基于语义(intensional)的查询算法和基于扩展(extensional)的查询算法。前者可以保证结果的准确性,但是计算复杂度很高。然而,基于扩展的查询算法查询速度相对较快,但是不能保证查询结果的准确性。ST(Split Tuple)算法首先基于世系信息lineage进行概率推理,并深入分析元组间的关系,其次通过拆分相应的元组,从而使元组间的关系进一步清晰和易处理,然后采取有效的概率计算策略以及高效的概率计算算法执行查询,最后将查询结果以及对应的概率值返回给用户。基于世系信息的概率推理具有一定的可扩展性。高级查询算法包括Top-k、Skyline、K近邻(K Nearest Neighbors)、轨迹查询、阀值轮廓查询、join查询等。其中,K近邻查询在气象预报、传感器网络等时空数据库中发挥着重要作用。PKNN(Probabilistic K Nearest Neighbors)算法利用数据满足的一些性质在计算过程中记录中间结果来加快计算速度,实验结果表明,此算法具有一定的可扩展性,一定程度上提高了概率查询效率。
其他文献
Web服务作为目前最新颖的分布式计算模型,有力的整合了Internet上的各种资源。服务组合是指将多个成分服务按照其功能、语义以及它们之间的逻辑关系组装提供聚合功能的新服务
随着网络技术的发展,越来越多的用户希望能够访问和处理来自分布于不同的数据源的信息,实现数据在多个系统与不同数据源之间的集成与共享。在现有的分布式异构的环境中,将信
电信网络中特别是管线网络(包括光缆、主干电缆、配线电缆等),其设备与地理环境紧密地联系在一起,电信线路的建设、维护都离不开详细而完整的GIS系统。通信网络资源管理系统本
新型干法水泥窑在水泥工业中得到了越来越广泛的应用,在干法窑的生产中,如何实现从配料、烧成、到监控报警全程实现电脑监控是一个难题。人工进行这些操作,首先长期增加了人力成
XML(eXtensible Markup Language,可扩展标记语言)自发布之日起就以其良好的可扩展性受到业界的普遍欢迎和支持,越来越多的应用领域已经将其作为主要的存储格式和传输媒体。随
Rootkit是攻击者在入侵系统后用来保持对系统的超级用户访问权限,创建后门和隐藏攻击痕迹等常采用的一种技术。Rootkit存在于Linux、Solaris和Windows等各种操作系统上。根据
目前,随着手机用户数的不断增加及移动通信技术的发展,越来越多的手机用户开始尝试使用移动增值服务。移动增值服务以其移动性、即时性、个人性的优势逐渐进入人们的日常生活。
随着信息技术和网络技术不断发展,Web服务已经迅速成长为网络信息集成领域的关键技术之一。微软公司更是通过“一切都是服务”来概括Web服务将给当前IT业带来的冲击。于是,在现
虚拟机动态迁移是虚拟化技术的关键技术之一,在保持虚拟机运行提供对外服务的同时,能将其完整、无缝地从一台物理主机迁移到其他物理主机上运行。而内存迁移因应用程序不间断
本文首先讨论了信息家电的特点,提出了信息家电体系结构框架的构想,并就信息家电接口描述语言在整个体系结构中所起的关键作用做了介绍;将面向对象的思想引入信息家电体系结构的