论文部分内容阅读
随着计算机技术的发展,人们逐渐认识到管理传感器网络、智能家庭(Digital Home)、RFID、股票预测等应用中产生的大量不确定数据(Uncertain Data)的重要性,因此需要数据库存储描述被监测对象统计规律性的数据,而处理这些不确定数据需要新的理论及技术,使得概率数据库系统应运而生。由于此类应用中,不仅数据具有不确定性,而且数据处理与查询具有实时性,因此有必要将概率数据库技术与实时数据库技术进行有机集成。RTx-PDB是自行研发的实时概率数据库管理系统。传统实时数据库系统只管理确定数据,而实时概率数据库系统RTx-PDB中的数据具有概率、时间等多维特性,因而在事务处理及查询过程中需要考虑数据的不确定性及相应的定时约束。实时概率数据库数据模型RTx-PDM引入了属性级的随机变量和元组级的不确定度量,并从概率维、时间维出发概括出了四类属性:CTIVA、CTVA、UTIVA、UTVA,提供针对非传统属性的有效表示和存储策略。RTx-PDB提供RTx-PDM模型向经典概率模型RPM的转换机制,通过关系不确定度证明了转换过程中不确定信息的不变性。RTx-PDM用联合分布和条件概率追踪数据之间的联系。为了描述基于RTx-PDM表示模型的关系运算,定义了计算随机变量联合分布的jpdf()等操作。传统的概率查询评价算法仅支持对一维数据的查询,RTx-PDB将概率查询进行分类并提出了二维概率查询评价算法。极大关系不确定度描述了关系的最大不确定程度,在此基础上提出采用相对关系不确定度衡量查询数据集的整体不确定程度,并依此进行查询接纳和优先级分派。为保证概率查询的实时性,提出了RTx-PDB概率查询处理模型,该模型运用近似与延迟处理技术,以减小概率查询评价算法高复杂度对实时性的影响。实验结果表明,RTx-PDM模型能够有效表示不确定数据,提出的查询处理模型、算法及相关策略能较好的支持实时概率查询。