论文部分内容阅读
海量数据的传统精确查询易导致负载过大,而通过改进数据库近似查询自动采样,预先运行样本查询,然后根据每一个元组在样本关系表中出现的次数,将每个元组需要的存储信息作为元组的属性添加进数据表中,并通过DBMS在整个自动抽样过程对它们进行管理,对所得的结果进行分类并统计,得出每次采样过程中某个元组出现的次数,实验表明方法是有效的。