基于扩展树状知识库的海量数据清洗算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:hua6952
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统知识库表示的局限性,通过分解和重组领域知识,建立扩展树状结构的知识库,其中叶结点对应具体知识实例,称为原子知识,非叶结点只对应知识概念。同时提出相关的数据清洗算法,根据用户的选择,自动提取原子知识进行分析,消除重复,按照处理权重建立原子知识序列,然后逐一对数据进行清洗。实验表明,该算法能有效优化用户的请求,减少对海量数据的遍历次数,海量数据的清洗效率明显提高。
其他文献
针对无线传感器网络中使用移动信标定位问题,提出了基于遗传算法的无线传感器网络移动信标定位及路径求取方法。首先根据区域面积计算出三重覆盖所需的发射信标位置的个数,用
针对基于可辨识矩阵核求取属性约简存在的空间与时间都不理想的问题,提出一种新的基于粗糙集的属性约简启发式算法。该方法不直接构造及存储可辨识矩阵,而且在核不存在的情况下
筛选哈茨木霉的cDNA文库,克隆到泛素结合酶基因的cDNA全长序列,并对其进行生物信息学分析,该序列的长度为951 bp,包含一个455 bp的完整开放阅读框,编码157个氨基酸,其理论分
提出一种基于分组重写的解决三维几何约束的方法,原有的算法在解决大型系统几何约束求解时效率较低,系统开销较大,并且由于算法规则的局限性,使得很多复杂系统无法解决,包括三维几
为了解松花江水中硝基苯在自然冰冻情况下的归趋,在冬季室外自然气候条件下进行硝基苯水样冰冻实验,并且对松花江达连河断面主河道冰层中硝基苯含量进行分层检测.结果表明,在水样