模糊等值理论在数据清理中的应用

来源 :东南大学学报:英文版 | 被引量 : 0次 | 上传用户:gliu0307
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了规则合并的优化方法和重复记录聚类清除的方法.应用模糊等值理论,避免了传统等值理论非此即彼的僵硬方式,但清理过程中部分规则可能存在包含与被包含的关系,被包含的规则其等值度显然会相对较小,根据用户阀值提出了规则合并的优化方法,可减少重复记录的计算时间.基于同样的原因,规则间的包含与被包含关系将影响模糊等值度的误差分析,因此提出了利用忽略被包含的规则等值度提高误差分析精度的改进模糊等值理论误差分析方法.重复记录的核实通常需要人工逐条检测,易于出错,本文提出的聚类算法,可节省大量的用户劳动.最后给出一个实验
其他文献
<正> 在日趋激烈的报业市场竞争中,专业报面临着严峻的考验,不少专业报的日子越来越不好过。专业报要在市场竞争中站稳脚跟,就要适应新形势研究好对策。专业报主要服务于某一
【正】胡适在《新思潮的意义》一文中曾说,他主张“研究问题,输入学理,整理国故,再造文明”。这是他的文化路线,也是他一生文化活动的几个主要方面。本文就大体从这几个方面来考察
针对文档分类过程中不同大小文档表示、文档特征选择和文档特征编码问题,提出了一种基于粗糙集的角分类神经网络Rough—CC4.利用近义词构成等价类,以此表示文档,可以缩小文档表示
路桥工程与国家经济发展、城市建设密不可分,提高路桥施工技术水平,保障路桥工程施工质量,是新的市场经济背景下,国家对路桥事业提出的新要求。本文针对常见的路桥施工技术与
<正>报道的客观真实性决定报纸的可信性和权威性,真实是报纸的生命。如果报道一而再、再而三地出现假新闻,就会失信于读者,败坏了报纸的声誉。但遗憾的是,当前一些报纸假新闻
<正> 舆论监督是新闻媒体的重要功能。对于一张晚报而言,如果不能恰如其分地履行新闻监督职能,其可读性和受关注程度便无从谈起。正因为如此,几乎所有的晚报都特别强调舆论监
提出了一种基于三维有限元的电磁无损检测缺损响应快速模拟的组合方法, 该方法由三项技术构成, 分别是局部计算技术、差场技术和迭代解技术. 采用局部计算技术, 可以将三维计
【正】扬雄(公元前53年——公元18年)是我国西汉末年著名的文学家和思想家。在他的哲学体系中,伦理哲学占有重要地位。中国古代意识形态中,伦理道德观念往往与政治、哲学、宗教结
基于小波包分析推导了结构动力系统在不同分析尺度上的状态方程和观测方程,在此基础上研究了结构动力响应在不同分析尺度上的时-频特性.理论分析证明,采用小波包分解结构的动