数据挖掘中关联弱化问题的解决方法分析

来源 :计算机科学 | 被引量 : 0次 | 上传用户:jljc123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前的支持向量机和均值聚类等数据挖掘算法中,几乎都是依靠数据之间的关联性来完成数据匹配。一旦数据库中含有大量的冗余数据,将造成数据之间的相关性降低,关联性被破坏,导致传统的数据挖掘算法效率降低。为了避免上述缺陷,提出了一种弱化关联规则修补挖掘算法。利用弱聚类方法,在数据选择过程中,不将所有的元素都进行初始分类处理,只计算某一元素属于某一个类别的概率,确定多个弱聚类中心,计算不同数据之间的弱聚类关联性,从而实现关联规则较弱的冗余环境下准确的数据挖掘。实验结果表明,这种算法能够有效提高海量冗余环境下的数据挖掘
其他文献
行政事业单位内部控制工作是单位管理的重要组成部分,是规范单位经济活动和社会经济秩序的重要手段。做好内部控制建设有利于提高行政事业单位的管理水平,也有利于加强廉政风
相异度和相似度度量是聚类算法中非常重要的一种因素,往往会影响到聚类分析的结果。很多聚类算法采用欧式距离作为计算数据相似度的度量。而欧式距离不能反映属性值的全局特性
实例扩展与属性值扩充是Web抽取与集成领域中的一个重要研究课题,将Web数据列表和实例建模成二分图,根据扩展实例的质量分数,对扩展集合进行迭代更新直到扩展集合的质量分数
据路透社报道,美国白宫近日公布了一项立法草案,将把其2012年出台的自愿性的“消费者隐私权利法案”上升为法律。旨在让消费者能更好地控制他们留在互联网上数据足迹的使用、储
随着经济全球化步伐逐渐加快,开放式创新已成为国家科技创新的主要范式。新形势下,科技智库需密切洞察外部环境和世界科技前沿,围绕新需求,构建一个强大的柔性网络,快速响应