基于数据驱动FCM的模糊关联规则算法研究

被引量 : 0次 | 上传用户:zhangsiqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘中一种重要的方法,模糊关联规则挖掘算法是数据挖掘的一个主要研究方向,随着模糊C-均值聚类算法(Fuzzy C-means,FCM)的提出,将FCM算法应用于挖掘模糊关联规则成为数据挖掘新的重要研究领域。本文主要研究模糊C-均值聚类算法以及模糊关联规则算法,首先提出了一种基于数据驱动FCM的预处理方法,而后在此基础上分别对传统的关联规则挖掘Apriori算法和加权模糊关联规则算法提出了两种新的改进算法,本文的主要工作如下:1、提出了基于数据驱动FCM的预处理方法(data-driven fuzzy c-means,DD-FCM)。此方法可以把定量属性转换为二进制属性,使用数据驱动方式产生模糊隶属度函数和模糊分区。实验结果表明使用DD-FCM预处理方法产生的模糊隶属度函数可以在没有专家预先给出的情况下正常工作,并且预处理性能要明显优于BIRCH和CLARANS硬聚类算法,从而说明对于大型数据库而言,该方法是高效可行的。2、提出了基于DD-FCM的Apriori算法(An AprioriAlgorithm Baesd on data-driven fuzzyc-means,DD-FCMA)。通过处理由DD-FCM方法产生的模糊集,并运用Apriori算法的向下封闭性性质(DCP)来挖掘模糊关联规则。它克服了传统Apriori算法在处理大型数据库时挖掘时间上的缺点,并且通过此方法挖掘出的规则具有强关联性和语义性。3、提出了基于DD-FCM的加权模糊关联规则挖掘算法(Weighted fuzzy association rulesbased on data-driven fuzzy c-means,DD-FCMW)。该算法不依赖于专家给定的隶属度函数,并解决了由加权关联规则带来的向下封闭性不成立的问题。实验结果表明DD-FCMW算法相比传统的加权关联规则算法可以产生更多的频繁项集,该算法适用于包含布尔型和数值型数据的大型数据库的挖掘,算法具有良好的性能和可伸缩性。
其他文献
由于煤矿底板突水成因较为复杂且受诸多因素的影响,而且有着较为复杂的非线性的动力特点,其已成为矿井开发中最为严重的一种地质灾害,给煤矿的安全生产带来极大的安全隐患,因
线粒体电压依赖性阴离子通道(voltage-dependent anion channel,VDAC)是存在于线粒体外膜上的一系列孔道蛋白,其亚型之一VDAC1参与线粒体通透性转换(MPT)孔道的功能发挥,调控阳离
一、我国乳腺癌发病趋势在世界范围内,不同的种族与地区乳腺癌的发病率有明显的差异。发达国家的发病率高,而且以美国白人妇女最高,亚洲妇女发病率最低。在大多数国家,从上世
【正】上期写到"1851点为本次下跌目标位。期间如果有反弹,理论上在1945点一线,反弹时间一般不会超过2周,敬请各位朋友空仓等待!"首先更正一个小错误,理论上应该在1987一线,
期刊
体育高考术科考试是国家为选拔优秀体育人才,培养相关体育专门人才而设立的考试。体育高考术科考试在评价考生身体素质水平的客观性和一致性方面具有较高的权威性,是全国体育
<正> 作家和艺术家,这是人世间多么迷人的职业啊!对于真正的作家艺术家来说,他最大的幸福不在鲜花、稿酬和名声,而在于创作本身。当代旅美中国作家於梨华说:“一个作家最大的
目的探讨关节镜下肘关节松解术治疗肘关节僵硬的临床疗效。方法沈阳军区总医院骨科2014年10月至2016年2月收治因外伤致肘关节僵硬需行松解术患者34例,其中失访3例,最终31例纳
教材认为:阴虚燥热为消渴病理特点,其病变脏腑在肺、胃、肾,并以肾为主。消渴病宗"三消"分型,养阴清热,生津除消为治疗消渴病的大法。但实际上消渴病之病理特点应为精微不得
采用Plant CARE和PLACE软件分析预测水稻Os05g0442400基因启动子序列中可能存在的顺式作用元件.结果显示,在起始密码子ATG上游1500bp区域内,除了启动子基本的核心作用元件外,
应用院内制剂小儿咳喘贴治疗咳嗽变异性哮喘 ,临床观察 1 5 6例 ,取得了较满意的疗效 ,总有效率达 91 %。