关联规则评价方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zhoujhipanel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库中的知识发现(Knowledge Discovery in Databases, KDD)是当前人工智能、数据库技术等学科的一门十分活跃的研究领域。数据挖掘(Data Mining, DM)是KDD的一个重要步骤,是从数据中提取人们感兴趣的、潜在的、可用的知识,并将其表示成用户可理解的形式。 关联规则挖掘(Association Rules Mining)是数据挖掘的一个重要分支,用以发现所有满足最小支持度和最小可信度的强关联规则。关联规则的挖掘通常是对大规模数据进行处理,产生的规则数目较大,并且挖掘的结果不一定能真正反映现实领域的知识和满足用户的需求。因此,对挖掘结果的验证和评价是关联规则挖掘中不可缺少的环节。 现有的关联规则评价方法主要有两大类:客观评价方法和主观评价方法。客观评价方法中主要使用支持度和可信度两种评价标准。但在实际应用中,仅用支持度和可信度对关联规则进行评价是不够的。因此,有必要对支持度—可信度评价模型进行改进,增加评价标准,以挖掘出更加有效、更令用户满意的关联规则。为此,本文归纳了当前所使用的几种客观和主观评价方法,并对它们进行了比较研究。 本文所做的研究工作如下: 1、对传统的关联规则评价模型进行深入的分析和比较,并对其所存在的问题进行了讨论。 2、提出了频繁模式的新颖性概念和基于客观度量与主观度量的综合评价方法,强化了对关联规则的评价。 3、在固定支持度阈值设置基础上,讨论了可变支持度设置的方法,并进行了比较分析。 4、对自动支持度阈值设置方法展开了讨论,对有关概念进行扩展,并对有关文献中的计算公式进行了补充证明和改进。
其他文献
现在世界上很多国家已经建立起包括汽车、食品、药品等产品的全方位、较系统的召回制度,2004年3月15日我国颁布《缺陷汽车产品召回管理规定》,从2004年10月1日起开始实施。这
理论联系实际、群众路线、批评与自我批评这三大作风是我党长期革命建设实践的经验总结,是我党坚持理论创新、永葆革命生机的保证。60年前召开的中共七大正是党的三大作风成
初中阶段数学教学应给学生创设“自主探究”的数学课堂,着重发展学生的逻辑思维,引导学生整体思考数学问题,使学生思维能力得到全面发展.
实施创业教育,培养创业型人才是发展社会主义市场经济的迫切需要,也是高等教育大众化的内在要求。深入探析大学生思想政治教育与创业教育的内在联系,积极探索在大学生思想政治教
摘 要:有关山林生态环境的优化,荒山造林绿化发挥着至关重要的作用,而且和我国提倡的可持续发展理念相符。对此,着眼于侧柏相关栽植技术,简要分析了其在荒山造林中的具体应用及要点。  关键词:侧柏;栽植技术;荒山造林;应用  文章编号: 1005-2690(2020)20-0076-02 中图分类号: S791.38 文献标志码: B  侧柏是常见的一种绿化树木,由于其具有较耐旱、寿命长等优势
当今城市现代化不断在升级,一些蕴含城市发展历史文化的旧工业厂房因城市结构的布局而被空置,将其推倒再建设新的建筑物并不是最妥善的处置方法,成功的改造成新的公共建筑,可
改革开放以来,随着国民经济的迅速发展以及社会主义市场经济的逐步完善,城市居民的生活水平得到明显提高,但同时贫富差距也在逐步扩大,而随着土地、住房、福利等方面的改革,城市居
<正>章草的得名,一说为"汉齐相杜伯度援藁所作,因章帝所好,名焉",一说是汉章帝命杜度奏事而用的书体,另一说则为史游以草书书写《急就章》。自二十世纪初出土的汉晋简牍可知,
城镇空间结构是区域内外自然、社会和经济多种因素长期综合作用的产物。新疆作为我国一个相对独立的经济区,由于独特的干旱区自然地理背景,绿洲经济、多民族的聚居与融合及西域
“双性同体”这一源于母系社会时期的思想,体现了远古人类朴素的性别平等意识。但由于父权制度的确立,“双性同体”思想逐渐从主流文化中隐退。后来精神分析学家弗洛伊德及心理