【摘 要】
:
关联规则挖掘算法通常生成大量的规则,但由于资源的限制,只有少量规则可能被筛选出来使用。因此关联规则的兴趣度评价成为数据挖掘领域中的一个重要问题。考虑到关联规则兴趣
【基金项目】
:
国家自然科学基金资助项目(70871015), 国家高技术研究发展计划(863计划)资助项目(2008AA04Z107)
论文部分内容阅读
关联规则挖掘算法通常生成大量的规则,但由于资源的限制,只有少量规则可能被筛选出来使用。因此关联规则的兴趣度评价成为数据挖掘领域中的一个重要问题。考虑到关联规则兴趣度评价本质上是一个多属性决策问题,本文首先基于关联规则的客观兴趣度度量和用户的主观偏好,建立了关联规则评价指标体系;然后提出一种基于组合评价方法的关联规则评价的框架及其具体实现步骤,以解决多种评价方法评价结果不一致的问题;最后以某超市购物篮数据分析为例,基于整体差异的组合评价方法实现了关联规则的组合评价以验证所提评价方法的可行性和有效性。
其他文献
文献特征共现分析可以揭示文献的内容关联和特征项隐含的寓意。基于2-模网络模型探讨不同特征共现的分析方法,有利于挖掘不同特征共现网络的深层次结构关系。通过构建2-模网络
近年来XML凭借其自身的简单性、半结构化、可扩展性、自描述性等特点,逐渐成为了互联网数据表示和数据交换的标准.XML文档聚类是数据挖掘研究中热点一个,为网络信息资源的搜
KNN算法是文本分类中广泛应用的算法。作为一种基于实例的算法,训练样本的数量和分布位置影响KNN分类器分类性能。合理的样本剪裁以及样本赋权方法可以提高分类器的效率。提出
本研究选择“香港政府一站通”和“首都之窗”两个网站作为政府网站可用性测评实验的对象,采用标准的可用性测试方案“CIF标准”展开实验。在测试实验中,首先为参加测试的人员
目的:分析妇产科病历中常见问题出现的原因,讨论针对此类问题的管理策略,以提升病历质量管理。方法:于2017年8月~2018年8月随机抽取医院妇产科存档的病例310份,病历包涵产妇体
采用开放协同编辑模式的维基百科,其内容的精确性一直受到人们的质疑。除了极少部分被维基百科认定为高质量文章外,维基用户很难判断其余大部分文章的质量。对此,本文将维基百科
确定一定数量的高频词是识别研究热点的基础性工作,但是目前对于如何确定高低词频的分界点还缺乏客观的、行之有效的方法。本研究以2002~2011年收录入Web of Science SCI中934
社会化标注系统近年发展迅速,伴随出现的垃圾标注泛滥现象不容忽视。本文以社会化标注系统中标签检索质量为研究对象,细化普通用户标注行为,建立社会化标注模拟系统,明确定义