【摘 要】
:
实际应用中获取到的数据通常是动态更新的,且随着数据观测工具的快速发展,数据库中数据更新的速度也越来越快,同一时刻更新的规模也越来越大.面向动态数据集的数据挖掘研究中
【机 构】
:
山西大学计算机与信息技术学院; 山西大学计算智能与中文信息处理教育部重点实验室;
【基金项目】
:
国家自然科学基金项目(61402272)资助;山西省科技基础条件平台建设项目(2012091002-0101)资助;山西省科技攻关项目(20110321027-01)资助;山西省煤基重点科技攻关项目(MQ2014-09)的资助
论文部分内容阅读
实际应用中获取到的数据通常是动态更新的,且随着数据观测工具的快速发展,数据库中数据更新的速度也越来越快,同一时刻更新的规模也越来越大.面向动态数据集的数据挖掘研究中,数据库中数据取值的动态更新也是一种数据集动态变化的类型.特征选择是一种有效的数据预处理工具,面向数据取值动态更新的特征选择方法也已经引起了众多研究者的广泛关注.为此,基于粗糙集理论和信息熵的概念,提出一种面向数据取值动态变化数据集的特征选择方法,可一次处理一组取值发生变化的数据.算法中首先分析了信息熵随数据取值动态变化的更新机制,以信息熵作为特征重要度的度量,设计了基于信息熵的粗糙特征选择算法.实验结果进一步验证了新算法的可行性和高效性.
其他文献
<正>引言:在杭州一群当代艺术创作者近年来相继选择以影像语言作为主要的创作方向,近年来关注录像艺术语言的群体越来越庞大,人数上的递增是离不开中国美术学院这些年的关注
近年来,对职务犯罪的预防受到越来越多的重视。“侦(查)(预)防一体化”日益成为检察机关处理职务犯罪案件的大趋势。但在具体的实践中,由于反贪、反渎、预防三部门的工作特点
本文基于对北京主要跨国公司研发机构的问卷调查数据,运用定量分析结合定性分析的方法,对跨国公司在华设立研发机构的动因进行鉴别,总结归纳了跨国公司在华研发机构的不同战
面对我国人多地少、人地矛盾突出的国情,对生产建设中被损毁耕地开展复垦工作是非常必要和紧迫的,而做好耕地复垦工作,关键是要运用耕地适宜性评价体系,得出耕地的适宜性等级,从而
本文分析了休闲业的发展趋势,研究了休闲业和旅游业的关系;在剖析上海市休闲业现状和存在问题基础上,探讨了休闲和旅游业的互动整合战略,提出了发展上海休闲旅游业的对策建议
基于基础理论研究分析各种缓和曲线线型的几何及物理特征,结合国内外研究成果及运用实践,给出缓和曲线线型选择及长度标准确定的原则。
英语实践活动是通过营造真实的英语文化环境和语言环境,以活动为载体,以交际为主题,利用各种教学资源,采用听、做、说、唱、玩、演的方式,为学生提供充分的语言实践机会,让学
肿瘤细胞比正常细胞具有更强的增殖能力,为满足其快速增殖,肿瘤细胞内DNA复制非常活跃,是肿瘤化疗药物的主要靶点。临床上普遍应用的肿瘤化疗药物多属于DNA毒性药物,如阿霉素
转自:科学松鼠会http://songshuhui.net/archives/80683标签:原创短波电台拜信息技术所赐,当前的个人通信已经达到相当高的水平,通话、短信、QQ、微信等基于手机的通信手段毫无