重复数据中关键属性值缺失填补的改进ROUSTIDA算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:fendoudeying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据分析研究的兴起,数据预处理越来越得到研究者的重视,其中缺失数据填补问题的重要性也逐渐显现。在ROUSTIDA数据补齐算法的基础上,针对具有关键属性的重复数据的特点,文中提出了一种改进的ROUSTIDA算法——Key&Rpt_RS算法。Key&Rpt_RS算法继承了ROUSTIDA算法的优势,同时考虑了目标数据的重复性特点,分析了关键属性对填补效果的影响,得到了更加准确且有效的填补结果。
其他文献
近几年的高考虽然不考划分句子成分,但是,划分句子成分对于高考的各种题型的解答都有十分重要的作用,下面就文言文翻译题为例来进行讲解。
从科学思想的角度,对<管子>与<礼记&#183;月令>的阴阳五行说、物候思想、农时思想和生态思想进行比较可以看出,二者由许多共同之处,这可以为所谓"<月令>出于<管子>"提供重要
【目的】探究八段锦在预防老年肌少症人群跌倒中的应用效果。【方法】采用随机对照试验设计,选择符合纳入和排除标准的40名肌少症患者作为研究对象,将其分为八段锦练习组(实
随机测试是一种广泛应用于实践的基础测试方法。自适应随机测试(ART)是对随机测试的改进,其检错有效性优于随机测试。首先,分析了具有较高检错有效性但时间开销较大的经典ART算法;其次,重点综述了能降低时间开销的基于划分的ART算法,并对各种划分策略和测试用例生成算法进行了分析和对比;同时,分析了影响ART算法有效性的关键因素以及高维输入域空间中算法有效性低下的问题,梳理了算法有效性度量指标以及测试用
“薄荷糖女孩”入口很甜,但含久了透心凉,没有乱七八糟的欲望,永远保持着头脑清醒。这不正是“任是无情也动人”的薛宝钗吗?知乎上有一个用户在讨论“生性凉薄的人是怎样的”
本文把清代解读<诗经&#183;齐风>的经学家分为&#39;注重考据的传统派&#39;和&#39;反传统的思辨派&#39;.&#39;传统派&#39;解读<齐风>重考据、训诂,遵从<毛序>,代表人物有胡承
伴随着我国科学技术的蓬勃发展,我国已经逐渐进入了信息化时代。目前我国的多媒体信息技术也已经逐渐融入了社会的各个领域之中,并且信息化技术也已经渗入到了高校的图书管理
国际橄榄球联合会2001年颁布施行了新规则,新规则在以前的规则上做了一些修改,旨在使比赛更精彩激烈,节奏更快,运动员更为安全,这一改变将会对橄榄球的技术、战术产生影响.本
通过访问调查法、文献资料研究法对当前普通高校开设田径选项课所面临的困境加以分析,并提出了相应的对策.
随着公安教育的深化改革,警体教学的改革也迫在眉捷,二十世纪八九十年代的警体教学模式,已无法适应当前公安实践的要求,随着法律的不断健全完善,罪犯特点的暴力性、突然性、