面向健康大数据的数据清洗技术

来源 :现代计算机(专业版) | 被引量 : 0次 | 上传用户:hcyzhcyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一套完整的健康大数据清洗方案。首先剔除原始数据集中的重复数据,然后,对数据集进行完整性、有效性及一致性验证,最后,使用基于密度的改进孤立点检测算法剔除局部孤立点及全局孤立点。为验证所提方案的有效性,使用Tri-training算法在健康大数据集上进相关实验。实验表明,所提数据清洗方案能够同时识别局部孤立点和全局孤立点,从而显著提高后续数据分类模型的性能。
其他文献
多径衰落是移动信道的主要特征,可以利用相干接收来克服它的影响,提高系统的接收性能,为了进行相干接收,必须要估计出衰落信道的时变参数。本文在传统算法的基础上提出对自适
<正>众所周知,解几题历来是高考题中区分度较高的题目.追其原因,笔者以为与教师在高三复习中忽视解几题与平几的深厚渊源不无关系.基于此,本文拟结合近年的高考和高中联赛中
<正>6月18日,记者来到昆明广福路上,一幢灰色建筑映入眼帘,与周围房屋融为一体,看不到任何输电线路,也没有听到嗡嗡声,几乎没有人知道,它是一座变电站。这就是刚刚投运的昆明
中华传统文化是中华民族宝贵的文化遗产。作为民族文化的重要载体,高中语文教材中包含着优秀的中华传统文化。语文教师要在教学的过程中,积极探索弘扬传统文化的途径,通过课
【正】2013年初,国家广电总局发布了《关于促进主流媒体发展网络广播电视台的意见》文件,为了进一步促进网络电视台的发展,中国广播影视社会组织联合会技术工作委员会等单位
本文对人为噪声容差的计算方法进行了研究,给出了VHF频段数字音频广播系统覆盖最小中值场强的计算步骤,为中国数字音频广播系统覆盖规划和相关标准的制定提供了技术依据和参
伴随着城市的发展,通常会出现自然和社会灾害,在危机来临时如何保持自身发展的活力,是现代城市设计者应该思考的一个重要问题。绵阳市朝阳片区的城市发展正面临着这些问题,因
<正> 一、对需求价格弹性分析 需求价格弹性是指:一种产品市场价格的相对变动所引起的需求量的相对变动的程度,即某需求量的变化率与价格变化率之比: 式中:Q为需求量的绝对量
<正>一般认为"经典"要具有原创性、独创性。当然,如果文本只具备原创性不一定就能成为经典。因为除了文学性因素,非文学性因素在塑造经典的过程中也起着不可忽视的作用,这其
本文运用2009-2013年县一级的数据,研究了转移支付的财力均等化作用。分析结果表明现行的转移支付制度在县级层面上确实起到了财力均等化作用。经过转移支付之后,人均一般预