【摘 要】
:
数据挖掘是技术是上世纪九十年代国内外迅速发展起来的一门学科,涉及到人工智能、统计学、机器学习、数据库等多个领域。 数据预处理是数据挖掘(知识发现)过程中的一个重要
论文部分内容阅读
数据挖掘是技术是上世纪九十年代国内外迅速发展起来的一门学科,涉及到人工智能、统计学、机器学习、数据库等多个领域。 数据预处理是数据挖掘(知识发现)过程中的一个重要步骤,通过对工业企业的数据库系统中含有噪声、不完整、甚至是不一致的数据的处理可以提高数据挖掘对象的质量,并最终达到提高数据挖掘所获模式知识质量的目的。 本文基于天津乙烯裂解炉产生的工业时序数据,研究并分析了时间序列数据的预处理相关工作。首先讨论了流程工业数据数据特点以及时序数据研究的内容。然后采用最大值填充空缺数据、平均值填充空缺数据、插值填充空缺数据、分箱法去除噪声和数据压缩以及分段线性数据处理的方法实现了对原始工业数据进行了空缺填充、噪声去处和数据压缩等工作。采用缓冲区的概念重点研究并实现了工业时序数据在线实时数据处理的要求。接着利用处理好的数据进行了聚类等数据分析工作,验证了工作的有效性。最终基于J2EE技术开发出工业时序数据应用系统。
其他文献
新疆整体经济发展水平在全国处于较落后水平,但新疆农业,尤其是特色农业在全国具有比较优势,如何形成这些特色农产品优势及集聚效应,是本选题的初衷。本选题研究的技术路径是沿着
目的分析研究云南白药和宫血宁在防治妇女放置宫内节育器后阴道流血的临床疗效和医疗费用。方法将自愿接受放置宫内节育器TCu380的妇女,按手术顺序随机分为两组,每组150名,分
乡镇农业推广机构改革是促进社会发展的一场任务艰巨的深层次革命,改革的重点在于明确机构职能,提高工作人员的福利保障,调动农业推广人员的工作积极性,以推动农业的发展,改
中国保险市场的现状、问题与前景国家经贸委综合司司长马建堂一、中国保险市场发展现状随着经济体制改革和对外开放的进行,同其它金融市场一样,中国的保险业和保险市场也有了长
随着会计舞弊事件和我国上市公司治理结构缺陷的不断曝光,我国资本市场中的公司治理结构和会计信息质量问题开始受到越来越多的关注。而上市公司治理结构与会计信息质量之间是
目的观察分析我院肿瘤患者静脉输注化疗药物外渗的发生情况,探讨影响药物外渗的因素,并提出相应的护理对策。方法从2010年1月~2010年12月的肿瘤患者中筛选出60例发生药物外渗
目的探讨经纤维支气管镜局部灌洗治疗急性肺脓肿的临床疗效。方法将2005~2010年收治的43例急性肺脓肿患者随机分为两组。对两组患者均进行敏感抗生素等一般治疗,治疗组患者在
本文在大量文献研究和实证研究的基础上,对社区旅游进行了系统研究。首先,对社区、旅游社区、社区旅游等概念进行了界定,并分析了社区旅游与社区参与旅游发展两个概念之间的
冷战后,俄罗斯在与西方国际体系的互动过程中,由于其利益诉求得不到足够的满足,从而对该体系产生抵触、敌意与愤怒。为了获得西方国家的关注与尊重,俄采取对内加强"俄罗斯思
近年来国内外层出不穷的“会计丑闻”和社会广泛存在的政府官员、国有控股企业和国有商业银行高级管理人员贪污、腐败案件,引起人们对内部控制系统的重视。内部控制是现代企业