数据挖掘技术在统计预处理中的应用

来源 :湘潭师范学院学报:自然科学版 | 被引量 : 0次 | 上传用户:ljmworkshop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前统计分析面临的数据大多不再是预先设定的样本数据,而是杂乱、不规范的大规模的海量数据,所以统计分析之前进行数据预处理是非常必要的.采用数据挖掘技术,对存在空缺值、噪声数据等不规范的数据集进行清理,对海量数据进行维规约和自动产生概念分层处理,以缩小数据集的规模.经过预处理的数据集能更好地适应原有统计方法,并提高了统计质量.
其他文献
个性化定制MESMES即制造企业生产过程执行管理系统,旨在加强生产线的流程管理和控制,通过专用的数据接口,与生产线控制的设施建立起合作关系,是ERP、设备、用户之间的桥梁。
通过对人文精神的阐释,说明了体育专业学生人文教育的重要性;剖析了在体育专业学生培养过程中的人文缺失,主要体现为管理方式落后和教育者行为偏差,最后提供了对其进行人文渗透的
摘要:近年来,成人教育在中国有着长足的发展,各种教学思路层出不穷,为我们的教学工作带来方便。在语用学中预设是比较重要的一个章节,本文我运用了预设的一些理论方法来探讨成人英语教育,以期为成人英语教学提供新思路。  关键词:预设;英语教学;成人教育  语用学作为语言学的一个分支,包含了很多重要的语言研究成果,语用学中话语预设是其中一个重要的知识点。话语预设(Presupposition),即通常所说的
制造执行系统MES(Manufacturing Execution System)是实现企业生产过程中数据与信息集成化的纽带,是实施工厂车间高度自动化与信息集成化战略的重要技术。文章对如何利用VB.N
焦亡是由炎性半胱氨酸蛋白酶介导的,具有促炎效应,并伴随细胞膜破裂、细胞崩解的一种新型的程序性调控的细胞死亡方式。近年来研究人员发现,炎性Caspase的底物GSDMD蛋白是介导细胞焦亡的关键
弥漫性大B细胞淋巴瘤(DLBCL)临床进展较为迅速,属于侵袭性的恶性淋巴瘤,发病年龄偏大,多见于50~60岁的患者,对化疗较为敏感,传统治疗采用环磷酰胺+多柔比星+长春新碱+地塞米松(CHOP
目的 慢性胰腺炎(CP)是胰腺实质不可逆损伤性疾病,糜蛋白酶C(CTRC)基因改变可能与CP发病有关。文章分析四川地区汉族CP人群CTRC基因的突变情况,探讨其与临床关系。方法 采集106例
RAMI4.0提供了实体资产数字化的可行途径,为各类实体资产如何映射至虚拟环境,实现完整表达、通信、推理、判断、决策加工等,打下了坚实的基础。本文结合案例,对于RAMI4.0开发
《复变函数》是高等师范院校数学与应用数学专业及其相关专业一门极其重要的专业课。本文结合自身的教学实践,就该课程的教学改革浅谈高师院校《复密函数》课程教改的心得体
现代技术中,车牌定位是车牌识别系统中的关键步骤。为了更准确、有效的定位车牌,本文提出了一种基于颜色处理和数学形态学的车牌定位方法,首先,对于输入的车牌进行颜色特征的提取,然后进行数学形态学处理,找到车牌的具体区域,并且对于倾斜的车牌,进行车牌矫正;最后将准确定位的车牌输出。实验结果表明,此定位方式获得的车牌,准确度高,定位速度快。