论文部分内容阅读
摘要:随着经济的发展,经济统计数据的逐渐加大,数据质量问题进一步影响着经济探究、总结与决策。传统的数据处理方式越来越不能满足现实需要,给经济工作带来一定困难,正是由于这一系列问题的出现,而逐步产生了对数据的挖掘。本文就数据挖掘技术怎样、如何在经济统计中进行应用进行了相关介绍,为经济统计工作作出了一定的贡献。
关键词:数据挖掘;经济统计;技术;应用
中图分类号:C811 文献标识码:A 文章编号:1001-828X(2013)06-0-01
一、数据挖掘技术的基本概念与产生过程
随着信息技术的发展,采集的数据量的急剧加大,此时产生了数据挖掘,它就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在对大量的数据进行抽取、转换、分析和其他模型化处理过程中,从而提取得到对一些决策数据的支撑。
数据挖掘是一个由数理统计到人工智能,进而到机器学习的逐步演变、变化过程。它是一门交叉的学科,是一门涉及广泛的学科,是一门在社会的发展历程中不断前进变化的学科。它所涉及到的内容包括数据库技术、人机智能、知识库系统、知识获取、神经网络、统计学、模式识别、信息检索等,并且在跟着发展的需要、学科的进步变化而不断发展、向前。
由于数据量之大,传统的统计分析方法主要是对没有明确假设的前提下去挖掘信息,只会使得效率低下,同时,对于问题的解决也在大打折扣,处理的结果不理想,传统的这种方法没有找到数据之间的内在联系,这样只是看到过去,不能很好的预测未来,对所要探索的目标不能得出想要的结论;而数据挖掘是将所得到的信息是对前者的补充,得到未知的潜在的东西,是在原有的基础上发现那些没法预料的、不是靠感官所能察觉的,甚至是一些与生活所违背的,它更是人工智能和统计分析的结合,是对传统技术的进一步拓展,由于对数据分析要求的进一步提高,也正是这一些特征才使得数据挖掘的结果而更加有意义与价值。
二、数据挖掘的相关技术与在经济统计中的应用
正是由于对于数据的大量收集、先进的计算机技术、数据算法的产生、超大规模数据库的出现、数据访问速度的提升、对数据进行精深统计方法计算的能力等等一系列东西的出现,从而一步步使得数据挖掘技术的作用越来越广泛。对于经济统计准确性与实用性的需要,数据挖掘技术才开始慢慢渗透到经济统计工作中。数据挖掘技术的主要方法有:
统计分析方法,数据库字段项之间存在两种关系,函数关系和相关关系,即能用函数公式表示的确定性关系与不能用函数公式表示,但仍是相关确定性关系。即利用统计学原理对数据库中的信息进行分析。
神经网络方法,是一种模拟人脑信息加工过程的智能化信息技术。就像人的神经网络的过程一样,经过输入、分析、输出的过程,而在经济统计过程中得到实际应用。它为我们提供了一种完整的、准确的处理过程,使得经济运行模式就像人在接受处理信息的过程一样而形象化、具体化、实用化,更好地取得经济过程中各个部分之间的联系,从而获得对经济问题的分析,获得处理办法。
决策树是一种用于预测模型的算法,是基于统计理论的非参数识别技术,通过对大量数据的有目的分类,找到有价值、潜在的信息。正是由于分类速度快,描述简单,特别适合对经济运行过程中出现的大规模数据的处理工作。
粗集理论的方法,是一种研究不精确、不确定知识的数学工具,是通过对上下近似集来出来不确定问题。它算法简单,易于操作;不需要给出额外信息;简化输入信息的表达空间。对于不确定的经济因素提供了一种思维方法,正是通过这种近似原则,使得经济决策更加的与需求所接近,为最大利益化的获得给予有力支撑。
遗传算法,是一种根据生物自然选择与遗传机理的随机搜索算法,其思路是根据社会问题,在指定对象的人群中去采集信息,通过对隐含信息的整合、分析,进而得到结果。它具有隐含性、易于和其它模型结合,可以对隐含数据进行采集,而后把挖掘出的数据加以分析,进而得到应用。经济问题是一个发展变化的问题,内部有着千絲万缕的联系,参照遗传算法,我们就可以通过源头开始,一步步向下延伸,去提取数据,进行整体分析,这样就把经济问题具体化、直接化、目标化,使得问题的研究更加直观,把隐性的表现化,促使经济统计工作更加简单、直白。
三、数据挖掘流程在经济统计中的体现
定义问题,对于经济问题,要定义出所要探究的问题,确定数据挖掘的目的。1.数据准备,选择数据,数据预处理。即对所要探究的经济问题所涉及到的数据进行采集,做好前期的一些处理工作,使得数据得到简化,为后续工作的顺利进行做准备。2.数据挖掘,根据数据的类型和数据的特点选择相应的算法,利用人工智能、统计等方法,去发掘出有用的信息。3.结果分析,对上述得到的结果进行分析、评估,进而通过这一步骤去调整上面的方法,使得结果更加贴切。4.知识的运用,将得到的结果应用到实际经济问题中去,进而实现经济的良好运行与发展。
四、结束语
经济的发展结果使得各部分之间的联系更加的紧密,所包含的内容更加的复杂化,这使得经济统计工作的难度进一步加大,而数据挖掘技术就是通过发觉事物内部之间的联系、去揭示那些隐含的、潜在的、未知的但是却意义重大的东西,而使得经济统计工作能够得以有效运行。通过采用数据挖掘技术,使经济统计工作获得长足的进步,结果更加的准确,为社会经济发展、国家财富的积累起到了举足轻重的作用。
参考文献:
[1]徐辉,史.浅论数据挖掘技术及其应用[J].计算机光盘软件与应用,2012(05).
[2]王康.关于数据挖掘技术在经济统计中的应用[J].财经界(学术版),2011(05).
[3]陈凤兰.数据挖掘技术在经济统计中的应用[J].现代商业,2010(05).
[4]董欢.数据挖掘技术概述[J].黑龙江科技信息,2012(01).
[5]滕达.浅谈统计数据挖掘的方法及应用[J].中国高新技术企业,2011(27).
[6]辛金国,柯芳,李绍君,夏静波.数据挖掘技术在浙江省经济统计中的应用[J].浙江统计,2009(04).
关键词:数据挖掘;经济统计;技术;应用
中图分类号:C811 文献标识码:A 文章编号:1001-828X(2013)06-0-01
一、数据挖掘技术的基本概念与产生过程
随着信息技术的发展,采集的数据量的急剧加大,此时产生了数据挖掘,它就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在对大量的数据进行抽取、转换、分析和其他模型化处理过程中,从而提取得到对一些决策数据的支撑。
数据挖掘是一个由数理统计到人工智能,进而到机器学习的逐步演变、变化过程。它是一门交叉的学科,是一门涉及广泛的学科,是一门在社会的发展历程中不断前进变化的学科。它所涉及到的内容包括数据库技术、人机智能、知识库系统、知识获取、神经网络、统计学、模式识别、信息检索等,并且在跟着发展的需要、学科的进步变化而不断发展、向前。
由于数据量之大,传统的统计分析方法主要是对没有明确假设的前提下去挖掘信息,只会使得效率低下,同时,对于问题的解决也在大打折扣,处理的结果不理想,传统的这种方法没有找到数据之间的内在联系,这样只是看到过去,不能很好的预测未来,对所要探索的目标不能得出想要的结论;而数据挖掘是将所得到的信息是对前者的补充,得到未知的潜在的东西,是在原有的基础上发现那些没法预料的、不是靠感官所能察觉的,甚至是一些与生活所违背的,它更是人工智能和统计分析的结合,是对传统技术的进一步拓展,由于对数据分析要求的进一步提高,也正是这一些特征才使得数据挖掘的结果而更加有意义与价值。
二、数据挖掘的相关技术与在经济统计中的应用
正是由于对于数据的大量收集、先进的计算机技术、数据算法的产生、超大规模数据库的出现、数据访问速度的提升、对数据进行精深统计方法计算的能力等等一系列东西的出现,从而一步步使得数据挖掘技术的作用越来越广泛。对于经济统计准确性与实用性的需要,数据挖掘技术才开始慢慢渗透到经济统计工作中。数据挖掘技术的主要方法有:
统计分析方法,数据库字段项之间存在两种关系,函数关系和相关关系,即能用函数公式表示的确定性关系与不能用函数公式表示,但仍是相关确定性关系。即利用统计学原理对数据库中的信息进行分析。
神经网络方法,是一种模拟人脑信息加工过程的智能化信息技术。就像人的神经网络的过程一样,经过输入、分析、输出的过程,而在经济统计过程中得到实际应用。它为我们提供了一种完整的、准确的处理过程,使得经济运行模式就像人在接受处理信息的过程一样而形象化、具体化、实用化,更好地取得经济过程中各个部分之间的联系,从而获得对经济问题的分析,获得处理办法。
决策树是一种用于预测模型的算法,是基于统计理论的非参数识别技术,通过对大量数据的有目的分类,找到有价值、潜在的信息。正是由于分类速度快,描述简单,特别适合对经济运行过程中出现的大规模数据的处理工作。
粗集理论的方法,是一种研究不精确、不确定知识的数学工具,是通过对上下近似集来出来不确定问题。它算法简单,易于操作;不需要给出额外信息;简化输入信息的表达空间。对于不确定的经济因素提供了一种思维方法,正是通过这种近似原则,使得经济决策更加的与需求所接近,为最大利益化的获得给予有力支撑。
遗传算法,是一种根据生物自然选择与遗传机理的随机搜索算法,其思路是根据社会问题,在指定对象的人群中去采集信息,通过对隐含信息的整合、分析,进而得到结果。它具有隐含性、易于和其它模型结合,可以对隐含数据进行采集,而后把挖掘出的数据加以分析,进而得到应用。经济问题是一个发展变化的问题,内部有着千絲万缕的联系,参照遗传算法,我们就可以通过源头开始,一步步向下延伸,去提取数据,进行整体分析,这样就把经济问题具体化、直接化、目标化,使得问题的研究更加直观,把隐性的表现化,促使经济统计工作更加简单、直白。
三、数据挖掘流程在经济统计中的体现
定义问题,对于经济问题,要定义出所要探究的问题,确定数据挖掘的目的。1.数据准备,选择数据,数据预处理。即对所要探究的经济问题所涉及到的数据进行采集,做好前期的一些处理工作,使得数据得到简化,为后续工作的顺利进行做准备。2.数据挖掘,根据数据的类型和数据的特点选择相应的算法,利用人工智能、统计等方法,去发掘出有用的信息。3.结果分析,对上述得到的结果进行分析、评估,进而通过这一步骤去调整上面的方法,使得结果更加贴切。4.知识的运用,将得到的结果应用到实际经济问题中去,进而实现经济的良好运行与发展。
四、结束语
经济的发展结果使得各部分之间的联系更加的紧密,所包含的内容更加的复杂化,这使得经济统计工作的难度进一步加大,而数据挖掘技术就是通过发觉事物内部之间的联系、去揭示那些隐含的、潜在的、未知的但是却意义重大的东西,而使得经济统计工作能够得以有效运行。通过采用数据挖掘技术,使经济统计工作获得长足的进步,结果更加的准确,为社会经济发展、国家财富的积累起到了举足轻重的作用。
参考文献:
[1]徐辉,史.浅论数据挖掘技术及其应用[J].计算机光盘软件与应用,2012(05).
[2]王康.关于数据挖掘技术在经济统计中的应用[J].财经界(学术版),2011(05).
[3]陈凤兰.数据挖掘技术在经济统计中的应用[J].现代商业,2010(05).
[4]董欢.数据挖掘技术概述[J].黑龙江科技信息,2012(01).
[5]滕达.浅谈统计数据挖掘的方法及应用[J].中国高新技术企业,2011(27).
[6]辛金国,柯芳,李绍君,夏静波.数据挖掘技术在浙江省经济统计中的应用[J].浙江统计,2009(04).