论文部分内容阅读
摘 要:随着我国社会、经济以及互联网技术的不断发展。大数据一词正在不断投入各个行业中。对于传统行业的发展,大数据的应用是一次革命性的前进。通过大数据能够极大程度地提高工作展开的效率和质量,并实现很多此前无法实现的目标。对此,在统计学发展中也要发挥出大数据的优势,积极落实大数据视角下的统计学理论创新。
关键词:大数据;统计学理论;创新研究
1.引言
从我国传统统计学的情况与大数据视角下的统计学理论创新情况来看,仍存在一些问题,主要体现在统计学的准确性、平衡性、时效性以及适用性难以保障以及统计学的数据收集成本、统计学的数据利用成本有待改善等方面 [1]。需要立足于大数据的优势,并同时继承好传统统计学的优势[2]。推动我国统计学的良性发展与可持续发展[3]。因此,本文针对问题,探讨大数据视角下的统计学理论创新。
2.统计学理论在大数据视角下的创新与变革
2.1 统计学理论在大数据视角下的样本概念深化
通常情况下认为,在统计学的工作展开中,样本是十分关键的一个环节。通过样本能够准确地反应出总体的情况,实现一部分个体的调查与实际观测。但是,在大数据的视角下,样本的概念也随着发生了转变。大数据视角下的样本主要指的是网络数据,并同时将网络数据分为静态数据与动态数据。其中静态数据指的是将已经生成好的数据呈现在客户面前。删除了过往与服务器数据库进行交互的数据部分,在客户端直接完成数据构建。对此,静态数据的样本也可理解为总体,并不需要在实际工作中再对样本的可行性进行检测了。从而降低了工作展开的成本投入,并同时提高了总体的准确性。而动态数据指的是针对一些随着时间会发生变化的数据,将总体表现为数据的总和,并改变传统的样本抽取方式,实现对相关数据的选定与分析。
2.2 统计学理论在大数据视角下的数据类型扩大
在统计学中一般情况下理解的数据多为结构化的数据。简言之是可以通过图表或是统计指标来定量的数据,或者是经过专门的设计工作中形成的定性数据。往往存在着固定的结构与标准。那么,大数据视角下的数据相对于传统数据则更为广泛。不仅仅包含了前文中谈到的结构化数据,也囊括了半结构化数据以及非结构化数据,以及异构数据。使可以进行存储与记录的一切信号变得更具多元化。同时,大数据视角下的存储方式也发生了变化,呈现出与传统数据存储方法明显的差异。对于存在固定结构与格式的,大数据可以通过大数据库实现探测信号的自动容纳。最后,在针对半结构化与非结构的数据时,大数据的分类与识别功能也是非常全面的。能够有效借助网络信息系统来达到识别目的。
2.3 统计学理论在大数据视角下的收集概念扩展
传统的统计学工作中,对数据的收集是要建立在统计分析的基础上的。包括调查方案的设计、调查流程的控制等。因此,也导致了传统统计学的效率和成本都存在缺陷。而大数据视角下的工作展开,通常会将数据收集分为三个环节。即数据预处理、数据分析以及数据存储。相对于传统的统计学而言,大数据视角下的数据选择也会更多。并在发挥数据的分析、存储以及甄别功能时,也更具可行性。但是,大数据对效率的提高,并不代表大數据不具有缺陷。大数据视角下的工作展开,仍需要进行针对性的搜集。并且在过程中,也加剧了成本与安全方面的问题。对此,在工作人员的工作展开中,要实现传统统计学优势与大数据优势的结合,进一步提高数据收集工作的效率和质量,以及减少缺陷。
3.大数据视角下的统计学发展方向与具体影响
3.1 大数据视角下带动了统计学统计质量的提高
一般情况下认为,在对统计学的统计质量进行评估时,是存在两条标准与四条原则的。其中两条标准主要是由国际数据标准SDDS制定的。而四条原则则是在两条标准的基础上,所衍生出来的准确性、平衡性、时效性以及适用性。通过以上内容进一步对统计的质量进行把控。
准确性主要体现在“真值”与估算值之间的差异。但是,通常情况下也认为,“真值”是不可知的。对此,实际工作中的目标设定也转变为将统计误差控制在可接受的范围内。以此来确保统计工作的准确性,同时对计数、人为、抽样、模型设计等环节所产生的误差进行分析。进一步掌握干扰统计准确性的影响因素。并同时对影响估算值的协方差、变动系数以及标准差进行检验。对此,在大数据视角下,由于数据本身的全面性,便能够更好地通过统计过程中人为误差的减小来提高统计的准确性。
3.2 大数据视角下带动了统计学统计成本的降低
在统计工作中,成本的投入是不可避免的。而实际统计工作中的成本主要指的是调查与统计展开中所消耗的人力、物力、财力,进而形成的成本综合。对此,本小节将从数据利用率与调查方法两个角度来对大数据视角下的统计成本降低进行分析。
其一,立足于大数据视角下的数据收集工作。传统统计学中的数据收集主要是依靠电话访问、调查问卷等方式。那么,调查工作的开展便需要依托于全国的力量,并在同时投入问卷等制作与发放成本。同时,在进行调查的时,也无法保障调查的准确性与科学性。而在大数据视角下,统计工作的展开多为借助信息网络来进行。那么,便省略了调查问卷等物品的投入,在很大程度上降低了统计的成本。同时,相对于传统的方法,大数据实效下的方法也更容易保障统计结果的准确与科学。更进一步地提高了工作展开的效率和质量。
其二,立足于大数据视角下的数据利用率。在传统统计学的工作中往往会出现统计资料过期的问题,并且尚无有效的解决方法。即便在实际的工作展开中,向其投入了大量的资金,效果仍不理想。并且开发方式的单一,以及被动的传递方式,也使得面向公众的手段比较局限,无法形成更为有效的利用。对此,在大数据视角下,首先降低了初始收集过程中的目的性。以此来延伸,可以进一步扩大数据服务的目标,进而减少了数据收集工作的重新进行。其次,大数据视角下也提高了数据的重复利用率,优化了数据的价值。最后,从成本角度出发,在个体数据获取中的成本也得到了有效控制,提高了工作展开的经济效益。
4.结论
综上所述,统计学理论在大数据视角下的创新与变革主要体现在以下几个方面。即统计学理论在大数据视角下的样本概念深化、统计学理论在大数据视角下的数据类型扩大以及统计学理论在大数据视角下的收集概念扩展等方面。同时,针对大数据视角下的统计学发展,更多也体现在了大数据视角下带动了统计学统计质量的提高以及大数据视角下带动了统计学统计成本的降低等方面。意在从多个角度出发,针对我国传统的统计学与大数据视角下的统计学理论创新实际情况。分析问题成因,找寻解决方法。制定更为科学、合理的方案策略。
参考文献
[1] 胡云霞. 大数据背景下统计学教学改革与创新研究[J]. 现代商贸工业,2018,000(035):188-189.
[2] 彭先萌. 大数据时代统计学发展研究[J]. 哈尔滨职业技术学院学报,2015,No.124(06):130-131.
[3] 中国人民大学“大数据与应用统计”研究组. 大数据时代统计学的重构与创新[J]. 统计研究,2015,32(2):3-9.
关键词:大数据;统计学理论;创新研究
1.引言
从我国传统统计学的情况与大数据视角下的统计学理论创新情况来看,仍存在一些问题,主要体现在统计学的准确性、平衡性、时效性以及适用性难以保障以及统计学的数据收集成本、统计学的数据利用成本有待改善等方面 [1]。需要立足于大数据的优势,并同时继承好传统统计学的优势[2]。推动我国统计学的良性发展与可持续发展[3]。因此,本文针对问题,探讨大数据视角下的统计学理论创新。
2.统计学理论在大数据视角下的创新与变革
2.1 统计学理论在大数据视角下的样本概念深化
通常情况下认为,在统计学的工作展开中,样本是十分关键的一个环节。通过样本能够准确地反应出总体的情况,实现一部分个体的调查与实际观测。但是,在大数据的视角下,样本的概念也随着发生了转变。大数据视角下的样本主要指的是网络数据,并同时将网络数据分为静态数据与动态数据。其中静态数据指的是将已经生成好的数据呈现在客户面前。删除了过往与服务器数据库进行交互的数据部分,在客户端直接完成数据构建。对此,静态数据的样本也可理解为总体,并不需要在实际工作中再对样本的可行性进行检测了。从而降低了工作展开的成本投入,并同时提高了总体的准确性。而动态数据指的是针对一些随着时间会发生变化的数据,将总体表现为数据的总和,并改变传统的样本抽取方式,实现对相关数据的选定与分析。
2.2 统计学理论在大数据视角下的数据类型扩大
在统计学中一般情况下理解的数据多为结构化的数据。简言之是可以通过图表或是统计指标来定量的数据,或者是经过专门的设计工作中形成的定性数据。往往存在着固定的结构与标准。那么,大数据视角下的数据相对于传统数据则更为广泛。不仅仅包含了前文中谈到的结构化数据,也囊括了半结构化数据以及非结构化数据,以及异构数据。使可以进行存储与记录的一切信号变得更具多元化。同时,大数据视角下的存储方式也发生了变化,呈现出与传统数据存储方法明显的差异。对于存在固定结构与格式的,大数据可以通过大数据库实现探测信号的自动容纳。最后,在针对半结构化与非结构的数据时,大数据的分类与识别功能也是非常全面的。能够有效借助网络信息系统来达到识别目的。
2.3 统计学理论在大数据视角下的收集概念扩展
传统的统计学工作中,对数据的收集是要建立在统计分析的基础上的。包括调查方案的设计、调查流程的控制等。因此,也导致了传统统计学的效率和成本都存在缺陷。而大数据视角下的工作展开,通常会将数据收集分为三个环节。即数据预处理、数据分析以及数据存储。相对于传统的统计学而言,大数据视角下的数据选择也会更多。并在发挥数据的分析、存储以及甄别功能时,也更具可行性。但是,大数据对效率的提高,并不代表大數据不具有缺陷。大数据视角下的工作展开,仍需要进行针对性的搜集。并且在过程中,也加剧了成本与安全方面的问题。对此,在工作人员的工作展开中,要实现传统统计学优势与大数据优势的结合,进一步提高数据收集工作的效率和质量,以及减少缺陷。
3.大数据视角下的统计学发展方向与具体影响
3.1 大数据视角下带动了统计学统计质量的提高
一般情况下认为,在对统计学的统计质量进行评估时,是存在两条标准与四条原则的。其中两条标准主要是由国际数据标准SDDS制定的。而四条原则则是在两条标准的基础上,所衍生出来的准确性、平衡性、时效性以及适用性。通过以上内容进一步对统计的质量进行把控。
准确性主要体现在“真值”与估算值之间的差异。但是,通常情况下也认为,“真值”是不可知的。对此,实际工作中的目标设定也转变为将统计误差控制在可接受的范围内。以此来确保统计工作的准确性,同时对计数、人为、抽样、模型设计等环节所产生的误差进行分析。进一步掌握干扰统计准确性的影响因素。并同时对影响估算值的协方差、变动系数以及标准差进行检验。对此,在大数据视角下,由于数据本身的全面性,便能够更好地通过统计过程中人为误差的减小来提高统计的准确性。
3.2 大数据视角下带动了统计学统计成本的降低
在统计工作中,成本的投入是不可避免的。而实际统计工作中的成本主要指的是调查与统计展开中所消耗的人力、物力、财力,进而形成的成本综合。对此,本小节将从数据利用率与调查方法两个角度来对大数据视角下的统计成本降低进行分析。
其一,立足于大数据视角下的数据收集工作。传统统计学中的数据收集主要是依靠电话访问、调查问卷等方式。那么,调查工作的开展便需要依托于全国的力量,并在同时投入问卷等制作与发放成本。同时,在进行调查的时,也无法保障调查的准确性与科学性。而在大数据视角下,统计工作的展开多为借助信息网络来进行。那么,便省略了调查问卷等物品的投入,在很大程度上降低了统计的成本。同时,相对于传统的方法,大数据实效下的方法也更容易保障统计结果的准确与科学。更进一步地提高了工作展开的效率和质量。
其二,立足于大数据视角下的数据利用率。在传统统计学的工作中往往会出现统计资料过期的问题,并且尚无有效的解决方法。即便在实际的工作展开中,向其投入了大量的资金,效果仍不理想。并且开发方式的单一,以及被动的传递方式,也使得面向公众的手段比较局限,无法形成更为有效的利用。对此,在大数据视角下,首先降低了初始收集过程中的目的性。以此来延伸,可以进一步扩大数据服务的目标,进而减少了数据收集工作的重新进行。其次,大数据视角下也提高了数据的重复利用率,优化了数据的价值。最后,从成本角度出发,在个体数据获取中的成本也得到了有效控制,提高了工作展开的经济效益。
4.结论
综上所述,统计学理论在大数据视角下的创新与变革主要体现在以下几个方面。即统计学理论在大数据视角下的样本概念深化、统计学理论在大数据视角下的数据类型扩大以及统计学理论在大数据视角下的收集概念扩展等方面。同时,针对大数据视角下的统计学发展,更多也体现在了大数据视角下带动了统计学统计质量的提高以及大数据视角下带动了统计学统计成本的降低等方面。意在从多个角度出发,针对我国传统的统计学与大数据视角下的统计学理论创新实际情况。分析问题成因,找寻解决方法。制定更为科学、合理的方案策略。
参考文献
[1] 胡云霞. 大数据背景下统计学教学改革与创新研究[J]. 现代商贸工业,2018,000(035):188-189.
[2] 彭先萌. 大数据时代统计学发展研究[J]. 哈尔滨职业技术学院学报,2015,No.124(06):130-131.
[3] 中国人民大学“大数据与应用统计”研究组. 大数据时代统计学的重构与创新[J]. 统计研究,2015,32(2):3-9.