论文部分内容阅读
摘要:大数据已经无处不在了,大数据现象正日益影响到各个工商业领域,产生了一个新兴的新信息生态系统。大数据在社会实践和理论上有巨大影响,有关大数据的应用已经渗透到各个领域中去了,受到各行各业热捧。
关键词:算法运用到海量数据;数据的挖掘;数据的开放性;数据在生活中的应用
舍恩伯格的大数据的书风靡全球,说起媒体和互联网必提大数据,似乎不说就“out”了。那什么事是大数据呢。概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4V特点:数量(Volume)、速度(Velocity)、品种(Variety)和真实性(Veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”其实,概念的界定要看研究者从哪个角度来研究它而定。
科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。”舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里談到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”[iv]用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。
问题是研究的价值基点,“大数据”不是舍恩伯格研究的问题,而是研究对象,他研究的是数据处理和信息管理问题,同时也讨论信息安全和网络伦理问题,还引发哲学上的思考,哲学史上争论不休的世界可知论和不可知论转变为实证科学中的具体问题。可知性是绝对的,不可知性是相对的。“大数据”之所以为大是因它引发人类生活、工作和思维的大变革,从这个意义上来看,《大数据时代》的意义不仅在于它讨论了若干重大问题,而且对研究者开出了一个问题清单,从而引发更多人来探讨这些有趣的问题。
《大数据时代》实际上主要是一本讨论数据挖掘的书,数据挖掘与数据分析是不同的概念,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。而数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据挖掘主要运用计算机来进行处理,而数据分析既要用计算机也要人工分析,是计算机科学与人文价值判断的统一结合。换言之,《大数据时代》并不是一本讨论大数据所有问题的书。
《大数据时代》也是一本讨论互联网发展的书,从数字化到数据化,同时有浓厚的未来学色彩。当文字变成数据,我们进入了互联网;当方位变成数据,我们进入了物联网;当沟通变成数据,我们进入了下一代互联网。一切可量化,万物皆数据,正是当今互联网世界的真实写照。面对于这样的世界及世界的未来,在《大数据时代》出现最多的词是“思维”和“方法”,因此也可以把这本书视为思维科学应用研究的书。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
有朝一日,我们就生活在大数据中。我们去逛街,我们将我们的移动通讯打开,搜索我想买的物品,附近有此物品的店子就都呈现在我眼前了。我只需要比较距离,质量,价格就可以选择去哪买了。同时我可以看看周围有什么吃的喝的玩的。我可以通过我的通讯设备了解得很清楚。还比如我逛累了找家休闲娱乐的地方休息。快要到饭点了,与此同时我搜索吃饭的地方,所有相关的饭馆都出现在我的手机屏幕上,我只需要选择就可以了。这就是大数据给我们生活带来的方便。这些数据都是通过整合,分析了的。通过互联网传输给我们的。
大数据将会被运用到很多方面,最先使用大数据的人肯定是时代的弄潮儿。他们利用大数据商业化。各个领域将会涉及到大数据。就像信息一样的。但是数据和信息又不一样。
数据与信息的关系为:数据是信息的一种表现形式,数据通过能书写的信息编码表示信息。信息有多仲表现形式,它通过手势、眼神、声音或图形等方式表达,但是数据是信息的最佳表现形式。由于数据能够书写,因而它能够被记录、存储和处理,从中挖掘出更深层的信息。但是,数据不等于信息,数据只是信息表达方式中的一种。
我们生活悄然发生着变化,涉及到生活的方方面面,让我们深有感触的就是衣食住行了。我们上网,网络上就会我们的痕迹,数据就会分析,个人的偏好,然后就会去推荐。然后自己也会去种草,比较。商家会利用大数据来找客户,发展客户,促进销售。商家也能利用大数据来开拓市场,资源不浪费。客户看数据对比,买性价比高的商品。我们出去旅游,通过大数据可以了解旅游的各种信息,出门心里有数。把旅游攻略做好,看大数据推出的网红打卡地,网红美食等等一切。不走冤枉路不花冤枉钱。旅游品质提高了。大数据功不可没。
大数据时代,我们每个人都相当于在裸奔。因此我们在试用数据的时候,我们的信息也暴露了。这就要求人们有道德底线了。我们也要保护自己的信息安全。大数据是把双刃剑,要合理合法的应用。
看了大数据后,我的脑袋是混乱的,是懂非懂。感觉既具体又抽象。总之这是一本很好的书,值得一读。
参考文献:
[1][英] 维克托·迈尔·舍恩伯格(Viktor Mayer-Sch?nberger)大数据时代.
[2][美]BILL Franks驾驭大数据.
关键词:算法运用到海量数据;数据的挖掘;数据的开放性;数据在生活中的应用
舍恩伯格的大数据的书风靡全球,说起媒体和互联网必提大数据,似乎不说就“out”了。那什么事是大数据呢。概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4V特点:数量(Volume)、速度(Velocity)、品种(Variety)和真实性(Veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”其实,概念的界定要看研究者从哪个角度来研究它而定。
科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。”舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里談到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”[iv]用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。
问题是研究的价值基点,“大数据”不是舍恩伯格研究的问题,而是研究对象,他研究的是数据处理和信息管理问题,同时也讨论信息安全和网络伦理问题,还引发哲学上的思考,哲学史上争论不休的世界可知论和不可知论转变为实证科学中的具体问题。可知性是绝对的,不可知性是相对的。“大数据”之所以为大是因它引发人类生活、工作和思维的大变革,从这个意义上来看,《大数据时代》的意义不仅在于它讨论了若干重大问题,而且对研究者开出了一个问题清单,从而引发更多人来探讨这些有趣的问题。
《大数据时代》实际上主要是一本讨论数据挖掘的书,数据挖掘与数据分析是不同的概念,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。而数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据挖掘主要运用计算机来进行处理,而数据分析既要用计算机也要人工分析,是计算机科学与人文价值判断的统一结合。换言之,《大数据时代》并不是一本讨论大数据所有问题的书。
《大数据时代》也是一本讨论互联网发展的书,从数字化到数据化,同时有浓厚的未来学色彩。当文字变成数据,我们进入了互联网;当方位变成数据,我们进入了物联网;当沟通变成数据,我们进入了下一代互联网。一切可量化,万物皆数据,正是当今互联网世界的真实写照。面对于这样的世界及世界的未来,在《大数据时代》出现最多的词是“思维”和“方法”,因此也可以把这本书视为思维科学应用研究的书。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
有朝一日,我们就生活在大数据中。我们去逛街,我们将我们的移动通讯打开,搜索我想买的物品,附近有此物品的店子就都呈现在我眼前了。我只需要比较距离,质量,价格就可以选择去哪买了。同时我可以看看周围有什么吃的喝的玩的。我可以通过我的通讯设备了解得很清楚。还比如我逛累了找家休闲娱乐的地方休息。快要到饭点了,与此同时我搜索吃饭的地方,所有相关的饭馆都出现在我的手机屏幕上,我只需要选择就可以了。这就是大数据给我们生活带来的方便。这些数据都是通过整合,分析了的。通过互联网传输给我们的。
大数据将会被运用到很多方面,最先使用大数据的人肯定是时代的弄潮儿。他们利用大数据商业化。各个领域将会涉及到大数据。就像信息一样的。但是数据和信息又不一样。
数据与信息的关系为:数据是信息的一种表现形式,数据通过能书写的信息编码表示信息。信息有多仲表现形式,它通过手势、眼神、声音或图形等方式表达,但是数据是信息的最佳表现形式。由于数据能够书写,因而它能够被记录、存储和处理,从中挖掘出更深层的信息。但是,数据不等于信息,数据只是信息表达方式中的一种。
我们生活悄然发生着变化,涉及到生活的方方面面,让我们深有感触的就是衣食住行了。我们上网,网络上就会我们的痕迹,数据就会分析,个人的偏好,然后就会去推荐。然后自己也会去种草,比较。商家会利用大数据来找客户,发展客户,促进销售。商家也能利用大数据来开拓市场,资源不浪费。客户看数据对比,买性价比高的商品。我们出去旅游,通过大数据可以了解旅游的各种信息,出门心里有数。把旅游攻略做好,看大数据推出的网红打卡地,网红美食等等一切。不走冤枉路不花冤枉钱。旅游品质提高了。大数据功不可没。
大数据时代,我们每个人都相当于在裸奔。因此我们在试用数据的时候,我们的信息也暴露了。这就要求人们有道德底线了。我们也要保护自己的信息安全。大数据是把双刃剑,要合理合法的应用。
看了大数据后,我的脑袋是混乱的,是懂非懂。感觉既具体又抽象。总之这是一本很好的书,值得一读。
参考文献:
[1][英] 维克托·迈尔·舍恩伯格(Viktor Mayer-Sch?nberger)大数据时代.
[2][美]BILL Franks驾驭大数据.