论文部分内容阅读
在古代,炼金术士声称他们能将铅之类的金属变成贵重的黄金,当然这是不可能的。现在,数据科学家正在将大量数据变成信息,这些信息虽然不是黄金,但价值胜似黄金。数据科学家可以说是现代的“炼金术士”。
英国数据科学家维克托·迈尔-舍恩伯格在他的著作《大数据》中指出,今天全世界存储的信息中,书和磁带只占不到两成,多数信息都以数据形式存储在电脑硬盘、通信设备和其他数字设备中。全世界产生的数据正在以惊人的速度增长,最近两年的数据产生量就占到总数据量的90%。一家互联网研究公司预测,人类产生的数据还将以每三年翻一番的速度增长。
数据助人“抢占先机”
互联网并不是产生大量信息的唯一地方,另有大量信息是由科学家们“制造”出来的,这些信息来自于他们对大量事实的研究,而对这些事实的记录就是数据。例如,生物学家测量了成千上万个细胞,从而收集到大量数据;天文学家观测了恒星、星系和太空中的各种能量活动,从而收集到大量数据;地球科学家收集到世界各地的有关水、风和气流的资料,从而也形成了大量数据。
数据经过分析和归纳会形成有用的信息,于是人们发明了各种各样用于处理数据的计算机软件,人们利用数据做各种各样的事。例如,销售公司通过分析数据了解大众的消费行为,如人们如何用钱,什么时候花钱多,什么时候花钱少,等等。这样一来,公司就能制定更好的销售策略,从而卖出更多的商品。在美国,人们通过分析数据了解到,每当飓风来袭前,超市中的草莓糖霜果塔饼干便特别抢手,这时的销售量会比平时增加7倍,而在暴风雨天气来临前,啤酒的销售也特别好,于是超市便知道在这种时候及时补充货源,从而令销量大增。
2012年美国大选时,统计学家曾通过分析投票数据准确地预测了各个州的投票结果。对于地球科学家而言,追踪和分析天气数据更是特别重要,否则便无法准确地预报灾害性的天气变化。数据甚至能帮助人们预防疫情的爆发,起到及时采取措施防止传染病流行的作用。数据还给警察们的工作带来了方便。在那些犯罪率高的城市,以前积累下来的犯罪数据可以派上用场,警察们使用这些数据预测犯罪的高发时间和地区,从而合理地调配警力,提高工作效率和防范效果。
数据帮人解决难题
数据之所以能发挥上述作用,很重要的一个原因是它帮助我们预测了未来有可能发生的事,然而在有些领域,知道为什么会有某种事情发生显得更加重要。例如在医学领域,来自人体或者人体细胞的数据就有可能告诉医生们,某种疾病为什么会发生,从而帮助医生治疗这些疾病。
美国哈佛大学公共卫生学院的温斯顿·海德正在从事一项重要的工作:将大量来自细胞的数据转变成对生物学家有用的信息。他说:“我们很想知道某些特别复杂的疾病是由什么因素造成的。当一个人得了癌症,他的身体出了什么问题;当一个人患上严重的糖尿病,又是什么基因导致了错误。”例如,一个生物化学家收集到一种基因的数据,这种基因命令细胞产生了一种蛋白质,于是海德或者其他计算生物学家便进入数据库分析大量来自同类细胞的数据。他们发现了与这种数据相联系的某种数据模式,它不是出现一次,而是反复出现。于是,科学家们便可推断,那种蛋白质和那种反复出现的模式存在联系。假若那种模式恰恰和某种疾病,如乳腺癌联系在一起,那么科学家们就可以推测是那种蛋白质导致了乳腺癌的发生。于是,科学家们便可以发明一种遏制这种蛋白质的药物,作为征服乳腺癌的一个新的“利器”。
做一个“数据控”
科学家们还期待有一天数据能使治病变得更加高效和更具“个性化”。例如,当一个病人向医生提供了详细的数据,医生便可以将这些数据和其他病人的数据进行比较,从而依据这个病人的生活方式制定特定的治疗方案。
在未来,数据还将使教育也变得“个性化”。通过对学习过程的不间断数据采集,老师可以及时发现学生的学习问题,并提供“个性化”的教学指导。设想在一个班级里,学生们利用平板电脑或者阅读器进行阅读练习。在这个过程中,学生对陌生的和认为重要的地方都做了标注,而阅读的其他情况也作为数据通过系统传到了老师那里,如阅读用了多长时间,某个词语被学生标注了多少次,等等。分析这些数据,老师便可以发现读物的难点和学生们的兴趣点,从而有针对性地进行讲解,还可以对个别学生提供有针对性的辅导。
由此看来,做一个“数据控”会助你在很多方面成为佼佼者。迈尔-舍恩伯格说:“我希望今天和未来的每个孩子都能成为一个小数据科学家,他们对数据都很有感觉。在我们这样一个信息时代,假若你成了一个数据科学家,你便拥有了神奇的魔力,就好像中世纪的炼金术士们所声称的那样。”
【责任编辑】庞 云
英国数据科学家维克托·迈尔-舍恩伯格在他的著作《大数据》中指出,今天全世界存储的信息中,书和磁带只占不到两成,多数信息都以数据形式存储在电脑硬盘、通信设备和其他数字设备中。全世界产生的数据正在以惊人的速度增长,最近两年的数据产生量就占到总数据量的90%。一家互联网研究公司预测,人类产生的数据还将以每三年翻一番的速度增长。
数据助人“抢占先机”
互联网并不是产生大量信息的唯一地方,另有大量信息是由科学家们“制造”出来的,这些信息来自于他们对大量事实的研究,而对这些事实的记录就是数据。例如,生物学家测量了成千上万个细胞,从而收集到大量数据;天文学家观测了恒星、星系和太空中的各种能量活动,从而收集到大量数据;地球科学家收集到世界各地的有关水、风和气流的资料,从而也形成了大量数据。
数据经过分析和归纳会形成有用的信息,于是人们发明了各种各样用于处理数据的计算机软件,人们利用数据做各种各样的事。例如,销售公司通过分析数据了解大众的消费行为,如人们如何用钱,什么时候花钱多,什么时候花钱少,等等。这样一来,公司就能制定更好的销售策略,从而卖出更多的商品。在美国,人们通过分析数据了解到,每当飓风来袭前,超市中的草莓糖霜果塔饼干便特别抢手,这时的销售量会比平时增加7倍,而在暴风雨天气来临前,啤酒的销售也特别好,于是超市便知道在这种时候及时补充货源,从而令销量大增。
2012年美国大选时,统计学家曾通过分析投票数据准确地预测了各个州的投票结果。对于地球科学家而言,追踪和分析天气数据更是特别重要,否则便无法准确地预报灾害性的天气变化。数据甚至能帮助人们预防疫情的爆发,起到及时采取措施防止传染病流行的作用。数据还给警察们的工作带来了方便。在那些犯罪率高的城市,以前积累下来的犯罪数据可以派上用场,警察们使用这些数据预测犯罪的高发时间和地区,从而合理地调配警力,提高工作效率和防范效果。
数据帮人解决难题
数据之所以能发挥上述作用,很重要的一个原因是它帮助我们预测了未来有可能发生的事,然而在有些领域,知道为什么会有某种事情发生显得更加重要。例如在医学领域,来自人体或者人体细胞的数据就有可能告诉医生们,某种疾病为什么会发生,从而帮助医生治疗这些疾病。
美国哈佛大学公共卫生学院的温斯顿·海德正在从事一项重要的工作:将大量来自细胞的数据转变成对生物学家有用的信息。他说:“我们很想知道某些特别复杂的疾病是由什么因素造成的。当一个人得了癌症,他的身体出了什么问题;当一个人患上严重的糖尿病,又是什么基因导致了错误。”例如,一个生物化学家收集到一种基因的数据,这种基因命令细胞产生了一种蛋白质,于是海德或者其他计算生物学家便进入数据库分析大量来自同类细胞的数据。他们发现了与这种数据相联系的某种数据模式,它不是出现一次,而是反复出现。于是,科学家们便可推断,那种蛋白质和那种反复出现的模式存在联系。假若那种模式恰恰和某种疾病,如乳腺癌联系在一起,那么科学家们就可以推测是那种蛋白质导致了乳腺癌的发生。于是,科学家们便可以发明一种遏制这种蛋白质的药物,作为征服乳腺癌的一个新的“利器”。
做一个“数据控”
科学家们还期待有一天数据能使治病变得更加高效和更具“个性化”。例如,当一个病人向医生提供了详细的数据,医生便可以将这些数据和其他病人的数据进行比较,从而依据这个病人的生活方式制定特定的治疗方案。
在未来,数据还将使教育也变得“个性化”。通过对学习过程的不间断数据采集,老师可以及时发现学生的学习问题,并提供“个性化”的教学指导。设想在一个班级里,学生们利用平板电脑或者阅读器进行阅读练习。在这个过程中,学生对陌生的和认为重要的地方都做了标注,而阅读的其他情况也作为数据通过系统传到了老师那里,如阅读用了多长时间,某个词语被学生标注了多少次,等等。分析这些数据,老师便可以发现读物的难点和学生们的兴趣点,从而有针对性地进行讲解,还可以对个别学生提供有针对性的辅导。
由此看来,做一个“数据控”会助你在很多方面成为佼佼者。迈尔-舍恩伯格说:“我希望今天和未来的每个孩子都能成为一个小数据科学家,他们对数据都很有感觉。在我们这样一个信息时代,假若你成了一个数据科学家,你便拥有了神奇的魔力,就好像中世纪的炼金术士们所声称的那样。”
【责任编辑】庞 云