论文部分内容阅读
依靠直觉进行盲目决策,是很多企业领导者容易跌入的坑。如今,大数据为这一风险提供了规避途径,日益受到企业青睐。谷歌内部正用数据进行“即时预报”,比如根据6月份的第2周汽车销售的查询数量,预测出几周后发布的6月汽车销售报告。
亚马逊申请了一项包裹运输预测系统的算法专利,它根据消费者的网站停留时间、商品浏览时间、点击及停留的链接和愿望清单等,来预测他的购买情况,从而尽可能减少运输、库存和供应链成本。
麻省理工斯隆管理学院教授安德鲁?麦卡菲(Andrew McAfee)甚至建议,人类应该尽量减少对经验判断的依赖,更多地依靠数据驱动型硬性算法的结果。他认为,大量研究表明,在“混乱、复杂、真实”的环境中做出判断时,基于数据的算法比专家更有可能做出正确的预测。
这股迷信浪潮近年来愈演愈烈,忠实的追随者前仆后继,同时也有一群激愤的反对者逐渐出现。
之前,“大数据之父”舍恩伯格就曾表示,“如果对大数据解读得过度,实际上就是滥用数据”。Thinkers50奖得主、管理学者马丁?林斯特龙(Martin Lindstrom)也提出:“目前我们面临的问题是,商业世界已经完全被大数据给蒙蔽了。”
谷歌对流感趋势的分析就是一个典型事例。
谷歌依据自己的搜索结果,推测11%的美国人都患了流感。然而事实证明,庞大的搜索量很大程度上受到社交媒体造势的影响,谷歌高估了2013年年初的流感趋势。美国东北大学的大卫?拉泽(David Lazer)领导的研究团队指出:“谷歌的方法是在5000万个搜索词中,找到适合的1152个数据点。”而在此过程中,与“流感”相匹配、但实际上与此无关的搜索词出现概率“相当高”。
学界将数据预测失败主要归纳于两个方面的原因——
1.对历史数据的过度信赖
所有预测的好坏,都取决于管理者所运用的历史数据。然而现实中,创新性业务或新产品是没有先例可循的。历史数据即使有,也不可靠——手机品牌商虽然拥有手机购买和使用体验等方面的大量历史数据,但手机的类别已经今非昔比。
2.管理者总是怎么方便怎么选
对于一些很重要、但不方便采集的数据,人们常常会选择性忽视。很多专家学者认为,如果金融机构将采集的范围扩大,也许可以避免2008年金融危机的发生。
此外,企业的大数据研究,已经成为一场军备竞赛。Facebook花了将近4年时间,才建立了一个超过30人的数据团队,而维持该平台的常规运行需要超过100名数据分析专家,LinkedIn公司建立起自己的大数据部门用了整整6年时间。这显然不是每一个普通公司都可以承担的。
这样看來,数据可以很好地预测一些事情,比如去某地度假是否会下雨、鸟类是否会以预定的途径迁徙。然而我们却很难准确预测出股价走势、有多少人会买一款新型汽车、鼓励健康饮食是否能达到理想的效果。
本书提出了一个新观点。它认为数据本身没有错,数据预测的两极化效果,主要在于简单系统和复杂系统的区别:“简单系统,是用一个模型就可以把握所有或大部分变化的系统……而复杂系统内部,则有许多以非线性方式相互作用的因素。”
因此,企业必须将大数据拉下神坛,不能依靠它来应对不确定性,而应该采取灵活而广泛的战略——即便有一部分规划可能会失败,而另一部分则有可能成功。管理者需要确定,大数据在哪些情况下有效,而在哪些情况存疑,并将精力投身于灵活战略的建设中来。
亚马逊申请了一项包裹运输预测系统的算法专利,它根据消费者的网站停留时间、商品浏览时间、点击及停留的链接和愿望清单等,来预测他的购买情况,从而尽可能减少运输、库存和供应链成本。
麻省理工斯隆管理学院教授安德鲁?麦卡菲(Andrew McAfee)甚至建议,人类应该尽量减少对经验判断的依赖,更多地依靠数据驱动型硬性算法的结果。他认为,大量研究表明,在“混乱、复杂、真实”的环境中做出判断时,基于数据的算法比专家更有可能做出正确的预测。
这股迷信浪潮近年来愈演愈烈,忠实的追随者前仆后继,同时也有一群激愤的反对者逐渐出现。
之前,“大数据之父”舍恩伯格就曾表示,“如果对大数据解读得过度,实际上就是滥用数据”。Thinkers50奖得主、管理学者马丁?林斯特龙(Martin Lindstrom)也提出:“目前我们面临的问题是,商业世界已经完全被大数据给蒙蔽了。”
谷歌对流感趋势的分析就是一个典型事例。
谷歌依据自己的搜索结果,推测11%的美国人都患了流感。然而事实证明,庞大的搜索量很大程度上受到社交媒体造势的影响,谷歌高估了2013年年初的流感趋势。美国东北大学的大卫?拉泽(David Lazer)领导的研究团队指出:“谷歌的方法是在5000万个搜索词中,找到适合的1152个数据点。”而在此过程中,与“流感”相匹配、但实际上与此无关的搜索词出现概率“相当高”。
学界将数据预测失败主要归纳于两个方面的原因——
1.对历史数据的过度信赖
所有预测的好坏,都取决于管理者所运用的历史数据。然而现实中,创新性业务或新产品是没有先例可循的。历史数据即使有,也不可靠——手机品牌商虽然拥有手机购买和使用体验等方面的大量历史数据,但手机的类别已经今非昔比。
2.管理者总是怎么方便怎么选
对于一些很重要、但不方便采集的数据,人们常常会选择性忽视。很多专家学者认为,如果金融机构将采集的范围扩大,也许可以避免2008年金融危机的发生。
此外,企业的大数据研究,已经成为一场军备竞赛。Facebook花了将近4年时间,才建立了一个超过30人的数据团队,而维持该平台的常规运行需要超过100名数据分析专家,LinkedIn公司建立起自己的大数据部门用了整整6年时间。这显然不是每一个普通公司都可以承担的。
这样看來,数据可以很好地预测一些事情,比如去某地度假是否会下雨、鸟类是否会以预定的途径迁徙。然而我们却很难准确预测出股价走势、有多少人会买一款新型汽车、鼓励健康饮食是否能达到理想的效果。
本书提出了一个新观点。它认为数据本身没有错,数据预测的两极化效果,主要在于简单系统和复杂系统的区别:“简单系统,是用一个模型就可以把握所有或大部分变化的系统……而复杂系统内部,则有许多以非线性方式相互作用的因素。”
因此,企业必须将大数据拉下神坛,不能依靠它来应对不确定性,而应该采取灵活而广泛的战略——即便有一部分规划可能会失败,而另一部分则有可能成功。管理者需要确定,大数据在哪些情况下有效,而在哪些情况存疑,并将精力投身于灵活战略的建设中来。