探寻数字边界

来源 :商界评论 | 被引量 : 0次 | 上传用户:QB582
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  大数据必会深刻地改变这个世界,这点毋庸置疑,但从很多当下的讨论来看,大家似乎在大数据的使用边界上走入了误区。因此,我想具体探讨下大数据能干什么以及不能干什么的原则问题。
  人们总是想预测未来,因为这样的经济收益会非常大,作为结果就经常看到大数据与票房预测的故事,有时准,有时不准。
  大数据确实可以用来做预测,但是有能力边界的,影响这个能力边界的关键因素就是索罗斯经常说的反身性。反身性说的是:参入者的思维与参入的情景之间相互联系与影响,彼此无法独立,认知与参入处于永远的变化过程之中。反身性之所以对预测有影响,是因为它会导致不连续的变化出现。
  这在逻辑上很好理解,当一件事物是连续变化的,你就比较容易计算出它未来的状态。比如汽车,我们只要知道它的速度,那就比较容易预测它下一刻的位置。但如果是充满突变的混沌系统,这种预测就很难实现。汽车本来开得好好的,突然天上掉下一架飞机来,那它当然不会出现在本来预测的那个位置。
  所以做预测,第一关键是这个系统是不是一个混沌系统,在充满偶然的混沌系统里,基于数据的预测是无效的。而反身性正是导致混沌蝴蝶会出现的一个关键因素。
  当我们去观察某个系统并采取行动时,系统本身会因为我们的观察和行动发生改变,这就是反身性。而当每个人都这么做时,被观察和操作的系统就会变成混沌系统。金融市场已经充分说明了这点,如果大数据在预测上没有边界,那只要掌握了大数据的应用技巧,在金融市场上就没人不会赔钱。但显然这是不可能的,最多是不同人输赢的概率不同。
  容易预测的与不容易预测的
  如果一种现实更多依赖于某些不易改变的因素,比如一种文化传统、一种生物特性,那这种现实是容易被预测的;如果一种现实更多依赖于可被瞬间改变的因素,比如人们的心情,这种现实是不容易预测的,甚至是不可预测的。
  具体来讲,人们生病后会检索自己的相关症状,而传染病会扩散,因此Google那种监测传染病暴发区域,以及预测其可能扩散路径的大数据使用方式是极为有效的。在这里反身性并不起太大作用。
  但股票就不行,因为你在预测,别人也在预测,買家和卖家的行动又不一致,这就会使股票市场成为混沌系统。究竟怎么样才能用大数据预测到国内这波股票的上涨呢?
  同传染病和股票市场相比,电影票房的可预测性则在两者之间这其中有必然性支撑。比如基本上很差的电影很难有好的票房,但偶然性影响也很大,你不好预测是哪个点戳到了人们的那个神经,它突然就变火了。谁能预测泰囧的10亿元票房呢?所以我的判断是,在票房预测上,不管大数据怎么发展,它始终会处在时灵时不灵的状态,因为这根本不是技术问题。总结来看,反身性作用越大的领域越不容易预测,反之则预测的帮助会比较大。
  监测与预测
  在预测上大数据必须面对自己的边界问题,但在监测上大数据的威力是无远弗届的。
  我们这个世界的数据化程度一定会越来越高,当我们在社交网络中活动时,其实就是我们个人在不停数据化的过程,我们的偏好、关系、每日活动等正在源源不断地数据化中,如果可穿戴设备、智能家居发展起来,那数据化的东西就会更多。
  互联网正在生成一个与现实世界并行的很像黑客帝国的意识空间,而这个意识空间是数据化的。理论上讲,在这个空间里不存在信息不透明这回事,空间和时间不再成为阻隔信息流动的障碍。所以不管你喜欢不喜欢,在数字化面前每个人正在变成透明人,也就是100%可监测。
  监测与预测间的桥梁是必然逻辑和直觉。直觉依赖于个人的才情天分,这放在一边不提,这里主要谈下必然逻辑。有必然逻辑在,事情就有了发生的可能性,但不一定发生。这点比较不好理解,我们来看个例子。
  我们谈微信的时候更容易聚焦到张小龙打造产品的功力,往往容易忽视马化腾张小龙才是打造微信的组合。从公开报道来看,当时腾讯内部是有很多团队同时在开发移动IM的,而这种投入很可能是基于“移动互联网才是真的互联网,腾讯必须在移动互联网的IM上占有统治地位”的假设。在这种假设下马化腾又有所谓的灰度理论,所以才有多支团队同时并进。如果没有这类顶层设计,我想更多公司更可能是在移动版QQ上做微创新,进一步掉入创新者的窘境。
  抽象点说,移动互联网的发展是可以从大数据上感知的,因为只要做足够的监测,那么就可以从数据上在较早阶段感知到这个趋势。但判断移动互联网是真的互联网,则依赖于当事人的眼光格局,再进一步决定去同时做微信和手机QQ,那则是上述逻辑的一个后果。在决定做微信那个时间点,马化腾乃至其他大佬也不知道它一定能成,否则大家一定是别的事情都不干,都专心做微信。但微信确实是“移动互联网是真的互联网”这一条必然逻辑里的一个衍生品,相当于是预测未来的一个后果。这就是大数据、监测、必然逻辑与预测的关系。
  大数据方兴未艾,但在用大数据时最好也考虑下它的能力边界,否则就可能因为它在某个点上失灵而怀疑大数据本身,这就得不偿失了。随着数据化程度的提高,反身性的作用可能会越来越大,作为结果,世界会变得越来越像混沌系统。
其他文献
为了研究粮食筒仓在储粮状态下的仓壁静态侧压力及中心卸粮状态下的仓壁动态侧压力,该研究利用仓身直径400 mm、仓壁高度700 mm的模型筒仓,以小麦为储料,分别进行了100%、80%
独联体中的三个主要国家相继发生了"颜色革命",不仅将对独联体的政治格局造成了冲击,而且将对俄罗斯的传统安全及其观念造成巨大的负面影响.本文认为,俄罗斯的传统安全是基于
大学数学应用多媒体辅助教学是高校教育改革的大势所趋,结合从事高等教学教学的实际,探讨了高等数学中引入多媒体辅助教学的优势与不足,以及在具体应用多媒体教学中应注意的
在农村采访,见过不少先进村庄的良辰美景,也见过不少由贫转富的柳暗花明,当然,也接触到了一些不那么令人兴奋的沉重景象。那里,或偏远闭塞,或人的原因,年复一年,星星还是那个
张辉,国家一级演员、中国戏剧家协会理事、湖北省戏剧家协会副主席。湖北省黄冈市文化局副局长、湖北省黄梅戏剧院党委书记、院长。享受国务院专家津贴。他曾荣获全国第二届
分析数据仓库体系结构,描述数据加载过程中的不同实现方法.在实现过程中引入工作流的思想,提出了一种以工作流为模式的基于元数据的ETL模型,将数据加载分解成可配制的具有不
国家新音乐课程标准的诞生和问世,是我国基础音乐教育深化改革而结出的硕果,其课程目标、内容标准、实施建议各部分都展示出一种新的设计思路,充分体现了素质教育的思想.认真