论文部分内容阅读
一
2011年10月,美国佛罗里达州的劳德代尔堡发生了一起恶性交通事故,一名退休警察开快车,结果肇事致人重伤。
这个城市有份地方报纸,叫《太阳哨兵报》,这个故事的女主角克斯汀就是这份报纸的一名女记者。这名40多岁的女记者听到这则消息之后,皱起了眉头,在她的印象中,警察因为开快车导致的交通事故发生好多次了,即使是退休的警察,也发生好几次了。
为了印证她的直觉和记忆,克斯汀收集整理了历年的新闻报道,果然:从2004年起,整个佛罗里达州发生过320起警察开快车导致的交通事故,19人在事故中丧生,但最后的结果是,只有一名警察入狱服刑。
克斯汀意识到,这可能是一个非常值得关注的社会问题,她甚至怀疑她收集到的数据还只是冰山一角,类似的警察很多,开快车可能是警察这个群体的经常性行为。但怀疑只是怀疑,克斯汀知道,要证明它,无异于要证明警察这个群体知法犯法、凌驾于法律之上,这是个相当大的挑战。
难就难在取证。
她决定试一试。克斯汀抱着测速雷达,一连几天守在高速公路边,一看见有超速的黑点,就驱车直追,但追来追去,常常发现不是警车。一到晚上,目标更是难以辨认,就算运气好,真的碰上一辆超速警车,克斯汀也无权截停,就算拍照录像,证据还是不够充分,事后也无法指证。克斯汀还试过跟踪警车,看见一辆跟一辆,她在尝试之后,发现这更难。
难、难、难!但在这个世界,还真要相信办法会比困难多,在某个地方,总有你意料之外的发现在等你。克斯汀最后竟然想出了一个超级好办法,她根据美国的《信息自由法》,向当地的交通管理部门申请数据开放。因为警车是公务车,公民有权了解其使用状态,她因此获得了110万条当地警车通过不同高速路口收费站的原始记录。
克斯汀的分析方法是:选取两个特定的收费站,测算之间的距离,再在110万条记录当中找到每一辆警车通过这两个不同收费站的具体时间,两点之间的距离除以两个时间之差,即为该警车的平均行驶速度。
克斯汀和她的团队用了三个月的时间对这些记录进行了整合和分析,结果是半夜里敲大钟——令人震惊。
在13个月里,当地所属的3900辆警车一共发生5100宗超速的事件,96%的超速在每小时144公里至每小时176公里之间,当地五分之一的警车都有时速超过144公里的“劣迹”,而且,记录表明,绝大部分超速行为发生在上下班的时间。这意味着,他们开快车可能并不是为了执行公务,而是为了早点回家。
克斯汀的怀疑得到了证实。2012年2月,她利用这些数据分析的结果,在《太阳哨兵报》上发表了一系列报道,头篇报道的标题为《他们凌驾于法律之上》。在大量数据和调查访谈的基础上,克斯汀得出结论说,因为工作需要和警察身份的特权意识,开快车成了警察群体的习惯性行为,即使下班之后,身着便服,其开车速度也没能降下来。路上值勤的警察也“警警相护”,互相理解和纵容这种行为。
二
所谓数据,就是证据,而且“铁据如山”。可以想象,克斯汀的报道一见报,舆论一片哗然。接下来一个月,《太阳哨兵报》的电话响个不停,全国各地的读者打来电话,有的表示支持,有的表示感佩,还有的要来“取经”。当地警务部门则发生了一场“大地震”,5100宗超速案件涉及12个部门的近800名警察,一些被“坐实”的警察陆续受到处理:有的被警告,有的被剥夺开车上下班的权利,有的被停职,甚至还有的被开除。
故事到這里,还没有完。警务部门的整顿是否有效呢?2012年12月,克斯汀又向交通管理部门申请开放了最新的数据。她对新的数据又做了分析,并和2011年的同期数据进行了对比。数据表明,从2012年2月到10月,警察超速的个案已经从2011年同期的3179宗下降为495宗,下降幅度高达84%。克斯汀又发表了一篇新的报道《警察猛踩刹车》。在这篇报道中,她把数据的变化分解到了各个警务部门,详细地列出了每一个部门的改进水平。
《太阳哨兵报》只是一份地方小报,总发行量才20万余份,但因为克斯汀的报道,该报名声大振,克斯汀也因此获得了2013年度的普利策新闻奖。其颁奖词是这样写的:“克斯汀的报道以无可辩驳的技术调查,记录了警察在非公务期间开快车,危及市民生命的事实,这种致命威胁在报道引发的讨论和整顿中得到消减。”
可以想象,如果没有克斯汀的数据创新,类似于“警察群体开快车”的社会问题,我们很难在法庭上证实,毕竟取证非常难。现在问你,除了克斯汀的方法,你能想到一种更有效的取证方法吗?如果想不到,那在你生活的社会,这种知法犯法、滥用权力的行为,就基本不可能得到处理和纠正。
三
克斯汀这个人,当然数商也很高。一开始,克斯汀也想去收集数据,但她在尝试之后失败了,克斯汀也找不到像OkCupid这样的平台,她的绝妙之处,是使用了一份看起来和警察超速风马牛不相及的数据,独辟蹊径解决了问题。
我把她的绝妙杀招称为“数据外部性”。
什么是数据外部性?
“外部性”来源于经济学家,他们使用这个名词已经有上百年的历史。经济学家发现,一个普通个体为了自身利益而做出的“利己行为”,也可能让其他人或者整个社会受益,并且受益者无须为此支付费用。
我借用这个概念,想指出的是,一个人或一个组织为了某种目的收集数据,在完成数据的收集之后,他们可能发现这些数据的作用将超出其最初收集时的计划和想象,即同一组数据可以在新的维度上产生人们“初心”以外的价值和效用。
数据经常揭示初心之外的事实和真相。
人类越来越多的行为都在留下数据。小数据时代的警察破案,常常要靠指纹,今天几乎所有的人类行为,都将在数据空间留下“数纹”,即数据纹理。就此而言,用好数据纹理,公安部门将迈入一个有案必破的新时代,而对大众而言,我们将迈入一个犯罪更少、更加安全的时代。
世界正在快速地数据化,我们正在进入一个“数据不是一切,但一切都将变成数据”的时代,万事万物都将以数据的形式在数字空间存在。一个人的数商,就是他新的空间商、生存商、发展商。今天及未来的机器人,之所以能够有智商、有情商,其基础都是因为先有了数商。你可能认为,机器是机器,人类是人类,人是先有智商和情商,但我接下来要告诉你的是,人类其实也是先有数商,再有智商,只不过一直没有人总结出“数商”的提法而已;至于情商和数商孰先孰后,我暂时无法下结论。
在这个新的时代,机器的思考正在变得越来越像人,而人的行为也正在变得越来越像机器,这些变化是真真切切的。当你有机会思考和体认这些变化,我担保你会突然间对未来产生一丝不安和疑惑。在你想清楚之后,我敢肯定,你会同意数商正在变得超级重要。
(选摘:阿璇)
编辑:黄灵