论文部分内容阅读
若想请一个保姆,你会相信谁:直觉还是算法?
轻信陌生人会有危险,我第一次得到这方面的教训是在1983年。那时我刚刚5岁多,一个名叫多丽丝的陌生女子来到我家做保姆。她来自格拉斯哥,将近30岁,是我的母亲从一本名为《女士》的时尚杂志上找到的。
多丽丝穿着一身救世军军装来到我们家,还戴着军帽。“我记得她有很重的苏格兰口音,”母亲回忆说,“她说,她曾经照看过像你当时那么大的孩子,还喜欢帮助别人,所以加入了救世军。老实说,一见面我就很喜欢她。”
多丽丝在我们家待了10个月,绝大多数时间里,她都是个好保姆——开朗、可靠、乐于助人。除了有几个周末不知所踪外,她没有表现出任何异样。
当时,我们的邻居卢森堡夫妇请了一位保姆,她常与多丽丝腻在一起。一天晚上,卢森堡先生来到我家,说他发现他家的保姆和多丽丝在贩毒。“她们甚至参与持枪抢劫,”父亲后来讲述,“多丽丝是负责接应的司机。”而事发后我们得知,她用来接应的车子,是我们家那辆沃尔沃Estate轿车。
父母随即决定搜查多丽丝的房间。在其床下的一个鞋盒里,塞满了一沓沓外国货币钞票,都是从我父母的家庭办公室里偷来的。那天晚上,我父亲手持棒球棍守在家门口,以防多丽丝突然回来。谢天谢地,她没回来。
“哪怕再次说起这件事情,我都觉得后怕,”母亲说,“我们竟然把你交给一个罪犯照看,而且过了那么长时间才看清她的真面目。真希望一开始能对她多一些了解。”
我的父母算是比较聪明且理性的那种人。在当今这个用数字连接的世界中,他们是否会犯当年那样的错误呢?或许不会,因为不管是雇保姆、出租房屋或者叫出租车,正有越来越多的科技公司致力于帮我们决定该相信谁,不该相信谁。当今的科技让我们能更深入地了解自己是谁,那么,在判断“谁真的可信,谁是骗子”这方面,算法是否真的可以比人类表现得更好呢?
一个干冷的秋日上午,我来到位于硅谷北部的安静小城洛斯阿图斯,参观了Trooly公司装修简单的办公室。该公司CEO萨维·巴维迦很想向我展示他们的信用审查软件有多强大,“我要是用Trooly开发的软件来审查你,你猜猜会有什么结果出来?”他面带笑容地说道,语气中透着鼓励之意。
我脸一红,努力回想自己曾经做过的所有糟糕事或尴尬事:(能查出我)收到的大量超速及违停罚单,长时间浏览的那些怪异网站(当然是出于研究目的),还是那些老照片?
想到这里,我尴尬地笑了笑。巴维迦说:“别担心,我们可以把审查过程投影到大屏幕上,这样你就能实时观看了。”可这话并没让我感到些许轻松。
安尼什·达斯·萨尔玛是Trooly的首席技术官,谷歌公司的前高级研究员。他把我的姓名输入到名为InstantTrust的程序中,接着输入我的邮件地址,就完事了。不需要出生日期,也不需要电话号码、职业或住址。
“Trooly的机器学习软件目前可以挖掘3个公共的和获得许可的数据源,”巴维迦解释说,“首先是像出生证、结婚证、洗钱监察名单以及性犯罪者登记簿等公共记录,全球范围内任何公共的、数字化的登记簿都可以为我们所用。”其次是对深网的挖掘,“它仍然是互联网,只不过是隐藏的网络,其页面没有被常规的搜索引擎编入索引。”是谁在用深网呢?“反社会人群、恋童癖、枪支买卖者……总之,活跃在深网的是形形色色诡异的人。”
最后的数据来源是社交媒体,比如脸书和Instagram。官方医疗记录是禁区,但如果你在推特上发消息说,“我刚做完了一个可怕的背部手术”,它就会被归类为法律许可的数据且可被使用。
巴维迦和他的团队花了9个月时间来评估哪些数据可以使用,哪些不可以使用。未成年人的数据就不可以使用。他说:“在有些国家,法律明确规定了‘私人信息’和‘敏感私人信息’之间的区别——后者包括医疗记录、种族、信仰、工会会员身份等。我们在使用数据时,会止步于后一类信息,并十分清楚越界的可怕后果。”
大约过了30秒钟,我的审查结果出现在大屏幕上。“瞧,你是其中之一!”巴维迦说。个人资料从1到5分为5个等级,其中1级最值得信赖。“仅有大约15%的人位列1级,他们是我们的‘超级好人群’。”
这番话让我感到轻松,并油然生出一股自豪感。那么又有多少“超级坏”的人呢?巴维迦给出了答案:“在Trooly覆盖的国家中,包括英国和美国,大约有1%—2%的人口位列4级和5级。”
巴维迦曾是贝恩咨询公司(Bain
轻信陌生人会有危险,我第一次得到这方面的教训是在1983年。那时我刚刚5岁多,一个名叫多丽丝的陌生女子来到我家做保姆。她来自格拉斯哥,将近30岁,是我的母亲从一本名为《女士》的时尚杂志上找到的。
多丽丝穿着一身救世军军装来到我们家,还戴着军帽。“我记得她有很重的苏格兰口音,”母亲回忆说,“她说,她曾经照看过像你当时那么大的孩子,还喜欢帮助别人,所以加入了救世军。老实说,一见面我就很喜欢她。”
多丽丝在我们家待了10个月,绝大多数时间里,她都是个好保姆——开朗、可靠、乐于助人。除了有几个周末不知所踪外,她没有表现出任何异样。
当时,我们的邻居卢森堡夫妇请了一位保姆,她常与多丽丝腻在一起。一天晚上,卢森堡先生来到我家,说他发现他家的保姆和多丽丝在贩毒。“她们甚至参与持枪抢劫,”父亲后来讲述,“多丽丝是负责接应的司机。”而事发后我们得知,她用来接应的车子,是我们家那辆沃尔沃Estate轿车。
父母随即决定搜查多丽丝的房间。在其床下的一个鞋盒里,塞满了一沓沓外国货币钞票,都是从我父母的家庭办公室里偷来的。那天晚上,我父亲手持棒球棍守在家门口,以防多丽丝突然回来。谢天谢地,她没回来。
“哪怕再次说起这件事情,我都觉得后怕,”母亲说,“我们竟然把你交给一个罪犯照看,而且过了那么长时间才看清她的真面目。真希望一开始能对她多一些了解。”
我的父母算是比较聪明且理性的那种人。在当今这个用数字连接的世界中,他们是否会犯当年那样的错误呢?或许不会,因为不管是雇保姆、出租房屋或者叫出租车,正有越来越多的科技公司致力于帮我们决定该相信谁,不该相信谁。当今的科技让我们能更深入地了解自己是谁,那么,在判断“谁真的可信,谁是骗子”这方面,算法是否真的可以比人类表现得更好呢?
一个干冷的秋日上午,我来到位于硅谷北部的安静小城洛斯阿图斯,参观了Trooly公司装修简单的办公室。该公司CEO萨维·巴维迦很想向我展示他们的信用审查软件有多强大,“我要是用Trooly开发的软件来审查你,你猜猜会有什么结果出来?”他面带笑容地说道,语气中透着鼓励之意。
我脸一红,努力回想自己曾经做过的所有糟糕事或尴尬事:(能查出我)收到的大量超速及违停罚单,长时间浏览的那些怪异网站(当然是出于研究目的),还是那些老照片?
想到这里,我尴尬地笑了笑。巴维迦说:“别担心,我们可以把审查过程投影到大屏幕上,这样你就能实时观看了。”可这话并没让我感到些许轻松。
安尼什·达斯·萨尔玛是Trooly的首席技术官,谷歌公司的前高级研究员。他把我的姓名输入到名为InstantTrust的程序中,接着输入我的邮件地址,就完事了。不需要出生日期,也不需要电话号码、职业或住址。
“Trooly的机器学习软件目前可以挖掘3个公共的和获得许可的数据源,”巴维迦解释说,“首先是像出生证、结婚证、洗钱监察名单以及性犯罪者登记簿等公共记录,全球范围内任何公共的、数字化的登记簿都可以为我们所用。”其次是对深网的挖掘,“它仍然是互联网,只不过是隐藏的网络,其页面没有被常规的搜索引擎编入索引。”是谁在用深网呢?“反社会人群、恋童癖、枪支买卖者……总之,活跃在深网的是形形色色诡异的人。”
最后的数据来源是社交媒体,比如脸书和Instagram。官方医疗记录是禁区,但如果你在推特上发消息说,“我刚做完了一个可怕的背部手术”,它就会被归类为法律许可的数据且可被使用。
巴维迦和他的团队花了9个月时间来评估哪些数据可以使用,哪些不可以使用。未成年人的数据就不可以使用。他说:“在有些国家,法律明确规定了‘私人信息’和‘敏感私人信息’之间的区别——后者包括医疗记录、种族、信仰、工会会员身份等。我们在使用数据时,会止步于后一类信息,并十分清楚越界的可怕后果。”
大约过了30秒钟,我的审查结果出现在大屏幕上。“瞧,你是其中之一!”巴维迦说。个人资料从1到5分为5个等级,其中1级最值得信赖。“仅有大约15%的人位列1级,他们是我们的‘超级好人群’。”
这番话让我感到轻松,并油然生出一股自豪感。那么又有多少“超级坏”的人呢?巴维迦给出了答案:“在Trooly覆盖的国家中,包括英国和美国,大约有1%—2%的人口位列4级和5级。”
巴维迦曾是贝恩咨询公司(Bain