论文部分内容阅读
用“AI优先”淡化传统形象
在最近进行的一项机器学习部署中,谷歌地图可以识别手写的门牌号,值得惊讶的是这些门牌号并不是很清楚,有时候路过的人也看不到它们。谷歌地图高级副总裁菲茨帕特里克在博客中解释道:“识别和绘制不常见的正式路牌和门牌号,这一点对于我们尤其重要。仅在尼日利亚的拉格斯,机器学习就帮助我们添加了20000个街道名称、50000个地址和100000个新企业,这些详细的企业和住户之前在地图上都没有呈现过。”
谷歌地图作了升级,为“地图”添加了三个新标签:“已保存”,可以在其中查看已添加书签的所有地点;“贡献”,用于与其他用户分享技巧;“更新”,“来自本地专家和出版商推荐的必去景点”。应用程序中已经存在的“浏览”和“通勤”选项卡将保留在那里,但是“为你”选项已被取消了。菲茨帕特里克声称,自从谷歌地图于2005年推出以来,已经绘制了220多个国家/地区的地图,并在大约2亿个地点和企业上公开了信息。
谷歌地图表示未来基于算法,算法将绘制建筑物,AR可以帮助用户找寻娱乐场所和餐馆。谷歌母公司Alphabet首席执行官桑达·皮查伊(Sundar Pichai)称,地图是他自2015年成为谷歌首席执行官以来就开始推行的“AI优先”方法的肥沃试验场。这位首席执行官强调了机器学习的重要性,同时淡化谷歌在广告领域的主导地位。
据称,之所以转变画风,来自谷歌受到监管机构对其数字广告业务的严格审查。美国司法部正在研究该公司DoubleClick平台(谷歌的广告交易平台)的市场主导地位,谷歌地图目前虽然不是该公司的重要收入来源,但它是可投放广告的产品之一。人们越来越担心谷歌等网站的市场影响力或者直白地說是垄断性,它们是否“通过为新进入者设置障碍”而损害竞争。皮查伊为此解释:“我们在许多不同的环境中提供平台,并认为要进行规模评估是有意义的,我们会竭尽全力确保DoubleClick平台获得的大部分收入能够流向客户。”
重新定义并不容易
众所周知,谷歌向AI战略转型是有着充足准备的。谷歌早在2010年就开始布局机器学习;2012年发布了“知识图谱”以及建成超大型的神经网络系统“谷歌大脑”;到2016年,DeepMind开发的AlphaGo横空出世,AI的实际表现也躁动了一大批中国互联网企业。
谷歌地图的重新设计旨在展示公司更加雄心勃勃的地图功能,据谷歌地图产品副总裁格拉斯哥所说:“它是为响应地图(Maps)用户不断发展的需求而设计的,最早的时候,地图主要是一个地图合集,这使用户可以在屏幕上单击并拖动地图显示来查看附近的区域,而不必等待那些相邻的图形加载到屏幕上。在当时竞争激烈的地图竞争者领域,例如MapQuest.com、Mapblastcom、AAA.com(付费服务)和RandMcNally.com(也是付费服务),这是一个巨大的进步。随着具备GPS功能的智能手机面世,街景技术和用户生成的大数据帮助了平台快速发展,越来越多的功能出现。”
比如应用程序图标本身已经得到了全面检修:它不再是一个迷你地图,而是一个带有谷歌色彩的大头针。该应用程序的主屏幕现在显示五个新选项卡:“探索”、“通勤”、“保存地点”、“贡献”和“更新”(获取有关附近活动的最新消息)。应用中的其他选项会根据上下文向用户展示。格拉斯哥说:“例如,当我们引入诸如有关餐馆的更多数据之类的信息时,他们会问,‘吃比萨最好的地方是什么?’。”“越来越多的人认识到他们可以询问关于世界的越来越多的信息。”
通勤和公交选项也进行了更新:如上班途中,在选择路线时会弹出其他设置,其中包括诸如可访问性、安全与否和火车车厢温度等因素。在某些市场中,还将识别女|生专用的运输车。谷歌去年首次向地图添加了人群预测,较新的筛选选项定于2020年3月份推出,但会因地区而异。
但是,立即可以使用的是谷歌重新强调的增强现实模式,该公司在2018年的软件开发者大会上首次展示了Live View,并于2019年开始推出。该功能本身并没有太大变化——按住智能手机,并在摄像头视图中出现箭头以指示正确的方向。人们可以搜索附近的商店或博物馆,并且只需单击一下即可启动实时模式,而无需要求用户先启动路线功能。
从描述来看这似乎很简单,但是增强现实需要幕后大量数据才能正常运行。它建立在现有街景数据的基础上,该数据由Google早在2007年开始部署的装有传感器和摄像头的汽车收集。当用户进入AR时,Live View还会从用户的摄像头中获取数据和特征。GPS会遇到信号不足的情况,难以确定当下所处的位置,因此Live View使用机器学习将相机捕获的场景与数十亿的街景图像和其他用户贡献进行比较,生成准确位置。
皮查伊说:“我认为计算的工作方式让人们的生活更直观,大家能够看到Maps用户四处走动的未来,并且Maps中弹出了AR信息层,向他们显示附近餐馆的素食菜单选项。”不过谷歌地图产品管理总监艾利克斯也表达了另一个观点:“如果我们把它做对了,那将是非常直观的。但是,如果我们把它弄错了那就会引起混乱,这比什么都不显示更糟糕。”
AI进化充满挑战
为了与自己的地图升级宏伟愿景保持一致,谷歌依靠这类机器学习程序在全球范围内解密复杂的基础架构。比如通过过去几年在印度和尼日利亚的测试案例,地图工程师已使用ML(机器学习)模型来绘制道路图,并根据卫星图像确定建筑物轮廓。
AI在谷歌地图功能中探索横向部署,而不仅仅是分配街道名称和概述建筑物。这些示例包括:向大家展示人们在餐厅所吃的流行菜肴,到预测更为严重的情况:地震、飓风、暴雨或洪水。这些预测模型可能会在三到五年内出现在地图中。
除了在自己的地图数据上花费数十亿美元外,谷歌还严重依赖用户的贡献获取大量新信息化。比如绘制印度山区的土路蜘蛛网网络是一回事,而要把它们的名字打上标注则是另一回事。谷歌表示,用户每天提供2000万条内容,但始终需要更多内容,因此,在地图主屏幕上突出显示了新的“贡献”选项卡。
人们越来越强调“地图”中的个人互动循环(用户自愿添加图像和街道名称,详细说明旅行的实时更新,查看餐厅,将周围环境的视频上传到服务器),这说明谷歌地图的成功很大程度上取决于人们是否继续使用这款软件,而不是说选择更私人的苹果地图(Apple Maps)。無论用户是在积极提供关键信息,在应用程序中导航还是只是点击以访问新的实时显示功能,谷歌地图都会从其用户那里收集数据。
在过去的几年中,谷歌地图的经验主要涉及开放式的应用程序,尤其是在智能手机上。皮查伊相信谷歌的Maps API(即允许不同应用程序彼此连接的通信协议)将在更多与地图无关的应用程序中使用。他举例说,零售商店或整个购物中心可以提供独特的购物体验,并且信息由该品牌提供,但导航技术由谷歌提供。在这种场景中,谷歌提供了不需要广告托管的API许可模式:“因此,地图不仅仅是搜寻目的地,而是获得正确的体验。”
这样的论调也引发了人们对谷歌地图未来的质疑,从商业角度来讲,十五周年的技术更新可能并没有多少新鲜感。但换个角度看,谷歌地图在数据和AI基建方面确实有过人之处,这些无形的数字化建设优势并不一定能立马显现,但能帮助用户实现更好的出行体验、提供更好的公众服务,地图巨擎能不能在未来的三五年内继续保持增长还有待观察。