论文部分内容阅读
“我
相信未来世界的生产力和自由将来自大数据和智能。而深度学习的无人驾驶技术本身是一个较为年轻的领域,更新换代的速度非常快,对自己技术的实践应用是一个机会,这也是我选择无人驾驶方向的原因。”Momenta创始人兼CEO曹旭东说道。
Momenta是一家刚成立不久的专注做无人车大脑的公司,核心技术是基于深度学习的环境感知、高精地图、驾驶决策算法,产品包括不同级别的自动驾驶方案,以及衍生出的大数据服务。
放弃学业、放弃高薪,一心只为AI
曹旭东2008年毕业于清华大学,本科专业是工程力学,但对统计学有着浓厚的兴趣。
本科毕业后,他顺利成为清华大学的直博生。在博一期间,他对人工智能尤为感兴趣。“当时我一心扎入人工智能计算机相关的课程,哪怕要自己上课、看书、查文献都乐在其中。”曹旭东回忆说。
对于人工智能,曹旭东可以用痴迷来形容,博一过后为在这一领域出国深造申请了退学,即使导师三次挽留也没能改变他的主意。
离开清华后,曹旭东来到微软亚洲研究院,因微软的技术和学术氛围留在了那里,如愿做了与人工智能相关的研究,他所研发的视觉识别技术被用在了Xbox、Bing、How-Old等知名产品中。
2014年底,深度学习还似炼丹术,其中的原理人们无法讲清楚。在理论研究上,曹旭东已经有了自己的一套研究方法并发表了很多学术文章,但终不能令他满意,他认为理论需要解决实际问。
为让自己的研究成果能在实践中得到验证,曹旭东曾参加National Data Science Bowl(全美数据科学碗)比赛,与1000多支来自世界各地团队的选手角逐,并拿到了全球第二的好成绩。
2015年,曹旭东将创业目标锁定在了无人驾驶领域。之后,基于对“个人和环境的交互能激发智能”的执著追求,曹旭东开始了对无人驾驶的技术路径和商业路径的探索,并创办Momenta,专注做无人车的“大脑”。
如何解决无人驾驶最重要的安全问题?
据统计,全球人类司机驾驶1亿公里可能发生致命事故一至三起。无人驾驶需要做到更安全,安全意味着低事故率。一个系统要实现低事故率,通常要做到两点:一是发现问题,二是解决问题。
而解决这些问题则需要对无人车进行大规模数据收集和测试,这一方面需要海量的测试车辆,另一方面也意味着高昂的单车成本。
Momenta的做法是用两种互补的解决方案降低无人驾驶的事故率:无人驾驶模拟,以及众包数据收集和测试。
具体来讲,无人驾驶模拟可以通过算法生成感知和决策数据,减少数据收集和测试车辆数量,降低研发成本。
但曹旭东坦言,无人驾驶模拟也存在不足。
第一,模拟生成的感知数据和真实的数据存在差异,实际中还是以真实数据为主,生成数据为辅。
第二,模拟的规则是人制定的,而很多失败的场景恰恰是人思考的盲点,单纯通过模拟并不能发现。
曹旭东告诉创业邦(微信搜索:ichuangyebang):“虽然模拟可以降低数据收集和测试车辆的数量,但是我们仍然需要收集真实数据,用大量的车做真实测试。”
在单车成本方面,其主要由三部分构成:设备成本,造车成本,运营成本。后两者已经优化了上百年,很难再降低,但在设备成本方面,Momenta发挥算法优势,可以通过多摄像头等廉价设备实现无人驾驶。
“摄像头是所有感知设备中信息(获取)量最大的,需要人脑水平的强人工智能才能从间接视频数据中提取出无人驾驶所需要的直接数据。”曹旭东称。
要降低造车成本和运营成本,目前最好的办法是通过众包模式让其他人承担这部分成本。这种模式,其实代表性的公司已经有特斯拉这些大佬在尝试,但遗憾的是他们需要造车、读取和控制车辆行为,这需要很大的时间成本,显著慢于算法的研究节奏。
“我们的想法是直接利用已有的运营车辆,避开造车、改车、控制车等过程,通过众包获得海量环境和行为数据,并构建高精度地图,再通过数据驱动的方式学习无人驾驶决策。”曹旭东这样告诉创业邦(微信搜索:ichuangyebang)。
高精度地图方面,Momenta根据多张图像存在的视差,利用点的对应关系将图像中的2D点恢复到真实世界中的3D点。从基本原理出发,建立高精地图,Momenta用不一样的方式尝试解决三个难题:
一、 图像部分:检测识别语义点。
不同于传统的SLAM或者SFM算法所用的SIFT、ORB等人工设计的特征点,Momenta的方法是定义道路标线、标牌等地标上的点为语义点,通过深度学习和数据驱动的监督训练得到模型,从而准确检测和识别语义点,解决检测不到、匹配错误的问题。
二、 几何部分:通过众包间接实现海量摄像头测量效果。
不同车辆,不同时间,经过同一地标,即使光照视角不同,通过语义点模型把所有车辆拍摄到的同一语义点关联起来,这相当于间接实现了多摄像头测量的效果。
众所周知,视觉测量中,摄像头越多、视差覆盖越全,测量精度就越高。Momenta经实验验证,随着众包车次的增加,真实3D点位置估计的准确性有量级上的提升。
三、 GPS部分:给每个语义点精确的GPS坐标。
Momenta的考量是:
1.让高精地图通用。GPS坐标是地图的通用语言,给每个语义点赋予GPS坐标可方便他人使用。
2.消除累积误差。单纯使用几何方法构建局部地图会有累积误差,结合GPS可以解决这个问题。
3.消除局部地图歧义性。当局部地图有重合或者语义点缺失的时候,确定局部地图坐标系很麻烦,但全局GPS坐标系没有这个问题。
任重而道远
无人驾驶技术是一个非常庞大的知识体系,定位、感知、决策、控制是其亟待解决的四大问题,且在这四个方向上都有很多子问题。
对于初期的Momenta而言,团队成员来自清华大学、麻省理工学院、微软亚洲研究院等,有深厚的技术积累和很强的技术原创力,这将是其布局驾驶的技术和团队优势。
但创业邦(微信搜索:ichuangyebang)认为,如何紧跟时代潮流,尽快将不同级别的无人驾驶技术落地,以及对行业大数据的快速积累,将是Momenta的当务之急。而在瞬息万变的人工智能领域,面对竞争对手和行业巨头们,Momenta任重而道远。
相信未来世界的生产力和自由将来自大数据和智能。而深度学习的无人驾驶技术本身是一个较为年轻的领域,更新换代的速度非常快,对自己技术的实践应用是一个机会,这也是我选择无人驾驶方向的原因。”Momenta创始人兼CEO曹旭东说道。
Momenta是一家刚成立不久的专注做无人车大脑的公司,核心技术是基于深度学习的环境感知、高精地图、驾驶决策算法,产品包括不同级别的自动驾驶方案,以及衍生出的大数据服务。
放弃学业、放弃高薪,一心只为AI
曹旭东2008年毕业于清华大学,本科专业是工程力学,但对统计学有着浓厚的兴趣。
本科毕业后,他顺利成为清华大学的直博生。在博一期间,他对人工智能尤为感兴趣。“当时我一心扎入人工智能计算机相关的课程,哪怕要自己上课、看书、查文献都乐在其中。”曹旭东回忆说。
对于人工智能,曹旭东可以用痴迷来形容,博一过后为在这一领域出国深造申请了退学,即使导师三次挽留也没能改变他的主意。
离开清华后,曹旭东来到微软亚洲研究院,因微软的技术和学术氛围留在了那里,如愿做了与人工智能相关的研究,他所研发的视觉识别技术被用在了Xbox、Bing、How-Old等知名产品中。
2014年底,深度学习还似炼丹术,其中的原理人们无法讲清楚。在理论研究上,曹旭东已经有了自己的一套研究方法并发表了很多学术文章,但终不能令他满意,他认为理论需要解决实际问。
为让自己的研究成果能在实践中得到验证,曹旭东曾参加National Data Science Bowl(全美数据科学碗)比赛,与1000多支来自世界各地团队的选手角逐,并拿到了全球第二的好成绩。
2015年,曹旭东将创业目标锁定在了无人驾驶领域。之后,基于对“个人和环境的交互能激发智能”的执著追求,曹旭东开始了对无人驾驶的技术路径和商业路径的探索,并创办Momenta,专注做无人车的“大脑”。
如何解决无人驾驶最重要的安全问题?
据统计,全球人类司机驾驶1亿公里可能发生致命事故一至三起。无人驾驶需要做到更安全,安全意味着低事故率。一个系统要实现低事故率,通常要做到两点:一是发现问题,二是解决问题。
而解决这些问题则需要对无人车进行大规模数据收集和测试,这一方面需要海量的测试车辆,另一方面也意味着高昂的单车成本。
Momenta的做法是用两种互补的解决方案降低无人驾驶的事故率:无人驾驶模拟,以及众包数据收集和测试。
具体来讲,无人驾驶模拟可以通过算法生成感知和决策数据,减少数据收集和测试车辆数量,降低研发成本。
但曹旭东坦言,无人驾驶模拟也存在不足。
第一,模拟生成的感知数据和真实的数据存在差异,实际中还是以真实数据为主,生成数据为辅。
第二,模拟的规则是人制定的,而很多失败的场景恰恰是人思考的盲点,单纯通过模拟并不能发现。
曹旭东告诉创业邦(微信搜索:ichuangyebang):“虽然模拟可以降低数据收集和测试车辆的数量,但是我们仍然需要收集真实数据,用大量的车做真实测试。”
在单车成本方面,其主要由三部分构成:设备成本,造车成本,运营成本。后两者已经优化了上百年,很难再降低,但在设备成本方面,Momenta发挥算法优势,可以通过多摄像头等廉价设备实现无人驾驶。
“摄像头是所有感知设备中信息(获取)量最大的,需要人脑水平的强人工智能才能从间接视频数据中提取出无人驾驶所需要的直接数据。”曹旭东称。
要降低造车成本和运营成本,目前最好的办法是通过众包模式让其他人承担这部分成本。这种模式,其实代表性的公司已经有特斯拉这些大佬在尝试,但遗憾的是他们需要造车、读取和控制车辆行为,这需要很大的时间成本,显著慢于算法的研究节奏。
“我们的想法是直接利用已有的运营车辆,避开造车、改车、控制车等过程,通过众包获得海量环境和行为数据,并构建高精度地图,再通过数据驱动的方式学习无人驾驶决策。”曹旭东这样告诉创业邦(微信搜索:ichuangyebang)。
高精度地图方面,Momenta根据多张图像存在的视差,利用点的对应关系将图像中的2D点恢复到真实世界中的3D点。从基本原理出发,建立高精地图,Momenta用不一样的方式尝试解决三个难题:
一、 图像部分:检测识别语义点。
不同于传统的SLAM或者SFM算法所用的SIFT、ORB等人工设计的特征点,Momenta的方法是定义道路标线、标牌等地标上的点为语义点,通过深度学习和数据驱动的监督训练得到模型,从而准确检测和识别语义点,解决检测不到、匹配错误的问题。
二、 几何部分:通过众包间接实现海量摄像头测量效果。
不同车辆,不同时间,经过同一地标,即使光照视角不同,通过语义点模型把所有车辆拍摄到的同一语义点关联起来,这相当于间接实现了多摄像头测量的效果。
众所周知,视觉测量中,摄像头越多、视差覆盖越全,测量精度就越高。Momenta经实验验证,随着众包车次的增加,真实3D点位置估计的准确性有量级上的提升。
三、 GPS部分:给每个语义点精确的GPS坐标。
Momenta的考量是:
1.让高精地图通用。GPS坐标是地图的通用语言,给每个语义点赋予GPS坐标可方便他人使用。
2.消除累积误差。单纯使用几何方法构建局部地图会有累积误差,结合GPS可以解决这个问题。
3.消除局部地图歧义性。当局部地图有重合或者语义点缺失的时候,确定局部地图坐标系很麻烦,但全局GPS坐标系没有这个问题。
任重而道远
无人驾驶技术是一个非常庞大的知识体系,定位、感知、决策、控制是其亟待解决的四大问题,且在这四个方向上都有很多子问题。
对于初期的Momenta而言,团队成员来自清华大学、麻省理工学院、微软亚洲研究院等,有深厚的技术积累和很强的技术原创力,这将是其布局驾驶的技术和团队优势。
但创业邦(微信搜索:ichuangyebang)认为,如何紧跟时代潮流,尽快将不同级别的无人驾驶技术落地,以及对行业大数据的快速积累,将是Momenta的当务之急。而在瞬息万变的人工智能领域,面对竞争对手和行业巨头们,Momenta任重而道远。