2021年,自动驾驶正处在发展拐点,激光雷达和摄像头的自动驾驶感知路线之争,似乎正在明晰。
造车无疑是时下最热风口,科技巨头争相入场,阿里联姻上汽,百度牵手吉利,苹果虎视眈眈,小米念念不忘,至于那些入局早的“新势力”,特斯拉势头正盛,蔚来、理想、小鹏风光正好。
汽车行业的这轮智能电动化变革中,造车新势力能否颠覆传统车企,成败关键,不在电动化,而在自动驾驶。
一方面,对于传统车企,电机和电池不会成为其大象转身的桎梏,但软件之殇,却无法回避;
另一方面,自动驾驶必将掀起技术和市场的革命,IHS Markit就预测,2030年,仅中国地区的自动驾驶出行服务收入规模就有望突破万亿。
在自动驾驶的发展之路上,L3级别是分水岭。
实现L3级自动驾驶,意味着车辆控制由驾驶员主导转向车辆自身主导,而在自动驾驶驶向L3级别以上的途中,感知路线之争愈演愈烈。
自动驾驶的感知路线之争:
自动驾驶系统分为三个层级:感知层、决策层和执行层。
感知层收集周围的环境信息并做出预处理;决策层类似于人类的大脑,会基于感知层获取的信息,做出任务规划、行为决策和动作规划;执行层负责精准地执行决策层规划好的动作。
这其中,环境感知,就是汽车怎样“看清”这个世界,是全面实现自动驾驶的关键一环。
目前,环境感知存在两个技术路线分歧,其一就是摄像头和激光雷达的分歧:摄像头+毫米波雷达的融合方案 VS 激光雷达+摄像头+毫米波雷达的融合方案。
2021年被认为是激光雷达的量产元年,伴随着技术成熟和成本下降,激光雷达前装量产成为可能,各大厂商也纷纷发布了自己的激光雷达量产车型。
蔚来发布的旗舰轿车ET7将搭载图达通的1550nm激光雷达;WEY品牌的旗舰车型摩卡将会搭载全固态激光雷达;小鹏汽车宣布在2021年推出的新车上使用定制版的车规级激光雷达;智己汽车为激光雷达预留接口;宝马、奔驰、沃尔沃等传统车企也均有激光雷达搭载计划。
「主要车企2021年激光雷达量产计划」
但与此同时,自动驾驶领域执牛耳者特斯拉却依然对激光雷达无动于衷,仍在坚持摄像头感知路线,马斯克更是视觉派的坚定拥护者,在2019年的redialAutonomy Day上曾表示“傻瓜才用激光雷达”。
驶向L3级以上的自动驾驶的路上,激光雷达与摄像头的感知路线之争,热闹非凡。
摄像头视觉感知方案的瓶颈:
2020年以来,无论传统车企还是造车新势力,都基本认定了激光雷达感知方案,只有特斯拉还在坚持摄像头纯视觉方案。
摄像头方案最符合马斯克的理念:以第一性原理指导创新,既然人可以靠双眼观察周围环境开车,那么自动驾驶系统也可以用同样的逻辑靠摄像头做到。
目前,自动驾驶系统能识别的摄像头信息都是2D画面信息,或者说进行了标注的2.5D信息。投入巨量资源重写了算法的Autopilot配合Dojo超计算机,将会有识别4D视频信息的能力,但那是后话了,这里先按下不表。
想要识别出这些2D信息,必然依赖于算法逻辑,确切地讲就是人工智能中的图像识别,通过深度学习神经网络对场景进行像素分割、物体分类、模型标定和目标跟踪,实现对障碍物的识别。
视觉感知的优势在于分辨率高,可获取物体颜色、表面特征等信息,实际场景中的车道线、红绿灯、指示牌等都可清晰辨识。
但是,深度学习神经网络的完善,需要大量的数据积累作支撑,以最简单的MNIST手写数字识别为例。
对人类而言,识别下面图片上的数字非常容易,但对计算机而言,每个数字所在的小区域都是一个不同的数字矩阵。
对人类而言,识别下面图片上的数字非常容易,但对计算机而言,每个数字所在的小区域都是一个不同的数字矩阵。
深度学习看起来很美,但自动驾驶的尴尬之处在于,其行驶数据主要来自常规环境,可是车辆驾驶是充满偶然性的,比如行人或动物突然出现在行驶路线上,道路指示牌被部分遮挡,或者遇到暴雨和强逆光等极端场景。
没有相关场景下足够的数据积累和与之对应的深度学习,人工智能难免变成人工智障,自动驾驶也就无从谈起,就拿自动驾驶领域独步青云的特斯拉来讲。
特斯拉在产品设计之初就构建起一整套自监督数据采集与学习的闭环框架。路上的每一辆特斯拉都在通过摄像头收集各种行驶场景数据,并上传到特斯拉云端,构成真实而庞大的数据池。
基于收集到的行驶数据,特斯拉会通过“影子模式”不断优化算法,最后对每一辆特斯拉的FSD自动驾驶进行OTA升级。此外,特斯拉自研芯片和算法、打通软硬、实现闭环,可以更好地优化算法、挖掘芯片计算能力。
但饶是如此,特斯拉依然会有侧翻货车识别的噩梦,因为特斯拉的云端,没有路遇侧翻货车的相似场景数据。
正是这些小概率的极端场景,成为自动驾驶最难攻克的山头。登顶之路上,往往最后的5%,需要95%的努力,但有时,也可以另辟蹊径。
激光雷达成为行业热点:
激光雷达,LiDAR,英文全称Laser Detecting and Ranging,通过激光束进行探测和测距,由激光发射器、光学接收器、和信息处理系统三部分组成。
以Velodyne的64线激光雷达为例,该激光雷达每秒可向外界发射数百万个激光脉冲,并通过内部旋转装置对周围环境进行旋转扫描,每一次扫描都可获得巨量的空间信息(x,y,z)点,这些空间信息点的集合就被称为点云数据,由点云数据构成的三维图也就称为点云图。
测距距离远,速度分辨率高,能创建出目标清晰的3D图像,是激光雷达最大的优势。
高度的可靠性和精确性,使激光雷达成为自动驾驶环境感知中最重要的传感器,但激光雷达也有其劣势:
在开阔地带,激光雷达会因为缺乏特征点,存在电云稀疏甚至缺失的特点;
面对不规则表面物体,激光雷达也不易分辨出其特征
相比于依靠摄像头的纯视觉感知方案,激光雷达与摄像头融合,可以带来信息获取能力的提升,算法要求的降低,行驶安全的多重保障。摄像头的高分辨率和激光雷达的精准测距,互为补充。
激光雷达身上有三座大山:成本、体积、车规级。这其中,尤以成本问题最核心,要知道,最早Google无人车上头顶的那块激光雷达,成本高达7.5万美元。
近年来,随着关键技术的突破和光电半导体成本的下降,激光雷达的体积和价格都在不断降低,量产友好的车规级前装激光车雷达不断涌现。
华为就发布了96线雷达,号称把激光雷达价格压缩到200美元,而且有可能进一步成降低到100美元;Luminar即将量产的300线1550nm波长激光雷达,软硬件打包价格不超过1000美元。
在激光雷达这条赛道上,还有Velodyne、Quanergy、博世、大陆、大疆、法雷奥、速腾聚创、禾赛科技等生产制造商,其中法雷奥是目前唯一一个实现车规级量产的。
激光雷达和摄像头之争的下半场:
早些年,摄像头方案的成本更具优势,得到了行业的偏爱,取得了规模化推广发展,常规场景的感知技术相对成熟。
但激光雷达作为一种视觉感知的技术补充,如果具备了技术成熟和成本合理两个先决条件,不应被排斥。
首先,自动驾驶激光雷达的技术路线要清晰,因为激光雷达的分类繁多:
按结构,可分为机械式、混合固态和纯固态。其中,非机械式按扫描方式,又可分为:MEMS、相控阵以及微透镜阵列;
按线束,可分为16线、32线、64线、96线以及300线;
按波长,可分为905nm波长和1550nm波长。
激光雷达的体积变化趋势
其次,成本可控至关重要。全球科技创新产业专家王煜全对激光雷达产业就有一针见血的评价:“激光雷达即将进入成熟期,比拼的就是成本优势、规模优势。”
成本优势带来规模优势,规模效应促进技术成熟,技术成熟反过来进一步推动成本降低,形成良性循环。
在众多形式的激光雷达中:固态激光雷达成本友好,但技术还有待成熟;300线可以达到图像级识别精度,但成本也更高;1550nm对人眼健康更友好,但由于使用光纤传感器,成本也更高。
未来,激光雷达赛道的胜出者,一定是平衡好性能和成本,提供规模化量产最佳解决方案的厂商。
在行业友商一边倒地拥抱激光雷达时,马斯克还在坚持“纯视觉感知+强算法”的路线,还在排斥激光雷达,也许是因为其第一性原理的创新理念,也许是因为特斯拉市场推广的发展战略,可能特斯拉认为激光雷达的成本还不够低。
但是,当激光雷达被规模化量产炸成白菜价后,特斯拉会继续无视激光雷达对自动驾驶的提升么?会放任友商肆意追赶其自动驾驶核心竞争力么?马斯克是会坚持创新理念和发展战略,还是真香呢?
本文来源于“Car路里学堂”,作者厉冰雪。智通财经编辑:文文。