9月13日,是毫末智行成立的第1020天,也是第六届HAOMO AI DAY的举办日。当两个极为特殊的日子相加,毫末智行这次又会给我们带来自动驾驶领域哪些激动人心的“正能量”呢?

■ 技术产品收获颇丰 毫末飞速成长

首先,毫末智行董事长张凯为我们分享了企业在技术、产品以及团队建设方面的成果。两年来,毫末的智能驾驶产品累计进行了6次OTA在线迭代升级;目前MANA数据智能体系已经完成数十万全要素、多模态CLIPS标注,搭建完成300万小时的中国道路驾驶认知场景库,学习时长超过31万小时,虚拟世界驾龄相当于人类司机的4万年的驾龄;2年时间开发了三代智能驾驶系统,并配备在10多款不同平台和种类的车型上,辅助驾驶系统行驶里程已经突破1700万公里;小魔驼2.0已经开始稳定量产交付,与物美多点合作的小魔驼运营项目订单量已经突破9万单;毫末在职员工已经超过1000人,技术研发人员占90%以上。

图片 21.jpg

图片 7.jpg

图片 25.jpg

张凯表示,毫末智行认为2022年下半年自动驾驶行业需要面对三大挑战:大规模自动驾驶数据“上云”;大算力AI芯片实现性能突破以及城市场景自动驾驶产品实现量产突破。

为此毫末智行总结了五个应对法则,即“智能驾驶产品开发将安全放在首位”、“用To C思维做To B的事”、“挖掘出用户真实场景数据来进行数据驱动”、“实现感知智能与认知智能高度一体化”以及“以开放心态赋能客户”。

不过这些法则可不仅仅是应对挑战的,还是毫末智行用来迎接自动驾驶“3.0时代”的行为准则。

■ MANA升级 积极迎接自动驾驶3.0时代

毫末智行CEO顾维灏认为近十年的自动驾驶技术发展可以分为三个阶段:早期是硬件驱动的1.0时代,车辆的感知能力通过配备的传感器硬件数量和线束等参数决定;而目前正处于的软件驱动2.0时代主要靠更大算力的芯片提炼感知信息,然后进行融合以及传递;对于不久的将来,自动驾驶将进入数据驱动的3.0时代,让信息提取更高效,同时为自动驾驶提供更多的“养料”支撑,使技术更安全、更好用。

图片 77.jpg

顾维灏通过毫末智行与魏牌摩卡、高通联合推出的国内首个城市导航辅助驾驶系统,展现了他们为自动驾驶3.0时代做了哪些准备。

熟悉或使用过智能驾驶辅助功能的朋友们都知道,城市道路因为环境复杂,不可预测的突发状况多,而让城市智能辅助驾驶的研发和普及难度都很高,哪怕是我们在城市主干道上打开以高速公路为主场景的高阶驾驶辅助系统,效果也不太好。因此,在自动驾驶领域,谁能率先拥有城市智能驾驶辅助能力,谁就能抢占技术和市场两座“高地”。

图片 40(1).jpg

对此,毫末智行通过提升MANA数据智能体系的学习能力、拟人能力以及交互能力来实现。

在学习能力上,毫末智行希望“MANA”可以直接使用大量无标注数据,这样才能更快、更好地发挥毫末深厚的数据资源。他们的做法是将所有感知任务的backbone都统一,然后用无标注数据来训练backbone进行训练并分类,最后在经过标注样本进行复合训练。

图片 42(1).jpg

这就好比一位国际学校的老师教物理,面对班上会不同语言的同学,老师要不就是语言天才,能够将课程逐一翻译成不同语言讲出来,要不就是给每位同学配备同声传译,帮助理解,但这两个的难度和成本都很高。而如果让所有同学在入学前先学会中文,那么老师在统一语言环境的基础上讲课,难度要小很多,需要翻译的情况也会减少。

顾维灏表示,这种训练方法的效率提升了3倍以上,同时能够有效迫使模型理解道路场景的三维结构,从而更好地适应自动驾驶提出的感知任务需求。

除了提前“翻译”以外,“MANA”还拥有“温故知新”的能力,以此在数据规模越来越大的环境下,智能驾驶辅助系统还能对新场景保持敏感度。

图片 44.jpg

为此毫末智行打造了一个增量式的学习训练平台,在这里以往的存量数据会和新数据成比例的组合为一个数据集,这样系统在吸收这些数据的时候,就会做出对比,然后让新数据变为增量数据,提高智能驾驶系统的精度,同时还能有效节省芯片算力。

这有点像我们在备战高考时做的题库练习,老师通常不会要求我们把旧题和新题混在一起做,就是为了防止我们做惯了新题,而忘记旧题的解题思路。

在拟人能力上,毫末智行主要解决三个痛点:像人一样理解空间的能力、像人一样构思场景以及像人一样运动。

在“像人一样理解空间”上,毫末智行选择偏重感知而轻视地图的研发路径。顾维灏表示他们希望城市领航辅助技术可以像普通人类驾驶员一样,使用普通导航地图就能制定行驶路线和驱动车轮前进。因为城市场景的变化远比高速要快,今天还是“一马平川”,明天可能就是工地了。因此实时的感知能力远比还需要线上更新的高精地图更可靠。

图片 45.jpg

图片 72.jpg

在“像人一样构思场景”方面,毫末智行已经与阿里和德清市合作,将城市里每个路口的真实交通情况记录下来,再导入到仿真引擎里。这样最大的好处就是获取的信息量比车辆采集的更多更真实。

图片 47.jpg

而在“像人一样运动”部分,毫末智行的做法是通过海量的人类驾驶数据构建自动驾驶场景库,训练一个基于时空Attention的驾驶决策预训练大模型,使得自动驾驶的决策更像人类真实的驾驶行为。

图片 48.jpg

最后来聊聊交互能力,其实这部分也可以归结为“拟人能力”,因为它就像是老司机的眼睛,为智能驾驶辅助系统观察周围环境,并据此给出相应行驶方案和指令。此前毫末智行已经能够在不依赖高境地图的情况下准确识别红绿灯,接下来将解决车辆观察刹车灯、转向灯的能力,从而进一步提升城市驾驶辅助的安全性和舒适性。

图片 46.jpg

当然了,如果要想让车辆具备更强的城市驾驶辅助能力,除了更会思考、更像人以及更会交互以外,还不能“烧脑”,尤其是训练过程要低耗、高效。为此毫末智行建立了一个“毫末超算中心”,目标是满足千亿参数大模型,同时数据规模100万clips,整体训练成本可以降低200倍。

图片 85.jpg

■ 邦点评

说了这么多“技术”,我们最后来点实际的。目前毫末城市导航辅助驾驶具备了五大功能,分别是:智能识别红绿灯,可根据不同灯光颜色和闪烁节奏前进和刹车;智能左右转,行车路线更接近于真实人类驾驶者,遇到行人和非机动车还能主动避让;智能变道,车辆会根据导航路线在路口或路口交换区自动变道,如果遇到前方不适合变道,还能主动减速等待变道时机;智能躲避障碍物,可以准确识别静态和动态物体,然后根据实际道路情况选择直接绕行或是减速等待时机。

在这次的HAOMO AI DAY上,我们看到了毫末智行在现有技术、产品的储备积累的基础上,已经开始布局自动驾驶的新阶段,这让自动驾驶这个曾经可望而不可及的技术离我们越来越近了。而眼下我们能享受到最新的“毫末红利”,应该就是应用于魏牌摩卡DHT-PHEV激光雷达版上的城市导航辅助驾驶功能了,如果你对它的能力感兴趣,甚至向挑战一把,不妨等新车到店之后去体验一下吧。