端到端大模型上车”
作者|王磊
编辑|秦章勇
这可能是一次“史诗级”的OTA。
新增功能超过1000个,体验优化超5000项,单升级说明就超过1.3万字。
小鹏汽车智能体验负责人于桐也调侃,上次写那么多字,还是在上大学写论文的时候。
史诗级更新背后,是一个信息量巨大的迭代升级。5月20日,小鹏汽车举办了AI DAY发布会,一是宣布端到端大模型已经量产上车,二是面向用户全量推送AI天玑系统,两大升级都围绕一个主题——AI全面上车,从智驾到智舱。
大模型上车后,车子变得更聪明,智驾能力提升2倍,接管率更低;座舱虚拟助手小P也完成了从“工具”到“朋友”的转变。
看这个架势,小鹏对智驾一哥的位子是势在必得。
01?
端到端大模型量产上车
上一个10年,是新能源汽车时代,下一个10年,则是智驾汽车时代。
这是何小鹏对于汽车行业的判断,而他也对小鹏的智驾立下几个小目标:
--今年第三季度,小鹏的NGP不仅全国都能开,而且全国每条路都能开。
--2025年,城区智驾堪比高速智驾体验。
--2025年将在中国实现类L4级智驾体验。
何小鹏这么自信的前提是,端到端大模型已量产上车。是的,当很多车厂还在说占用网络上车甚至还只是BEV+Transformer上车时,小鹏端到端的智驾要落地了。
何小鹏也在发布会上坦言,“在过去的一年里面,我们重写架构,让部分朋友们等得有点久。”不难看出,小鹏将“扳回一城”的希望,寄托在端到端大模型的量产上车。
何小鹏认为,之前之所以总见到出错的智能驾驶车辆,是因为之前的智驾方案对于感知、规控、控制这些方面都是分开来处理的,所以车辆在遇到一些场景处理上会有博弈和犹豫,也就是要在人写的规则内,以及多个环节中进行权衡。
换句话说,端到端大模型下的智驾,会更加的类人化。
不再依靠固定的规则代码来驾驶车辆,而是“丢掉规则”,像人类一样,边走边看,边看边想,边想边做。
何小鹏在发布会后接受采访时也回应,什么是真正的端到端?“随便去一条真正的、任意的道路上跑100公里,去看它的个性化能力。”
小鹏汽车端到端的实现,归功于XNet+XPlanner+XBrain三者构成的端到端AI大模型。
按照发布会上的说法,深度视觉感知神经网络XNet 2.0就像人类的眼睛,规控大模型XPlanner 相当于人类的小脑,而AI大语言模型XBrain则等同于大脑。
XNet深度视觉感知神经网络是动态BEV、静态BEV和占用网络三个神经的整合,让自动驾驶系统如同开了天眼,对现实世界中的可通行空间进行高真实度还原。
XNet2.0用上了行业首个量产的2K纯视觉占用网络,用超过200万个网格重构世界,清晰识别静态障碍物的每一个细节,感知范围可达1.8个足球场大小,能精准识别50+个目标物,驾驶时看得更清、更远。
感知之外,就要通过海量数据时刻训练,?XPlanner就像人类的小脑,负责“身体的平衡”。向拟人进化的驾驶策略,实现前后顿挫减少50%、违停卡死减少40%、安全接管减少60%。
XBrain作为大脑,是思考中枢,让自动驾驶系统拥有像人一样的理解学习能力。识别待转区、潮汐车道、特殊车道、路牌文字,秒懂各种令行禁止、快慢缓急的行为指令,进而做出兼顾安全、性能的拟人驾驶决策。
眼睛看周围环境,大脑想怎么开,小脑控制肢体运动。
通过模仿人类的思考决策逻辑,取代传统的人工手写算法规则,这样,系统处理复杂甚至未知场景的泛化处理能力大幅提升。
虽然何小鹏在发布会上特别强调,现有端到端智驾大模型体系下不完全只有神经网络,实际上目前也没有任何一个玩家将整个体系完全AI化。
不过做到这种程度也有指数级的提升。端到端的加持下,小鹏智驾能力较之前提升了2倍,能够做到「2天迭代一次」,目标是在未来18个月内智驾能力提升30倍。
基于此,2024年第三季度,小鹏汽车的智驾要实现“全国都能开,每条路都能开”,2025年实现城区智驾比肩高速智驾体验,实现类L4级的智驾体验。并且小鹏汽车正在全球范围对XNGP端到端的能力进行测试。
为了实现其目标,2024年其将投入35亿元用于智能研发,并新招募4000名专业人才,今后每年还将投入超过7亿元用于算力训练,今年的这个峰值的算力会到7000张训练卡以上。
有意思的是,发布会上提起研发团队时,何小鹏还说道,“团队的每个人都是骨干,我也想请各位友商,对小鹏汽车AD团队的骨干人员高抬贵手,少挖人。”
懂的都懂啊。
02
?AI天玑系统落地
端到端的量产上车,势必得有个好的载体,AI天玑系统顺势而生。此次发布会上,AI天玑系统也开始全量推送,小鹏汽车称其为“行业内首个将AI技术同时应用于智能座舱与智能驾驶的操作系统”。
AI天玑系统的核心在于其强大的AI大模型,不仅能够对车辆的行驶环境进行深度感知和预测,还能够根据用户的驾驶习惯和喜好进行个性化设置。
先说效果。OTA后,AI天玑系统的平均帧率、首帧跟手性、触摸响应速度均提升30%以上,应用启动速度提升50%。在用户公测中,AI天玑系统的满意度高达97%以上。
于桐在介绍天玑系统时表示,他们充分压榨了8155芯片的性能,它是在所有8155平台上最流畅的系统。当然在8295平台上它依然是最流畅的,而且流畅时间可以做到大于5年。
主要有三大核心功能,分别为AI小P、AI司机、AI保镖。
AI小P完成从“语音助手”到“朋友“的转变,应用了行业内首个全域大语言模型,将自研XGPT大模型、阿里通义大模型、智谱AI大模型三者融合,并将大模型能力深度融入用车全场景。
AI小P将具备更高级别的理解能力和需求推理能力,一个明显的变化是,不需要下达刻意的指令,只说需求就好。
而AI司机算是AI天玑系统的核心,主要分为AI代驾和AI泊车。
AI代驾功能,是一个“点到点”超长记忆领航智驾,AI代驾仅需一次学习,系统便可生成定制化的驾驶路线,提供覆盖全程的智能辅助驾驶体验。
它可以记录10条路线,每条路线最多可以记录100公里,并且这里体现AI最重要的一个环节在于,他是会根据你的驾驶习惯,来模仿你的驾驶习惯驾驶,而不是简单的通勤,这其中包括你驾驶是不是激进,习惯偏左还是偏右,是不是提前刹车,过路口的行为习惯等。
另外,针对泊车难题,小鹏汽车的AI泊车也可以做到全自动离车泊入和多场景极速泊车,可泊入车位提升3倍,泊车速度提升50%,侧方位、断头位等复杂车位也可一把到位。
AI保镖可能有些难理解,从字面意义上看是作为车辆的安全冗余。可以通俗地理解为主动安全提醒功能,提前识别非常广的范围,并且预警风险。例如起步盲区提醒、前车风险提醒、事故/临停车提醒、行人/非机动车提醒、变道风险提醒以及起步提醒等。
除此之外,还要全量推送。根据何小鹏的说法,就是要让所有小鹏的车都都能用上,即便是最初代的车型。
按计划,不仅向X9/G9/P7i/G6等新车型全量推送,算力结构简单的小鹏P5/G3i/G3 车型也会在2025年Q1开启公测,而且P7车型会在今年Q3开始公测。
03
?One more thing
公布AI技术的同时,何小鹏还官宣了一个重磅彩蛋,宣布AI智驾汽车小鹏MONA系列首款车型将在6月亮相。
根据此前消息,新车定位紧凑型纯电轿车,售价在15万元左右,并在三季度上市交付。
预告图上又透露了不少信息,新车有着独特的前大灯设计,行车灯将车灯分为上下两部分,下部分为大灯组。整个车身线条圆润,下方还会有大角度进深的包围造型设计。此外,新车采用隐藏式门把手,还能看到有侧面摄像头的存在。
车尾部分,尾灯造型与前灯呼应,造型圆润采用T字型造型,还能看到汽车C柱的最下方有疑似凸起的装置,类似于缩小版的分离式尾翼,目前尚未公布作用。
MONA的首款车由滴滴与小鹏共同打造,滴滴团队负责设计、一部分研发和销售。小鹏接手后,负责研发、供应链和生产制造等,以及面向普通消费者的销售。
据悉,对于MONA的渠道建设,前期会在小鹏综合店中开设“店中店”,之后再为MONA品牌单独开店。此外,MONA也将卖给网约车队等运营车辆需求方。
即便如此,这款车仍被小鹏汽车称为“AI智驾汽车”。
就像何小鹏在发布会上说得那样“智驾是小鹏汽车的核心,也是其立足市场的护城河”,在端到端率先落地的加持下,AI智驾是小鹏汽车破局的关键点。
但谈及高阶智驾,就无法忽略特斯拉,在发布会后,何小鹏接受采访时回答对于特斯拉放弃廉价车,全力投入自动驾驶的看法。
何小鹏称,“大模型对自动驾驶会是颠覆性的变革。今年以前,我觉得全无人驾驶还要好多年,今年端到端大模型开始上车测试之后,我们看到数据,觉得有机会在数年内实现。”
这无疑从一定程度上肯定了特斯拉目前的方向,毕竟特斯拉也是目前端到端的领头人。
而且有意思的是,发布会前,正值雷军直播测试完小米汽车的智驾水平,何小鹏也被问及如何看待和小米竞争的问题。
“小鹏是经过磨练的,现在卖得好的,不代表能力强,汽车行业是个长线的竞争,而不是短期一两个月的销量,波动不代表销售能力、整体能力,短期销量没有价值。”