今年 3 月,特斯拉正式推送了智能驾驶软件 FSD V12.3 版本。这个版本的最大改变,就是把整个智驾系统工作的动力,从人类编写的代码,切换成了基于神经网络的 AI 大模型。马斯克用「Video in to Control out」来形容这种新的工作范式,即:AI 根据自己「看」到的路面信息,直接输出驾驶操作,也就是业界常说的「端到端」(End-to-End)。
上个月,何小鹏在加州体验了 FSD V12.3.6 版本。用他的话来说,FSD「很多路况处理都很丝滑」。这正是 AI 神经网络相比于代码驱动的最大优势所在:在不同城市、不同路况下,大幅提高智驾系统的泛化学习能力。
翻译成国内消费者们更熟悉的广告营销话术就是:全国(全球)都能开。
华为在去年9月喊出「全国都能开」的宣传语 |
当然,这个结论在现阶段还只是一个美好的心愿。在实际操作过程中,还需要数据、算法、算力等 AI 基础设施的全力加持和训练,才可能接近「AI 变得和人类驾驶员一样聪明」这个目标。
以华为系为例,鸿蒙智行过去一年多的时间里展现出了极强的终端销售能力,但对于华为车 BU 服务的不同品牌、不同型号的车型来说,端到端落地后仍然需要工程师进行对齐和交付工作。对于有 2 个品牌 9 款车型的蔚来来说,同样如此,他们把集成团队重组到了交付团队中。
在Sora发布后,马斯克发推表示特斯拉用AI模拟真实世界驾驶 |
有一种观点是,以 Sora 为代表的文生视频类产品有可能成为端到端模型的素材来源。但哪怕对马斯克来说,用 AI 生成的内容训练 AI,也还没有得到公开认可。毕竟数据的数据对于模型训练太重要了。要知道,一向对人力成本极致「抠门」的马斯克,当年也在纽约雇了 1000 人团队,来为特斯拉的道路视频数据进行标注。
这一点和业界关于 Scaling Law 能否通向物理世界 AGI(通用人工智能)的认知是一致的:可以肯定,生成式人工智能可以具备更高的智能,但是否可以理解物理规律,并在自动驾驶、机器人等领域应用,学界尚无定律。在《端到端自动驾驶行业研究报告》,有超过一半的从业者不认为端到端是自动驾驶技术的终局解决方案。