理想汽车的VLA“长征”

2025-08-12 17:53

在理想i8发布会举行之前，理想汽车董事长兼CEO李想与前同事、维他动力联合创始人赵哲伦分享了自己关于“选择”的长期主义哲学。

“要选‘长’的，这件事情最好要很长时间才能成功，如果是个很短时间就能成功的，就意味着所有人都能成功，反而没什么壁垒。选‘长’的，跟时间做朋友，就有耐心了。”李想说。

当晚，外界都以为理想i8是唯一主角。但这是一场有双主角的发布会，李想在现场宣布，理想VLA司机大模型将随理想i8一同交付。

作为发布会上的另一个主角——VLA其实更能反映李想的长期主义哲学。

2025年的智能驾驶战场，弥漫着“短平快”的焦虑。数据上，部分车企依赖人工采集“老司机数据”，甚至雇佣数百人实车路测，成本高昂却效率低下。算法上，端到端+VLM架构遭遇瓶颈——训练数据突破1000万Clips后，性能增长缓慢。评测上，实车测试无法复现极端场景，接管里程的数字繁荣背后隐藏着极端场景的未解难题。

面对这些现象，李想曾用这样一句话提醒公司乃至整个行业——端到端模型像猴子开车，它能够学习人类行为，但并不理解物理世界。

李想的犀利比喻，直指行业痛点——短期可落地的技术≠真正智能。基于这样的信念，理想没有简单粗暴地用规则算法“修补”端到端缺陷，而是选择了一条更艰难的长期主义道路：推翻现有架构，自研VLA司机大模型。

为何VLA是“正确的事”

区别于端到端架构的模仿学习，VLA司机大模型的优势是通过强化学习不断进化，让机器理解“为什么这样做”。这不仅关乎技术路线，更是一场关于用户体验、商业效率与技术野心的深刻重构。

首先，VLA能像经验丰富的司机一样预判风险（如盲区车辆切入）。理想汽车自动驾驶研发高级副总裁郎咸朋希望，未来VLA能将事故里程（MPA）提升至人类驾驶的10倍，做到600万公里才出一次事故（当前理想辅助驾驶为350-400万公里/次事故，人类驾驶约60万公里/次事故）。

其次，VLA 还能“越开越像你”。激进派车主获得高效变道，稳健派车主享受平顺巡航——VLA通过持续学习用户习惯，让车辆“越开越像主人”。郎咸朋描绘未来：“强化学习是有这个能力来支撑它这个车越开越像你的风格或体验，之前端到端可能还不具备这样的能力。”

郎咸朋透露，未来不同家庭成员上车，系统将通过Face ID自动切换至其偏好的驾驶风格，车辆真正成为懂你的“个性化司机”。

理想没有让自己陷入“百万公里实车测试”的重资产泥潭，而是选择用VLA撕开了行业的成本伪装。当然，仿真不是为了省钱所做出的选择，它是能跑赢技术迭代的选择——实车测试永远追不上Corner Case的产生速度。

郎咸朋揭示了效率本质：“任何技术的提升一定伴随着研发流程的变革，工业时代来临后，刀耕火种的流程被机械化替代……而进入了VLA大模型时代，测试效率是提升能力的核心因素。”

2025年上半年，理想依托世界模型的仿真测试累计里程已突破4000万公里，每天的测试里程最大的峰值可达到30万公里，这是实车测试无法企及的速度与规模。

郎咸朋点明VLA快速迭代的秘诀：“VLA评测就像之前的实车评测一样……我们的VLA仿真评测已经在超级对齐里做好了基础，现在已经有超过40多万个场景评测了。” 这构成了对手难以短时间复制的核心壁垒。

在VLA的长跑中，理想展现出惊人的战略定力——精准平衡短期妥协与长期收益。

在用户端，理想接受初期功能保守，例如地库限速最初为10 km/h ，现在逐渐提升到15km/h，换取绝对安全冗余。但郎咸朋承诺“进一步提升能力并且做好测试之后，我们会逐步打开这个能力的车速上限”。

在技术端，理想牺牲端到端短期数据优势（堆Clip数），换取VLA的“思维涌现”能力。郎咸朋对比鲜明：“如果还是沿着端到端思路去做所谓VLA，你的速度一定会变慢……首先你要训1亿个Clips需要多大的训练算力？”

同时，理想专注构建仿真评测壁垒。郎咸朋清醒判断：VLA仍处技术周期早期，首要任务是“很好地验证这套系统”。

市场反应印证了VLA的长线价值。今年1月发布的《理想智能驾驶2024年出行报告》显示，理想汽车智能驾驶试驾率达到72.4%，试驾满意度为92%，30万以及40万以上车型AD Max交付量占比分别为75.4%、84.6%。

可以看出，理想辅助驾驶不再是用户购车决策中的弱势项，而是驱动品牌销量增长的重要因素，这也是VLA司机大模型与理想i8一同发布、一同交付的原因。

郎咸朋希望，2025年底将MPI接管里程提升至400-500km，到明年能够达到1000km。“明年我们如果到了1000km的MPI水平，可能会给用户这种感觉真的到了一个VLA的ChatGPT的时刻。”理想汽车自动驾驶高级算法专家詹锟说。

对VLA的坚定选择，背后是理想的技术信仰。VLA是理想对行业本质问题的回答：真正的智能不是“能做什么”，而是“为何这样做”。

数据、算法、算力、工程四重难题

自研VLA，这是人迹罕至的路，郎咸朋的团队知道，啃下这块“硬骨头”，需要一场从数据、算法、算力到工程能力的全方位“长征”。

在数据问题上，截至2025年7月，理想积攒了累计43亿公里辅助驾驶里程、12亿公里有效回传数据——这是理想从2020年理想ONE时代就开始布局的“数据金矿”。

接下来是数据清洗的“炼金术”。理想剔除了近1/4“不合规驾驶行为”，仅保留“老司机数据”。理想汽车自动驾驶高级算法专家湛逸飞解释：“我们需要的数据用一个词总结叫‘老司机数据’。”他们在云端部署模型，甚至利用大模型对数据进行“老司机”标准的严苛筛选。

为了实现世界模型的颠覆性革命，理想做出了一个大胆决策：用仿真测试替代90%实车路测。通过三维重建与场景泛化技术，1:1还原极端场景。这源于一个严峻的事实，即实车测试永远无法100%还原事故现场。

湛逸飞透露，依托强大的世界模型，单日峰值测试里程达到30万公里，2025年上半年累计超4000万公里。

这并非一蹴而就。2024年，理想进行了150多万公里实车测试，并非为了数据本身，而是为了验证和校准仿真环境的可靠性。湛逸飞坦言，最初世界模型仿真复现率是存在问题的，团队通过一年时间，针对漏洞进行大量工程和算法优化，将仿真一致性提升至99.9%以上。

在算法问题上，李想曾尖锐评价端到端模型“像猴子开车”——能模仿动作，却无逻辑思维。VLA的突破，核心在于赋予机器“思考的能力”。

CoT思维链（Chain-of-Thought）是VLA的核心突破。它能实时呈现决策逻辑（如屏幕显示“拒绝逆行因安全合规”），彻底解决端到端“无脑执行”的痛点。换句话说，理想不是在教AI开车，而是在教它理解人类世界的规则。

面对大模型部署车端的世纪难题，理想选择了最硬核的自研之路。

推理速度慢？今年，理想汽车将成为首个在Thor-U部署VLA模型（4B的MoE混合专家模型）的车企。理想汽车自动驾驶高级算法专家詹锟自豪地说：“目前没有任何一个架构是这样的，这是我们与基座团队共同研发，专门对嵌入式芯片做了定制的MoE混合专家架构，在这个架构上我们才能达到这样的效果。”

轨迹生成时延高？理想不是直接使用标准Diffusion，而是进行了推理的压缩。詹锟揭秘：“以前Diffusion可能要推理10步骤，我们使用了flow matching流匹配只需要推理2步就可以了，这方面的压缩也是导致我们真正能够部署VLA的本质原因。”效果就是，轨迹生成时延仅15毫秒。

模型部署难？理想将32B云端大模型蒸馏至3.2B车端MoE模型。詹锟团队完成了看似不可能的任务：“我们最早训练了一个32B的云端大模型……把它做出的思考和推理流程蒸馏到3.2B的MoE模型上。”

在算力问题上，理想关心“有效算力”。最终，理想在Thor芯片上实现700TOPS有效算力。詹锟解释秘诀：“传统的训练一般都会拿FP32去做训练...我们有一个训练过程叫QAT（量化感知训练）……在训练过程中，我把参数就把它变成INT8或FP8。”

詹锟回顾攻坚过程：“我们的工程团队、部署团队做了非常多的工作，包括我们魔改CUDA的底层，重写PTX底层指令，才能实现现在的效果。”

为了打破“芯片歧视链”，理想让Orin X芯片和Thor芯片车型都能获得VLA，这源于理想工程部署能力的一贯积累。“从早期在地平线J3部署高速NOA，到在Orin芯片上部署大模型，再到现在在Thor芯片上部署VLA高频快速的大模型……很多技巧和分析方法，以及基础设施的工具链都继承下来了。”詹锟说。

数据、算法、算力和工程能力的四位一体，构筑了理想VLA的护城河。而这场啃硬骨头的长跑，旨在回答一个问题：真正的智能，是理解“为何这样做”。

技术背后的价值观

当VLA司机在双向单车道上拒绝执行“左转避开三轮车”的指令时，一场关于机器价值观的公开拷问被引爆。这不是技术故障，而是理想团队主动选择的安全底线。郎咸朋深知，VLA的每一步突破，都伴随着尖锐的质疑与艰难的权衡——这是啃硬骨头必然付出的代价。

如何应对用户信任带来的风险，是理想正在面对的第一个问题。

“请左转避开三轮车。”——面对这样的指令，VLA在双向单车道上陷入沉默。詹锟表示，这不是技术故障，是价值观的主动选择。

一方面，复杂指令存在“通识门槛”，例如“前进10米”依赖物理常识涌现。詹锟解释核心原理：“当量级达到一定规模时，会涌现出组合泛化的能力……它懂了数字，懂了米数，就能组合应用。” 但这需要海量数据与迭代时间。

另一方面，交互权责存在模糊地带。用户闲聊提及“左转”可能误触发指令，理想i8发布会上播放的岳云鹏驾驶VLA车辆的视频，就以一种轻松的表达方式展现了这个问题。

“我们现在肯定是为了保持准确，防止出现一些误判，比如你本来不想操控车的行为，突然去操控了，这肯定是存在一些还需要迭代和优化的地方。”詹锟坦言挑战。而理想的解决方案指向“统一大脑”，让车辆对用户的想法有更精准的理解。

如何应对效率、安全、舒适的“不可能三角”，是理想正在面对的第二个问题。

郎咸朋强调，理想的选择，是安全大于舒适和效率。按照这一原则，现阶段车辆即便走错路，VLA也不会通过一些危险的驾驶动作进行纠正。只有在保证安全的前提下，VLA才会去努力让行程更舒适和更高效。

当然，任何选择都会付出代价。“代价就是初期体验保守。”郎咸朋坦言，他同时承诺，我们会逐步打开能力上限。

如何应对行业内卷背景下的对手围剿和外界质疑，是理想正在面对的第三个问题。

对于理想而言，那些采取“短平快”打法的对手，它们炫耀参数的行为并不值得自己焦虑，因为单纯的参数优势，就像厨师夸耀灶台火力旺一样，其实，食客只在乎菜是否烧糊了。

从落地节奏看，质疑声认为“端到端生命周期仅1年，VLA是否昙花一现”，郎咸朋表示：“VLA架构会延续到机器人繁荣之后，才可能被其它技术替代，它是一个相对长期的架构，技术潜力非常大，也更像人类的智能发展规律。”

面对各种质疑，理想应对之道的根基是三大原则：一是安全绝对优先，MPA事故里程目标 600万公里（优于人类驾驶员10倍），用数据兑现承诺；二是有效算力至上，以 FP8/INT4量化革命让每颗芯片“鞠躬尽瘁”；三是用户共建迭代，134万车主接管数据驱动强化学习。

写在最后

理想汽车的VLA“长征”，远非一场单纯的技术突围。它是在智能驾驶喧嚣的竞技场上，对行业浮躁与捷径诱惑的一次“拨乱反正”。当整个行业被“短平快”的焦虑裹挟，沉溺于算力参数的军备竞赛时，理想选择了一条布满荆棘的自研之路。

这条路的艰难显而易见，但理想的创新内核，恰恰体现在这份对困难的坦然拥抱与主动选择上。李想所言的“选择‘长’的”，其深意不仅在于时间的长度，更在于路径的深度——深入本质，重构规则。

免责声明：本文观点仅代表作者本人，供参考、交流，不构成任何建议。

热新闻

视频推荐

总编对话｜从中国走向世界——对话松下电器中国东北亚公司总裁CEO木下步

聚焦主业提升品牌：恒安集团接班人的长期主义理想

希捷科技全球执行副总裁暨首席商务官郑万成：未来五年，中国将成为全球生成数据最多的市场

电子刊物

点击进入

用户名登录/手机号登录 还没有账号？免费注册

理想汽车的VLA“长征”

热新闻

视频推荐

电子刊物

用户名登录/手机号登录

还没有账号？免费注册