理想汽车发布下一代自动驾驶架构MindVLA,开启智能驾驶新纪元

2025年03月19日 09:37    发布者:eechina
在昨日举行的NVIDIA GTC 2025大会上,理想汽车自动驾驶技术研发负责人贾鹏正式发布了公司的下一代自动驾驶架构——MindVLA。这一架构融合了空间智能、语言智能和行为智能,旨在将汽车从单纯的运输工具转变为能够理解、思考并适应环境的智能体。

MindVLA是理想汽车自研的视觉-语言-行为融合模型(VLA),它成功整合了3D空间理解、逻辑推理与行为生成能力,为自动驾驶技术注入了新的活力。据理想汽车自动驾驶技术研发负责人贾鹏介绍,MindVLA不仅具备强大的感知和决策能力,还能够像人类一样理解并执行自然语言指令,实现更加智能化的驾驶体验。

在发布会上,贾鹏详细阐述了MindVLA的技术亮点。该架构采用三维空间编码器与语言模型融合设计,通过自研的混合专家(MoE)模型基座实现多任务处理。其3D高斯表征建模技术提升了自动驾驶场景建模效率,训练速度较传统方法加快7倍。同时,MindVLA还利用扩散模型(Diffusion)生成驾驶轨迹,结合常微分方程采样器实现高质量轨迹的快速生成。

除了技术上的创新,MindVLA还为用户带来了前所未有的智能驾驶体验。它“听得懂”用户的语音指令,能够实时调整车辆路线和行为;它“看得见”非标准化交通标志和复杂环境,确保驾驶安全;它“找得到”目的地和车位,即使在没有导航信息的情况下也能自主漫游寻找。

为了验证MindVLA的实际效果,理想汽车还分享了实车自动驾驶实测视频。视频中,搭载MindVLA架构的理想汽车能够准确理解并执行驾驶员的语音指令,如寻找星巴克门店、调整行驶速度、自动泊车等。这些场景充分展示了MindVLA如何让车辆像人类一样理解物理世界,实现更加智能化的驾驶。

据悉,MindVLA已完成工程化适配,计划于2026年搭载于量产车型中。这一消息无疑让广大消费者对未来智能驾驶充满了期待。同时,理想汽车还表示,该架构未来或拓展至室内环境等非驾驶场景,探索物理与数字世界结合的通用人工智能路径。

贾鹏在发布会上表示:“MindVLA是理想汽车在智能驾驶领域的重要突破,它将为汽车赋予类似人类的认知和适应能力,将其转变为能够思考的智能体。我们相信,MindVLA的发布将引领智能驾驶新纪元,为用户带来更加智能、便捷的出行体验。”

核心特性

​3D高斯建模:通过多尺度几何表达与自监督学习,实现复杂环境的实时解析,提升下游任务性能超30%。
​MoE架构+稀疏注意力:采用混合专家架构与稀疏注意力技术,保持毫秒级推理速度的同时,模型规模增长。
​人类式思考:引入“快思考”与“慢思考”双模式,车辆能在常规场景中快速响应,在复杂博弈中深度分析。
​扩散模型优化:基于扩散模型与ODE采样器,仅需2-3步即可生成高精度轨迹,优化安全底线。
​云端世界模型:自研“重建+生成”云端模型,通过3D高斯技术将场景重建速度提升7倍,支持大规模闭环强化学习。
​跨领域泛化:模型在训练中融入多模态数据,展现出室内导航、物流调度等跨场景潜力。

行业影响

理想汽车CEO李想表示:“MindVLA将像iPhone 4重新定义手机一样,颠覆自动驾驶。”这一技术的发布不仅对汽车行业产生深远影响,还将为物流、安防等领域带来新的发展机遇,打开万亿级AGI市场。