业务合作发布作品

    理想汽车发布下一代自动驾驶架构

    03-24发布

    MindVLA不是筒単地将端到端模型和VLM模型 结合在一起,所有模块都是全新设计。3D空间编码器通过语言模型,和逻辑推理结合在一起后,给出合理的驾驶决策,并输出一组ActionToken(动作词元),Action Token指的是对周围环境和自车驾驶行为的编码,并通过Diffusion(扩散模型)进一步优化出最佳的驾驶轨迹,整个推理过程都要发生在车端,并且要做到实时运行。

    作者提到的车系: