10月23日,理想汽车行业首创的全新一代双系统智能驾驶解决方案端到端+VLM(视觉语言模型),随OTA6.4版本车机系统向理想L系列AD Max用户和理想MEGA(图片|配置|询价)用户进行全量推送,标志着理想汽车智能驾驶正式进入AI大模型时代。

本次OTA更新重点围绕智能驾驶能力升级,智能空间和智能电动也同步更新,为理想L系列和理想MEGA用户带来更全面的智能出行体验。据介绍,目前双系统架构可实现一周两个版本的高效迭代,领跑业内。
此次全量版本基于最新的V4.8.6模型,增加城市场景数据配比,提升了超车场景理解能力、导航信息理解能力、障碍物检测精度、停止线检测能力,场景全覆盖、行驶更舒适、通行更高效,智能驾驶产品价值再度进阶。
理想汽车端到端+VLM是集成了One-Model结构端到端模型+全球独创的VLM视觉语言模型,且率先将视觉语言模型VLM部署到车端芯片上的双系统方案,从创新技术阶段到实际落地,智能化、拟人化、稳定性程度持续稳步提升。

本次OTA6.4全量版本在端到端方面,新增路边起步、U形掉头、环岛通行功能,增强了拥堵路况下的变道、绕行、避让;复杂路口的精准选道;车辆或行人切入横穿场景下的识别反应等能力。真正实现城区场景无断点、复杂环岛可通行、U型掉头轻松过,拥堵博弈更自信、原地P挡能开启,为用户提供更加便利畅快的智能驾驶体验。
端到端模型基于人类司机数据训练,具备更强的复杂道路结构的理解能力。例如在不同的U型掉头场景中,都能输出合理轨迹,不再强依赖于导航信息和道路拓扑以及人工定义的规则去选择合适的路线。
更强的侧向感知能力可以更准确识别和预测对向直行车辆的行驶轨迹并做出避让动作,在环岛通行中可以更准确识别和预测旁侧切入车辆的行驶轨迹并进行合理博弈,进出环岛决策更果断,出口选择更精准。

此外,端到端还通过学习各种驾驶场景下的大量老司机数据,依赖纯模型式的算法,实现更拟人的加塞和蠕行博弈动作,在遇到前车减速的情况下会直接绕行蠕行通过;在复杂路口的无保护左转场景,精准把握车流空档,主动选择车流量更小的车道;由于端到端从感知到控制的时延更低,在遇到车辆或行人切入及横穿场景时,具备快速反应、及时减速的能力,兼顾安全和通行效率。
截止目前,理想汽车在端侧部署的VLM视觉语言模型已拥有22亿参数量,对物理世界的复杂交通环境具有更拟人的理解能力,即使面对首次经历的未知场景也能自如应对。
随着OTA6.4版本的正式推送,VLM视觉语言模型也迎来了重大更新,通过对大量人类老司机的驾驶数据、特殊车道场景的驾驶行为、驾驶过程中的困难场景进行学习,从而获得遵守交规、识别道路上的中文信息并深刻理解中文语义、识别潮汐车道和通行状态的能力,辅助端到端完成完整驾驶循环。

例如在限时公交车道,可轻松理解上方路牌限行信息文字和公交车道黄线识别,并对应做出执行控制;可识别潮汐车道和可变车道,以及可通行和禁行的状态标识,并正确选择车道通行;在丁字路口场景会主动采取防御性减速,避免以往在丁字路口场景,入弯偏快带来的不安全感;可识别减速带、坑洼路面、夜晚无灯、学校路段、施工场景、主辅路进出等场景并提前减速,同时通过语音/EID/UI交互等进行告警;在主辅路/高架场景下,可识别并理解自车所在位置为主路/辅路、高架上/下,纠正导航偏移,保障路线选择准确性。
不仅如此,OTA6.4版本还优化了高速NOA功能,在高速&城市快速路场景,针对前方慢车,具备更早识别、果断发起超车动作,更高效更安全。
评论·0