小鹏汽车与北京大学合作研发的高效视觉标记剪枝框架FastDriveVLA,近日被全球顶级人工智能会议AAAI2026接收。该框架专为端到端自动驾驶中的视觉-语言-动作(VLA)模型设计,通过对抗性前景-背景重构策略,智能筛选关键视觉信息,大幅降低计算负载。在nuScenes基准测试中,当视觉标记从3249个减少至812个时,计算量降低近7.5倍,同时保持高规划精度。这是小鹏今年第二次在国际顶会亮相,此前其VLA2.0架构已实现视觉直连动作生成,省去语言翻译环节。小鹏将持续推进L4级自动驾驶研发,加速大模型与车载系统的融合。
【网通社快报】小鹏汽车联合北大提出新型视觉剪枝框架,显著提升自动驾驶效率
次阅读
评论
赞同
收藏
分享
渝公网安备50010502503425号
评论·0