作者 / 于雷
在四部委联合印发通知,部署开展智能网联汽车准入和上路通行试点工作之后,特斯拉FSD在国内落地也被认为进入倒计时阶段。
随后更有特斯拉中国回应:「目前确实正在推进中。」

无独有偶,也有车主发现,特斯拉已在最新一版用户手册中,加入了FSD Beta版本的介绍及使用规范。种种迹象似乎都在表明,FSD离我们越来越近了。
FSD落地难在哪?
从2020年,向美国部分用户推送Bate版本开始,FSD已经对公众开放了3年之久,累计进行过12个大版本的迭代。
但直到现在,FSD仍未能进入国内,用户最多也只能体验到EAP增强辅助驾驶系统。

按照特斯拉的分级,EAP虽然要强于入门版AP,但也只能具备高速NOA的能力。而现在国内头部智驾系统主打的城市NOA,对应的则是更高定位的FSD。
特斯拉把支持城市场景的功能早早做出,但又不能带入国内,实际是一直受到两个方面的困扰。
其一是测绘资质。中国是对测绘资质有严格限制的国家,企业要采集、储存地图数据,必须拥有测绘资质。而智能驾驶系统,无论是否使用了高精地图,实际都属于测绘。

这一点在《自然资源部关于促进智能网联汽车发展维护测绘地理信息安全的通知》中有明确规定:自动驾驶汽车收集道路环境信息是测绘行为,相关企业主体应当申请测绘资质或将这些工作委托给有资质的第三方。
清华大学学科办主任、车辆与运载学院首任院长杨殿阁也曾指出:只要车辆有摄像头等传感器,具有定位功能,实际上就是在测绘。
而对于支持城市场景的FSD来说,虽然号称不依赖高精地图,但是面对城市复杂路口和衔接点,仍需要比较高精度地图的信息辅助,这说明还是要有测绘资质的图商支持。

另外,特斯拉基于视觉信息的道路重建能力、相当于众包建图的4D标注方案,也使其受到有关国家安全的质疑,还被多个场合禁止入内。
更重要的是,特斯拉是一家海外车企,在这里受到的关注要更加集中,也因此需要更加明确的政策才能落地。
一位在X(原推特)平台认证为Tesla China Analyst的博主也表示:「自己曾与特斯拉讨论FSD进入中国的时间,特斯拉回应需等待中国相关自动驾驶法律法规最终确定。」

除了测绘的相关问题,FSD的数据储存和处理,也事关其能否顺利进入国内。
FSD的表现好坏与影子模式息息相关,它取代了测试车队,通过与真实车主驾驶行为的对比,可以快速实现长尾场景的覆盖。真实的行驶数据越多,FSD的表现也就越好。
而国内道路环境、交通规则与美国并不相同,甚至不同城市间都有不小差异,美国版本的FSD无法直接拿来使用,行驶数据对国内价值也比较有限。
因此,FSD想要在国内使用,不仅要在本地采集存储,还要自建超算中心。

今年8月份,特斯拉在OTA中更新了一项允许收集AP数据的选项。同时有消息称,特斯拉在上海组建了FSD的运营以及数据标注团队,并派本部工程师来做培训。
但FSD想要变得可靠,还需要大量且长期的真实数据支撑。
后来者,仍然能居上?
国内的智能驾驶竞争已经如火如荼,今年轻地图城市NOA更是开始大规模落地。这对于还没进入国内的FSD来说,是否意味着错过了良机?
回看近几年的消费趋势,智能驾驶虽然开始成为车企差异化竞争的配置,销量逐步超过标准版车型,但还没有形成太强的品牌效应。即使是华为,也是在推出ADS 2.0之后,才真正推动问界销量越级增长。
对于当前的消费者来说,智驾技术本身,要比品牌更值得买单。特斯拉虽然晚到,但作为轻地图路线几次技术变革中的引领者,仍会有不可忽视的号召力:

2021年,特斯拉提出BEV+Transformer,把智能驾驶从决策层的后融合,变成了特征级的中融合。
在此之前,智能驾驶通常先由每个传感器输出自己的判断结果,之后根据场景和传感器类型投票。这比较容易导致低置信度信息被过滤,产生信息失真,造成错误决策。
而特斯拉则是提出在BEV(鸟瞰图)空间层进行特征级融合,再通过多层的Transformer和2D图像特征进行交互融合,最终得到BEV特征。
相比后融合,这种方式可以提高判断准确度,有助于实现多模融合、时序融合、脑补出遮挡区域等。
随后,特斯拉又发现了对单张图片感知的弊端,在此基础上增加了时空序列特征层。从对单张图片,变成对一段视频进行感知,判断的准确性又被进一步提高。
2022年,特斯拉又针对真实路况错综复杂的道路环境,提出了另一个重大升级——占用网络(Occupancy Network)。

特斯拉这时意识到,用标注来覆盖住所有物体,并不现实。
所以,通过占用网络,将空间分割成无数个微小立方体(体素),再结合特征判定每一个体素被占用的概率和动静状态,就可以进一步得到物体的体积信息。
这样不用分辨出具体的目标,就能直接判断出是否是障碍物。相比于传统方案,占用网络将算法的泛化能力大幅提升。
直到现在,占用网络仍是国内头部智能驾驶公司,还在探索的技术。
大部分商业化方案,其实还都没有离开多传感器融合,就连有百度技术加持、号称国内首个量产纯视觉占用网络的极越,也要等到明年1月份才能推送。

与国内公司的智驾方案相比,特斯拉FSD在技术上仍然存在明显优势,欠缺的只是符合国内场景的训练数据。
但在目前的背景下,特斯拉尚未建立起中国的超算中心,又不能把数据传到海外训练。即使现在就能落地,想要追上国内车企的表现,也需要一段时间。
更重磅的FSD V12
但在海外,特斯拉仍保持着FSD的高速迭代。
还不到一年,特斯拉就把去年12月立项,今年4月扶正的FSD V12,向内部员工推送。这也是行业首个规模化落地的端到端(从视频输入到控制输出)智能驾驶AI算法。

通常来说,智能驾驶可以被分为感知、决策与控制三个部分。目前一些比较先进的方案,也仅是把神经网络用作感知,决策还是要依靠人工规则来实现。
而FSD V12上,感知、决策、控制则全部交给由神经网络。马斯克也将它称作「端到端人工智能」,认为这是特斯拉FSD AI的最后一块拼图。
端到端的一大显而易见的好处是,大幅减少了控制堆栈中的代码行数。FSD V12,已经从V11超过30万行的C++代码,降低了到了2000行。
另一方面,智能驾驶算法的完全AI化,也使得影响其能力表现的因素,从工程师代码,变成了数据和算力。
虽然相比于过去的方案,端到端算法的能力起步较慢,也容易出现黑盒问题,甚至在部分场景下,可能出现一些能力倒退。
但如果能够顺利落地,再依靠特斯拉庞大的数据量,不仅能够解决当前的一些长尾问题,也不再需要对不同城市交通环境和规则的差异,进行人工适配。

从今年8月份马斯克进行的FSD V12直播试驾来看,除了一次被左转车辆误导误判直行红灯,都没有出现太明显的的失误。

其中的无保护左转、通过环岛、看到停车标志让行等一系列场景,都是在没有具体代码的情况下,正确处理的。
在当时,马斯克也提到了黑盒问题:「仅仅因为没有代码行并不意味着它不可控。现在只需拥有数据,你仍然可以实现控制。」
对此,特斯拉选择的是,只采用老司机的视频片段,作为训练数据。如果发现某些场景处理不好,还会针对性的多喂数据。
在FSD V12在训练过程中,输入超过100万个视频后,系统表现就已经有了良好的转变。到今年年初,特斯拉已经向其输入了1000万段老司机数据。
而数据和数据引擎,正是特斯拉的核心竞争力。根据2023Q3财报,特斯拉FSD累计行驶里程已经超过了5亿英里。

目前,特斯拉在全球已拥有近200万辆的车队,每天会提供约1600亿帧视频用于训练。特斯拉预计,未来用于训练的视频将达到数十亿帧。
从最近的传闻来看,FSD如果按期进入国内的话,很可能会是V12。
这一版本实现的端到端AI方案,不仅是路线上的变化,迭代关键在变为数据和算力之后,很可能还会基于特斯拉本身的数据优势,建立起新的技术壁垒。
事实上,这也是特斯拉在电动化之后,新一个战略重点。马斯克毫不避讳的承认,主线任务就是让FSD真实落地,这是特斯拉价值连城,还是基本为零的区别。
当然,与国内头部智驾公司相比,FSD的技术优势,固然有潜力转化为销量和号召力。但在如今已经卷到「免费」城市NOA的阶段,FSD能否被顺利买单,其高昂的售价,反而可能会变成更大的挑战。
评论·0