引言
从2015年开始,英伟达开始进入车载SoC和车载计算平台领域,为自动驾驶提供基础计算能力。此后英伟达几乎每隔两年发布一款车规级SoC芯片,且不断拉升算力水平。2020年,Xavier芯片算力为30 TOPS,2022年发布的Orin算力为254 TOPS,2022秋季GTC大会上发布了新自动驾驶芯片Thor,算力为2000TFLOPS@FP8、4000TOPS@INT8,取代了之前发布的算力达1000TOPS的Altan。

2015 DRIVE PX
2015 年 1 月,英伟达发布 DRIVE 品牌和它旗下的两款汽车计算平台,其中 DRIVE PX 基于 Terga X1 芯片和 Maxwell GPU,拥有超过 1 TOPS 的算力,而且可以支持计算机视觉和机器学习技术。
据说,2016 年 1 月,黄仁勋带着英伟达的初代自动驾驶计算平台 DRIVE PX,率领团队来到特斯拉位于加州的办公室,见到了马斯克。马斯克用它跑了几遍当时 Autopilot 团队训练出来的一个神经网络模型。

2016 年年初,英伟达发布了 DRIVE PX 2——黄仁勋称之为「世界上第一个面向自动驾驶汽车的超级计算机」。

2018 Xavier
NVIDIA在2018年CES上推出了Xavier平台,作为Driver PX2 的进化版本。NVIDIA称Xavier 是“世界上最强大的SoC(片上系统)”,Xavier可处理来自车辆雷达、摄像头、激光雷达和超声波等传感器的自主驾驶感知数据,能效比市场上同类产品更高,体积更小。“NVIDIA Jetson AGX Xavier 为边缘设备的计算密度、能效和 AI 推理能力树立了新的标杆。”

2020年4月上市的小鹏汽车P7,成为首款搭载 NVIDIA DRIVE AGX Xavier 自动驾驶平台的量产车型,小鹏 P7 配备了13 个摄像头、5 个毫米波雷达、12 个超声波雷达,集成开放式的 NVIDIA DRIVE OS 操作系统。
Xavier SoC基于台积电12nm FinFET工艺,集成90亿颗晶体管,芯片面积350平方毫米,CPU采用NVIDIA自研8核ARM64架构(代号Carmel), 集成了Volta架构的GPU(512个CUDA核心),支持FP32/FP16/INT8,20W功耗下单精度浮点性能1.3TFLOPS,Tensor核心性能20TOPs,解锁到30W功耗后可达30TOPs。
Xavier是一颗高度异构的SoC处理器,集成多达八种不同的处理器核心或者硬件加速单元,使得它能同时、且实时地处理数十种算法,以用于传感器处理、测距、定位和绘图、视觉和感知以及路径规划等任务负载。
2019 Orin
2019年12月英伟达发布了新一代面向自动驾驶和机器人领域Orin芯片和计算平台。
具有ARM Hercules CPU内核和英伟达下一代GPU架构。Orin SoC包含170亿晶体管,晶体管的数量几乎是Xavier SoC的两倍,具有12个ARM Hercules内核,将集成Nvidia下一代Ampere架构的GPU,提供200 TOPS@INT8性能,接近Xavier SoC的7倍,Orin SOC在2021年提供样片,2022年正式面向车厂量产。

2020年5月GTC上,英伟达介绍了即将发布的新一代自动驾驶Drive AGX Orin平台,它可以搭载两个Orin SoC和两块NVIDIA Ampere GPU,可以实现从入门级ADAS解决方案到L5级自动驾驶出租车(Robotaxi)系统的全方位性能提升,平台最高可提供2000TOPS算力。未来L4/L5级别的自动驾驶系统将需要更复杂、更强大的自动驾驶软件框架和算法,借助强劲的计算性能,Orin计算平台将有助于并发运行多个自动驾驶应用和深度神经网络模型算法。
作为一颗专为自动驾驶而设计的车载智能计算平台,Orin可以达到ISO 26262 ASIL-D 等级的功能安全标准。
借助于先进的7nm制程工艺,Orin拥有非常出色的功耗水平。在拥有200TOPS的巨大算力时,TDP仅为50W。
2021 Altan
Atlan,单颗1000TOPS AI算力。
原本预定Altan芯片将于2024年上市,2025年正式装车。

2022 Thor
Thor可以同时支持ADAS系统和IVI系统,具备770亿个晶体管,算力将会达到2000TOPS以上。

黄仁勋介绍,能够实现这个目标主要有三点,分别是对CPU(Grace)、GPU(Ada Lovelace)和处理Transformer模型的引擎(Hopper)进行了升级。
黄仁勋表示这颗SoC就是为汽车的中央计算架构而生,用这一颗芯片打造一个控制器,即可同时为自动泊车、智能驾驶、车机、仪表盘、驾驶员监测等多个系统提供算力。

Thor中还引入了Grace CPU,同样有着良好的表现,以往所有的并行算法都由英伟达的GPU进行加速,其余工作负载往往会受到单线程限制,而Grace正好拥有非常好的单线程性能。

Thor可以被配置成多种模式,可以将其2000TOPS和2000FLOPs全部用于自动驾驶工作流;其2000TOPS的算力也可以分开用,如一部分用于驾驶舱AI和信息娱乐系统,另一部分用于自动驾驶。

渝公网安备50010502503425号
评论·0