
高通在2021年投资者大会上宣布下一代CPU将由收购的Nuvia团队设计,预计2023年有样品可以交付大客户,目标市场针对Windows PC市场,也就是笔记本电脑市场,并且将扩展到移动、汽车和数据中心领域。
从高通第四代座舱芯片开始,高通车载芯片也不再沿用手机芯片的设计。高通座舱芯片与高通笔记本电脑芯片的设计开始非常近似,因为车载芯片与笔记本电脑芯片的需求基本一致,即追求多核性能而非像手机那样追求单核性能。早期手机也是看重多核性能,随着短视频和手机游戏的爆发,大部分人都是抱着手机划来划去几个小时,这时候单核性能重要性便得以凸显,手机从4大核加4小核改变为今天的1个超大核加3个大核加4个小核,或者再加几个中核。手机领域的设计在车载领域显得有些不合时宜了,因此第四代的典型代表SA8295P与高通笔记本电脑领域的8cx Gen 3很接近,这样做主要是车载领域出货量相比笔记本电脑和手机都太低了,为车载领域做一款全新的芯片,会导致每颗芯片上分摊的成本太高,采用高通芯片的笔记本电脑已经不少,甚至包括了高通的对手华为,华为的海外版MateBook E Go就采用了8cx Gen3,微软称8cx Gen3为SQ3,即Surface Pro 9。

8cx Gen3型号为SC8280XP,https://lore.kernel.org/lkml/20230405125759.4201-8-quic_kriskura@quicinc.com/,从中不难看出SC8280XP与SA8295P驱动几乎完全一致,应该差别很小,二者的推出时间差不多也接近,都是2021年4季度。同时SA8295P还有可能取代第一代高通Ride中的SA8540P,SA8540P与SA8195P接近。8cx Gen3有两个版本,一个带5G Modem,一个不带,华为的MateBook E Go就是不带5G Modem的版本。GPU也有Adreno 695和Adreno 690两个版本。
大胆推测,8cx Gen4与高通第五代车载芯片重合度也会比较高,估计在量产车上使用要到2026或2027年以后了。为何会抛弃ARM,主要还是ARM挤牙膏挤得让高通受不了了,ARM架构与苹果的差距让高通的手机和笔记本电脑都无法超越苹果。
ARM目前最顶级架构:Cortex-X3微结构

图片来源:ARM
苹果自A14起大核心Firestorm架构

图片来源:Apple
苹果微架构的中后端

图片来源:Apple
ARM目前最顶级架构Cortex-X3与苹果的A系列和M系列差距非常明显。

图片来源:Geekbench
单核跑分对比,苹果的优势非常明显。为何苹果如此之强?关键在于其IPC(每周期执行指令数)也就是图中的解码器是8个,即一个周期能执行8条指令。而ARM的Cortex-X3是6个解码器。另一个关键点是缓存大小。

图片来源:各公司
从上表不难看出ARM挤牙膏的过程就是不断增加解码器宽度和L1/L2缓存容量。而苹果自A14后一步到位,彻底碾压ARM。并非ARM没有能力一步到位,主要还是ARM要配合手机芯片厂家每年一升级,每年一换机,性能不能一步到位,否则吸引不了消费者换机了。而苹果的粉丝忠实度极高,即使苹果没有明显提升性能,苹果也能让粉丝换机。

图片来源:WikiChip
而对乱序执行影响比较大的指令重新排序缓冲区(Re-Order Buffer, ROB),Firestorm有640条,X3只有320条,A78只有256条。苹果的超强性能也有代价,那就是对晶体管密度要求高,必须用最先进的工艺,因此苹果需要和台积电合作,让台积电为其做出最先进的工艺,达到最高的晶体管密度,台积电开价自然不低,这也是台积电营业利润率碾压苹果的原因。ARM对先进工艺的迫切程度低于苹果。
苹果有没有缺点?当然有。

图片来源:Anand Tech
上图是苹果M1的die shot,可以看出CPU占用面积很大,比一般ARM要大得多,没办法,苹果的缓存太大,为性能不得不做大缓存,GPU面积也略大,GPU的效率肯定比不上高通的Adreno或AMD,这样就使得NPU不可能做太高,而高通的DSP做AI算力惊人,8 Gen1就有29TOPS,而苹果的M2才15.8TOPS。

图片来源:ARM
ARM 2023与2024路线图,估计2024年推出的CXC24(可能会叫Cortex-X5)会采用7位解码器,且必须配合3纳米制造工艺,即便是X5和苹果的Firestorm也有差距,换句话说,ARM落后苹果4-5年。因此高通等不及了,决定自研架构,这就是高通2021年1月收购的Nuvia。
Nuvia由三位苹果前高管创立,他们分别是威廉姆斯(Gerard Williams III)、古拉蒂(Manu Gulati)和布鲁诺(John Bruno)。这三位创始人都曾在苹果工作过,且在iPhone芯片部门担任过高管职务,拥有超过20年的半导体工程经验,迄今已获得100多项专利。其中:
- 威廉姆斯曾担任苹果CPU和A系列SoC首席设计师,九年期间几乎负责了苹果所有芯片的研发,包括Cyclone、Typhoon、Twister、Hurricane、Monsoon和Vortex等架构。他于2019年初离开苹果公司。除了苹果经历,另外两位创始人还在谷歌工作过。
- 古拉蒂曾在AMD和谷歌从事芯片研究,且在苹果公司工作了八年,从事移动端SoC的开发。
- 布鲁诺曾在谷歌从事芯片研究工作,2012年加入苹果公司,并在芯片平台架构小组工作了五年多。
- 2019年2月,三人在美国加州圣克拉拉郡(Santa Clara)联合创立Nuvia。
- 2019年11月15日,Nuvia宣布完成5300万美元的A轮融资,由著名的硅谷投资者Capricorn Investment Group和戴尔技术资本领投,Mayfield、WRVI Capital以及Nepenthe LLC参投。
- 加上2020年9月官宣完成的2.4亿美元的B轮融资,Nuvia两轮总募集资金达到2.93亿美元。
- 2021年1月高通以14亿美元收购了Nuvia。
- 2022年ARM起诉高通,主要是针对Nuvia,不过近期似乎两者已达成了和解,官司即使赢了,也打压不了高通另起炉灶的心,反而坚定了高通走独立研发架构的决心,输了对ARM自然也是不利,对高通来说,赢了也和长期合作伙伴ARM关系不再和睦,输了意味着14亿美元可能打水漂了。因此两家可能秘密和解了。
根据https://www.notebookcheck.net/Qualcomm-Snapdragon-8cx-Gen-4-New-leak-points-to-3-GHz-speeds-across-all-CPU-cores-and-TSMC-N4-node.690365.0.html 的信息,我们大致知道8cx Gen4的基本情况:
- l8 performances cores - 3.4 GHz peak clock speed
- l4 efficiency cores - 2.5 GHz peak clock speed(标称速率2.34GHz)
- lAdreno 740 GPU(现在手机旗舰8Gen 2也用这个GPU,2.14TFLOPS)
- lHexagon Tensor NPU (45 TOPS)
- l36 MB L2 cache
- l8 MB L3 cache
- l12 MB system-level cache
- l4 MB GPU cache
8个大核心每核心的L2缓存估计是4MB,4个小核心是1MB,性能比现在的SA8295P要强很多,SA8295P的大核心估计每核心的L2缓存也只有1MB。至于Nuvia Phoenix的架构,高通从未透露过,只能推测大概像苹果那样,8个大核心类似Firestorm,小核心类似Icestorm,将采用4纳米工艺制造,3纳米还太贵,3纳米用在出货量上亿的手机领域更合适。不过不管硬件如何演进,ARM的指令集谁也无法绕开,ARM建立了强大的生态系统,这个系统的核心就是ARM指令集,无论是苹果、英伟达还是高通,都绕不开。
高通即将在2023年推出的8Gen3旗舰手机芯片预计还是会采用ARM架构,台积电4纳米工艺N4P制造,超大核心是Cortex-X4,中核心是2个Cortex-A520,小核心是5个Cortex-A720。2024年推出的旗舰手机芯片8Gen 4也会采用Nuvia的架构,不过是2大核心(性能核)加6小核心(效率核),将采用台积电的N3E即第二代3纳米工艺制造。
8cx Gen4的AI算力很高,有45TOPS,几乎是苹果M2的3倍,对笔记本电脑来说,AI算力没什么作用,苹果一直都没有增加AI算力的打算,从M1到M2再到M2 Pro,AI算力一直都是15.8TOPS,但车载就不一样了,多多益善。高通第一代舱驾合一或者说中央计算芯片SA8295P的AI算力是60TOPS,估计第二代能到100-120TOPS,第五代座舱至少也是45TOPS,是目前SA8295P的1.5倍。
对国内芯片厂家来说,想彻底抛弃ARM恐怕还难以做到,如何面对高通的竞争,只能用ARM的服务器系列芯片与之对抗。
免责说明:本文观点和数据仅供参考,和实际情况可能存在偏差。本文不构成投资建议,文中所有观点、数据仅代表笔者立场,不具有任何指导、投资和决策意见。
更多佐思报告
报告订购及合作咨询请私信小编。
佐思2023年研究报告撰写计划
智能网联汽车产业链全景图(2023年4月版)
汽车电子代工 | 智能座舱平台 | 汽车数字钥匙 |
舱驾融合 | 自动驾驶SoC | 汽车VCU研究 |
自动驾驶融合算法 | 传感器芯片 | 汽车MCU研究 |
座舱SoC | 电源管理芯片 | 汽车CIS研究 |
车载存储芯片 | 车用超声波雷达 | 智能玻璃 |
AI大模型及自动驾驶智算中心 | 自动驾驶与座舱域控制器 | 冗余系统 |
自主品牌主机厂自动驾驶 | 汽车视觉(国内) | 高精度地图 |
合资品牌主机厂自动驾驶 | 汽车视觉(国外) | 高精度定位 |
ADAS与自动驾驶Tier1-国内 | 汽车视觉算法 | 汽车网关 |
ADAS与自动驾驶Tier1-国外 | 车载摄像头Tier2 | 数据闭环研究 |
ADAS域控制器关键组件 | 环视市场研究(本土篇) | 汽车功能安全 |
多域计算和区域控制器 | 环视市场研究(合资篇) | 汽车信息安全硬件 |
乘用车底盘域控 | 红外夜视 | 汽车信息安全软件 |
域控制器排名分析 | 自动驾驶仿真(国外) | 无线通讯模组 |
E/E架构 | 自动驾驶仿真(国内) | 汽车5G融合 |
L4自动驾驶 | 激光雷达-国内篇 | 800V高压平台 |
L2/L2+自动驾驶 | 激光雷达-国外篇 | 燃料电池 |
合资品牌主机厂车联网 | 激光雷达核心部件 | 一体化电池 |
自主品牌主机厂车联网 | 毫米波雷达 | 一体化压铸 |
自动驾驶重卡 | Radar拆解 | 汽车操作系统 |
商用车ADAS | 激光和毫米波雷达排名 | 数字仪表OS |
商用车智能座舱 | 矿山自动驾驶 | 线控底盘 |
商用车车联网 | 无人接驳车 | 滑板底盘 |
商用车智能底盘 | 无人配送车 | 电控悬架 |
智能座舱Tier1 | 无人零售车研究 | 转向系统 |
座舱多屏与联屏 | 农机自动驾驶 | 智能转向关键组件 |
智能座舱设计 | 模块化报告 | 线控制动研究 |
仪表和中控显示 | V2X和车路协同 | 充换电基础设施 |
智能后视镜 | 路侧智能感知 | 汽车电机控制器 |
行车记录仪 | 路侧边缘计算 | 混合动力报告 |
汽车UWB研究 | 汽车eCall系统 | 汽车PCB研究 |
HUD行业研究 | 汽车EDR研究 | IGBT及SiC研究 |
手势交互 | 智能汽车个性化 | EV热管理系统 |
车载DMS | 汽车多模态交互 | 汽车功率电子 |
OTA研究 | 车载语音 | 电驱动与动力域 |
汽车云服务研究 | 车载天线 | 汽车线束 |
AUTOSAR研究 | TSP厂商及产品 | 汽车音响 |
软件定义汽车 | 自动驾驶法规 | 汽车座椅 |
软件供应商 | 自动驾驶标准和认证 | 汽车照明 |
乘用车T-Box | 智能网联测试基地 | 汽车镁合金压铸 |
商用车T-Box | 车企数字化转型 | 智能表面 |
T-Box排名分析 | 理想L8/L9功能拆解 | 飞行汽车 |
车型供应商调研 | 蔚来ET5/ET7智能化功能拆解 | PBV及汽车机器人 |
蔚来丰田长城车机和座舱域控拆解 | 小鹏G9功能拆解 | 行泊一体研究 |
大疆前视双目与图达通激光雷达拆解 | 智慧停车研究 |
「佐思研究月报」
ADAS/智能汽车月报 | 汽车座舱电子月报 | 汽车视觉和汽车雷达月报 | 电池、电机、电控月报 | 车载信息系统月报
评论·0