东方财富
📅 05/11 00:00
NVDA.OQCOM.OMU.O
行业观点 AI推理瓶颈迭代与架构演进,推动PCB价值定位跃升。Transformer架构下大模型推理分为Prefill与Decode两个阶段,前者为计算密集型,后者为显存带宽密集型,算力利用率与带宽占用率呈现极端错配。英伟达推出"解耦式推理"架构,将Prefill与Decode拆分到不同硬件,对PCB提出更高密度的HBM封装基板、更高速片间互联及更高功率密度供电散热要求。与此同时,从芯片到机架的尺...
行业观点 AI推理瓶颈迭代与架构演进,推动PCB价值定位跃升。Transformer架构下大模型推理分为Prefill与Decode两个阶段,前者为计算密集型,后者为显存带宽密集型,算力利用率与带宽占用率呈现极端错配。英伟达推出"解耦式推理"架构,将Prefill与Decode拆分到不同硬件,对PCB提出更高密度的HBM封装基板、更高速片间互联及更高功率密度供电散热要求。与此同时,从芯片到机架的尺度演进中,HBM4引入要求中介层支持千位级I/O;CoWoS-L向CoWoP演进让PCB首次承担类基板功能;GB300服务器PCB层数从10层跃升至20层以上,部分高端型号达34至64层;Rubin Ultra NVL576更以78层M9级正交背板取代铜缆,承担机柜内GPU全互联通信。行业竞争核心从“单卡算力”转向“全系统互联带宽”,PCB成为决定AI系统算力释放效率的关键瓶颈环节,技术门槛与认证周期对标半导体封装。 Rubin开启硬件密度时代,正交背板推动PCB半导体化价值跃迁。英伟达GTC2025发布Rubin系列路线图,开启AI硬件密度新时代:2026年下半年量产Vera Rubin NVL144平台,FP4推理算力达3.6EFLOPS;2027年下半年量产Rubin Ultra NVL576平台,FP4推理算力达15EFLOPS。黄仁勋提出"GPU数量按封装中芯片数量计"的新计算法则,标志以封装密度为核心度量的硬件密度时代来临。产业链视角下,Rubin系列拉动PCB“价量齐升”:量上,Rubin Ultra机柜GPU封装数量翻倍,带动PCB用量倍增;价上,平台采用M8U/M9级高端材料与超高多层设计,单台服务器PCB价值较上一代提升超两倍。正交背板作为标志性工程创新,通过78层PCB实现GPU与NV Switch互连,替代数万根铜缆。高盛预测2025-2030年AI服务器需求增约4.3倍,高端PCB供需失衡将延续至2027年,PCB在AI系统BOM中占比向半导体级组件靠拢,完成从“承载平台”到“核心互联介质”的价值跃迁。 CoWoP与M9体系叠加赋能,推动AI PCB工艺向半导体级突破。CoWoP方案去掉ABF封装基板与BGA焊球,将硅中介层与GPU/HBM组合直接安装在强化型PCB上,PCB承担了原本封装基板的全部功能,标志着PCB与封装基板边界消失。该方案在信号...