10 秒扫一眼 · 30 秒做决策

SocialAlphas

一个以交易决策为优先的数据看板,不是长篇内容站。

存储技术

什么是HBM(高带宽内存)?解析AI芯片的存储瓶颈

HBM通过硅通孔(TSV)垂直堆叠DRAM,提供比传统内存高10倍的带宽——这也是NVIDIA无法快速交付GPU的原因。

更新于: 2026-04-29

技术原理

高带宽内存(HBM)是通过硅通孔(TSV)互连技术垂直堆叠多个DRAM裸片,并将整个堆叠放置在处理器旁边的硅中介层上的DRAM类型,这种配置称为2.5D封装。

每个TSV都是穿过硅裸片本身钻出的微型铜孔,可实现堆叠层间数千个并行电气连接。单个HBM3e堆叠可提供约1.2TB/s的带宽;高端GDDR6X芯片仅为576 GB/s。NVIDIA H200 GPU使用141GB HBM3e,总带宽4.8 TB/s。

HBM并非新技术——AMD于2015年在Fiji GPU上率先商用。改变的是规模。AI训练热潮将每个前沿模型都变成了内存带宽问题。Transformer架构的内存需求随上下文长度二次方增长。训练1000亿参数以上的模型每天需要PB级内存带宽,只有HBM能在实际功耗预算内实现这一目标。

当前HBM供应链高度集中。SK海力士供应约50%的HBM产能,以及NVIDIA H100/H200/B200 GPU几乎所有的HBM3e需求。三星和美光(MU)正在认证HBM3e作为替代供应商。TSV钻孔、晶圆键合和中介层制造所需的专业设备为应用材料(AMAT)、泛林集团(LRCX)和科磊(KLAC)创造了显著的护城河。

对投资者的意义

HBM产能是AI加速器供应的制约瓶颈。NVIDIA无法比SK海力士供应HBM3e堆叠更快地交付H200/B200 GPU。这一瓶颈是NVIDIA尽管需求创纪录但仍对近期GPU出货量保守指引的原因——这是供应链约束,而非需求问题。

对于投资者:美光(MU)进入HBM3e量产是多年期收入拐点,HBM每裸片平均售价是传统DRAM的3-5倍。AMAT、LRCX和KLAC提供HBM TSV刻蚀和晶圆键合所需的先进设备,这些工序没有商品化替代品。

重点关注趋势

已追踪信号股票

同步关注:MUSNDK
查看全部板块信号 →

常见问题

什么是高带宽内存(HBM),AI为何需要它?
HBM是通过硅通孔(TSV)技术垂直堆叠的DRAM,放置在处理器旁边的硅中介层上,带宽是传统GDDR内存的10-15倍。基于Transformer的AI模型的内存带宽需求随上下文长度二次方增长——训练GPT-4级模型每天需要PB级带宽,只有HBM能在实际功耗预算内实现。
哪些公司供应HBM,谁的市场份额最大?
只有三家公司生产HBM:SK海力士(韩国,约50%份额)、三星(韩国)和美光(美股上市,MU)。SK海力士目前几乎供应NVIDIA H100/H200/B200 GPU所需的全部HBM3e。美光正在量产HBM3e并在2025-2026年扩大份额,对美股投资者意义重大。
HBM如何影响AMAT、LRCX、KLAC等芯片设备公司?
HBM生产需要先进的晶圆键合、TSV刻蚀、化学机械抛光和高密度互连检测——所有这些工序都比标准DRAM更复杂。应用材料(AMAT)、泛林集团(LRCX)和科磊(KLAC)是HBM产能扩张的主要设备受益者,三家供应商在2024-2026年同时扩产。
HBM2e、HBM3和HBM3e有何区别?
这些是带宽和容量不断提升的HBM代际产品。HBM2e:每堆叠约460 GB/s(用于A100)。HBM3:每堆叠约819 GB/s(用于H100)。HBM3e:每堆叠约1,200 GB/s(用于H200、B200)。HBM4目标每堆叠约2,000 GB/s,预计2026-2027年随NVIDIA下一代架构量产。
为什么HBM被称为AI芯片瓶颈?
NVIDIA无法比HBM供应商生产堆叠更快地交付AI GPU。SK海力士的HBM3e产能是H200/B200 GPU供应的单一最大制约因素——不是台积电逻辑晶圆产能,不是封装,也不是NVIDIA的设计。这就是为什么即使超大规模客户积压订单超过12个月,NVIDIA仍对近期GPU出货给出保守指引。