2 min read

技术解读

AI 砸了 5,800 亿美元,为什么买不到想要的芯片?一块 CoWoS 封装卡住了全行业的脖子

2026 年才过了一半,华尔街的 AI 故事正在从「能不能融到钱」悄悄转成「能不能拿到货」。The Next Platform 一份深度行业报告说得很直白:不是钱不够,也不是模型不行,而是 台积电、三星、英特尔代工厂的先进封装产线,真的挤不下了

更关键的是,Anthropic、OpenAI 突然把 ARR 增速预期从 280% 下调到 180%,不是需求变弱了——是 产能卡脖子

这件事和普通读者有什么关系?它正在悄悄改写「谁能在 2026 H2 真正跑通 AI 商业模式」这场牌局。


一、三个数字看懂「缺货」到底有多严重

报告引用的三个数据,值得每一个关注 AI 的人记住。

第一个数字:71%。 这是 TSMC、三星、Intel Foundry 2026 年 CoWoS-L 先进封装实际产能,折算成 wafer 起步当量大约 75-80 万片,即使满产,也只能满足 OpenAI、Anthropic、Google、xAI、Meta 这五家头部客户「已签承诺订单」的 71%。剩下 29% 的订单,在 2026 年内交付不了。

第二个数字:92%。 NVIDIA Blackwell Ultra / Rubin、Broadcom Tomahawk 6、AMD MI400 三大主力 AI 加速器产品线,2026 全年产能已经被预订了 92%。剩下的 8%「现货」在二级市场加价 3-5 倍。

第三个数字:5,800 亿美元。 这是 2026 全年 AI 资本支出的总盘子里已经被规划出来、需要支付的部分。71% × 92% 这个乘法,意味着相当大一块 CapEx,要在 2027 年甚至更晚才能变成真正能跑的算力。

把这三个数字放在一起看:「产能是物理瓶颈,不是市场偏好」。即使你手里有 5,800 亿美元想立刻砸下去,也砸不出更多 GPU 来。


二、CoWoS 是什么?为什么它比芯片本身更卡脖子?

很多人知道 AI 算力缺的是 NVIDIA H100、Blackwell Ultra,但其实卡住产业链的,是一个更隐蔽的环节:先进封装

NVIDIA 的 GPU、HBM 内存,以及各种加速 ASIC,都不是单颗芯片在跑,而是把多颗芯片「叠」在一个封装里,中间用高速互联通道(Silicon Interconnect)连接。这个封装技术,就是台积电的 CoWoS(Chip-on-Wafer-on-Substrate)。CoWoS-L 是它的最新一代,支持更大面积、更多 HBM 堆叠、更复杂的 chiplet 架构。

为什么偏偏是封装卡脖子?

因为 NVIDIA 一颗 Blackwell Ultra GPU,需要 4-8 颗 HBM3E 高带宽内存围绕,而 HBM 本身产能(SK 海力士、三星、美光)就是紧的。但更紧的是「把 GPU 和这么多 HBM 用先进封装焊到一起」这一步——这需要 TSMC 的特定光刻、bonding、封测产线,而这些产线一年只能扩产有限的几条。

结果是:即使 NVIDIA 把 GPU die 的产能拉满,只要封装跟不上,GPU 还是「卡在工厂出不来」。 这就是为什么报告说,2026 年不是「GPU 缺货」,而是「封装缺货」。

报告同时披露:Apple 的 M5 Ultra、AMD MI400、Broadcom Tomahawk 6 都在抢同一条 CoWoS-L 产线。它们不是和 NVIDIA 抢「同一颗芯片」,而是和 NVIDIA 抢「同一条封装产线」。这意味着消费电子、汽车、数据中心的需求,会被 AI 数据中心的需求「挤出」。


三、为什么 2026 H1 突然集中爆发?

过去三年,封装产能虽然在扩,但需求增长更平滑。但 2026 H1 出现了一个明显的「断点」。

第一个原因:OpenAI 和 Anthropic 都在「补订单」。 OpenAI 在 2025 年底 ARR 突破 130 亿美元之后,2026 H1 把承诺订单一次性补足到 2027 Q1 之前的需求。Anthropic 同样在 IPO 前夕把未来 18 个月的算力承诺锁死。这两家公司加起来,贡献了 2026 年 CoWoS-L 增量的 35% 以上。

第二个原因:DeepSeek、Mistral 等「中等玩家」也在抢产能。 它们不像 OpenAI 那样有「100 亿美元算力合同」的体量,但 2026 H1 它们集中升级到 100B+ 参数模型,需要的算力是上一代的 4-6 倍。这部分「中小客户」加起来,占了 CoWoS-L 增量的 25%。

第三个原因:换机周期叠加。 2026 是 Blackwell Ultra 的「出货年」,也是 NVIDIA Rubin 的「样品年」。客户都在「老一代(H200)还没回本就要订新一代」的窗口,产能被「双倍预订」进一步放大。

这三个因素叠加,让 2026 H1 的封装产线,从「温和紧缺」变成「刚性短缺」。


四、二级市场加价 3-5 倍:谁是「二级买家」?

报告披露了一个有意思的现象:产能 92% 被锁死后,剩下的 8%「现货」在二级市场被加价 3-5 倍出售。

谁在二级市场买?

第一类:RAG/Agent 创业公司。 它们没有 OpenAI 的「100 亿美元」预算,但 2026 H1 是「Agent 商业化元年」,错过 H1 就错过一整年的市场窗口。这部分买家愿意以 3-5 倍溢价拿货,赌的是 Agent 收入能在 12 个月内覆盖算力成本。

第二类:主权 AI 项目。 沙特、阿联酋、印度、印尼等国家的国家级 AI 算力中心,2026 H1 集中上线。这些项目预算不受市场周期影响,直接以溢价买现货。

第三类:军工/科研「紧急采购」。 美军「Thunderforge」、欧洲「AI Factory」、日本「METI 算力计划」,2026 H1 都在 AI 推理/训练的紧急算力需求上「加价」拿货。

这意味着,即使你是一线 AI 实验室 CEO,也可能拿不到承诺产线上的 GPU——你必须接受「交货期 18 个月」或「现货 4 倍价」二选一。


五、ARR 增速从 280% 下调到 180%:这是「需求变弱」吗?

这是报告里最值得品味的发现。

Anthropic、OpenAI 在 2026 H1 突然把 ARR 增速从 280% 下调至 180%。 第一眼看上去,像「需求变弱」或者「Scaling Law 拐点」。但报告指出,这是 产能卡脖子倒逼出来的「主动减速」

具体逻辑是:如果你的承诺算力是「2026 年内交付 100,000 颗 GPU」,但实际只能拿到 71,000 颗,那么你的推理服务容量就只能按 71,000 颗规划。容量不足,就会限流、降级、对部分 API 调用排队——这些都会直接压制 ARR 增速。

换句话说,Anthropic、OpenAI 的「ARR 减速」不是因为用户不愿意付钱,而是因为它们跑不出用户愿意付的那个容量。这是一个非常「非典型」的需求曲线——典型的市场需求是「价格-需求」曲线,这里是「产能-需求」曲线。

这也解释了为什么 OpenAI 在 2026 年坚持 IPO:它需要上市融到的钱,不是用来训练新模型,而是用来锁更长(7-10 年)的算力合同。这和 SpaceX 上市后立刻签 SpaceX-SpaceX-Starlink V3 卫星合同的逻辑一样——上市不是为了扩张,是为了「把未来的产能用钱锁住」。


六、对普通人意味着什么?三件事

你可能不直接买 GPU,但这件事会在三个层面影响你。

第一,AI 应用的「响应速度」会变慢。 ChatGPT、Claude、Gemini 的响应时间,在 2026 H2 大概率不会比 H1 更快,反而可能更慢——因为它们都在「用算力不足来限流」。这对所有依赖 AI 推理速度的 Agent 应用(尤其是「实时 Agent」)是直接打击。

第二,AI 创业公司的估值会出现分化。 有算力锁定能力的(OpenAI、Anthropic、xAI、CoreWeave)会保持高估值甚至继续上行;没有算力锁定的中型公司(Mistral、DeepSeek)会面临「ARR 增速放缓 + 拿不到算力」的双重打击,估值可能下调。

第三,先进封装产业链会有结构性机会。 TSMC、Amkor(日月光)、ASE(矽品)、长电科技、通富微电这些「封装外包」公司的订单可见度,可以拉到 2027-2028 年。这是一条和「纯 GPU 设计」不一样的产业链。


总结

5,800 亿美元的 AI 资本支出,正在被一条看不见的产线卡住。

这其实是一个「好消息」:它意味着 AI 不是泡沫,需求确实存在;同时也是一个「坏消息」:这场 AI 革命的速度,可能不会像 2023-2025 年那样指数级增长,而是被物理产线「拉平」成线性增长。

对从业者来说,「谁能拿到封装产能」,比「谁有最聪明的算法」,在 2026 H2 重要得多。对普通用户来说,你可能需要为 AI 服务多等几秒,也可能要为更稳定的算力多付一点钱——因为它正在按真实的市场供需曲线运行。

参考来源: