遠水難解近渴!英偉達緊急向臺積電訂購30萬顆H20芯片
關鍵詞: H20芯片 出口限制 供需失衡 國產AI芯片 CUDA生態
在放開出口限制之后,H20這一AI芯片在中國市場出現了供不應求的現象。
7月29日,據路透社援引兩位消息人士報道,英偉達已向臺積電下達了30萬片H20芯片組的訂單。其中一位消息人士指出,強勁的中國需求促使英偉達改變主意,不再僅僅依賴現有庫存。
據行業分析機構Jefferies估算,中國市場對H20級別AI芯片的總需求量約為180萬顆 。然而,在2025年早些時候,英偉達的H20芯片庫存據估計僅在60萬至90萬顆之間 。這一巨大的供需失衡是缺口存在的根本原因。
值得一提的是,中國科技巨頭早在2024年就已下達了價值超過120億美元的H20芯片預訂單,以鎖定未來供應。然而,今年4月美國政府一張出口限制令,讓這一芯片在華銷售一度停滯。但在7月,這一出口限制令的突然反轉,進一步加劇了H20芯片的供應偏緊的現狀。
美國出口管制政策的反復與不確定性
實際上,H20并非一款常規迭代的產品,而是地緣政治影響下的特定產物。
H20基于成熟的NVIDIA Hopper架構,采用臺積電N4工藝及CoWoS先進封裝技術,內部集成超過800億個晶體管 。部分信息顯示其芯片本體是GH100的削減版本 。
該芯片配備了高達96GB的HBM3高帶寬內存,顯存帶寬達到4.0 TB/s 。這一內存在容量上與旗艦級的H100/H200保持一致,成為其在處理大型語言模型(LLM)時的關鍵優勢之一。但H20的算力被精確地限制在美方規定的性能密度門檻之下,綜合算力大約只有H100的20%,在關鍵的FP16性能上,僅為H100的1/6到1/15 。
H20的市場定位非常明確:在美國先進AI芯片被禁運的背景下,為中國大陸的科技企業提供一個性能尚可、能夠合法獲得且兼容現有CUDA生態系統的高性能計算解決方案 。其主要應用場景覆蓋了AI推理、大模型訓練、高性能計算(HPC)、云計算及數據中心等領域 。
2025年4月,美國政府更新了出口管制清單,對H20芯片實施了新的出口許可要求,一度導致其對華銷售陷入停滯 。
由于4月份的出口禁令,英偉達在2026財年第一季度(截至2025年5月)財報中計提了高達45億至55億美元的庫存減值和采購承諾相關費用 這凸顯了政策不確定性給企業帶來的巨大經營風險,也使得英偉達在重啟生產決策上更為謹慎。而英偉達為規避風險,已主動取消了在臺積電預訂的部分H20生產產能 。
2025年7月中旬,英偉達CEO黃仁勛宣布已獲美國政府批準,可以恢復向中國市場發貨H20芯片 。這一消息瞬間引爆了積壓已久的市場需求,但由于生產線早已調整,供應鏈無法立即響應。
緊急追加30萬顆訂單也難解“近渴”
美國政府的出口管制政策具有高度不確定性,而半導體供應鏈的調整卻需要漫長而穩定的周期。這種錯配導致了市場的劇烈波動和供應的持續緊張。
目前,H20的主要客戶群體非常集中,即中國大陸的頭部互聯網和云計算公司,包括但不限于阿里巴巴、騰訊、字節跳動和百度等 。這些公司在2024年已大量下單,是此次供應缺口中最主要的“需求方”。
Jefferies的分析認為,英偉達在2025年第一季度向中國出貨了約30萬顆H20 GPU。隨著7月恢復銷售許可,市場預計英偉達將首先清理其60-90萬顆的現有庫存。有分析指出,恢復出貨后,庫存去化速度可提升30% 。
7月下旬援引知情人士消息稱,英偉達為補充其60-70萬顆的現有庫存,已向臺積電下達了30萬片H20芯片的新訂單,標志著其決定重啟為中國市場的定制芯片生產線 。
不過,即便英偉達下單意愿強烈,臺積電的接單能力也面臨巨大挑戰。臺積電方面表示,如果從零開始重啟H20的供應鏈,整個過程可能需要長達九個月的時間 。
據悉,臺積電的N4產線持續滿載,幾乎沒有空間處理緊急訂單 。重新調整生產計劃會影響對其他重要客戶(如蘋果、AMD等)的承諾,機會成本極高。
基于N4工藝的芯片從投片到最終封裝測試完成,生產周期約為3個月 。結合前述9個月的供應鏈重啟時間,即便訂單此刻確認,終端用戶最快也要等到2026年年中才能拿到這批新芯片。顯然,這“遠水”解不了中國大陸客戶的“近渴”。
為何國產AI芯片難以替代H20芯片
在未來數月內,中國大陸市場將主要依賴消化英偉達現有的H20庫存。價格可能因供不應求而保持高位。那么,為何國產AI芯片難以替代英偉達H20芯片?
首先,全球超90%的AI模型基于英偉達CUDA平臺開發,遷移至國產框架需重寫30%以上代碼,耗時6個月以上,并承擔技術風險。而且,TensorFlow、PyTorch等主流框架對CUDA深度優化,而國產芯片需額外適配層,增加延遲和開發成本。
其次,H20雖FP16性能僅達H100的28%,但其96GB HBM3顯存和4TB/s帶寬可滿足中等規模模型推理需求,如DeepSeek-R1的私有化推理顯存利用率達90%以上。對于地方政府、金融機構及車企的垂類模型部署,H20的“及格線”性能已足夠。
此外,H20還有集群擴展性優勢。該芯片支持8卡NVLink互聯,顯存池化達768GB,可全量訓練70B參數模型;而國產芯片雖FP16算力接近H20,但在多卡互聯和混合精度訓練等場景仍存差距。
特別值得一提的是,H20通過調整算力密度、禁用關鍵張量核心等技術手段,勉強符合美國出口管制要求,同時保留Hopper架構和CoWoS封裝技術,形成獨特市場定位。比如,該芯片顯存帶寬被刻意維持在900GB/s,正好卡在國產芯片與自身旗艦產品(H100的2TB/s)之間。這簡直是英偉達對美國出口管制的“精準閹割”。
還有最重要的采購成本問題。H20的定價(6500-8000美元)堪稱教科書級博弈,直接錨定華為昇騰910B政府采購價(6000美元)上浮20%,加上遷移成本和生態適應風險,制造“性價比幻覺”。
盡管此前國家發改委要求新建/擴建數據中心必須采用符合嚴格能效標準的AI芯片,直指H20的能效短板,但短期內H20仍能通過“性能妥協+生態霸權”維持市場韌性。當前,國產AI芯片處于從“能用”到“敢不用”的臨界點,還需持續技術創新,以及政策支持和生態構建,以在更多應用場景中實現替代。
