隨著AI技術快速演進,伺服器硬體設計正面臨重大變革。過去AI訓練與推論所需的運算資源,往往依賴多台伺服器串接來滿足,但近期各大廠商推出的新一代AI伺服器,從晶片架構到散熱系統,都朝向「單機效能極大化」的方向發展。這種新設計不僅讓單台伺服器內建的GPU數量從8顆翻倍到16顆甚至更多,也大幅拉高了記憶體、儲存裝置與高速互聯模組的用量。以NVIDIA最新的DGX系列為例,其單機搭載的H100 GPU數量、HBM記憶體容量,以及NVLink交換器數量,都較前代產品成長了50%以上。這股設計趨勢直接推動了零組件需求的爆炸性成長,尤其在高階記憶體、電源管理IC、散熱鰭片與PCB板等關鍵元件上,供應鏈已經出現明顯的供不應求。業界預估,2025年AI伺服器的出貨量將較今年成長超過40%,但上游產能的擴張速度卻遠遠跟不上需求,導致產能缺口持續擴大,甚至可能影響到下半年AI應用的部署進度。對於台灣的電子零組件與伺服器代工業者而言,這既是商機也是挑戰:訂單滿手但交貨期卻不斷延長,如何平衡產能分配與客戶期望,已成為當前最棘手的課題。
一、新設計如何拉高單機用量?
AI伺服器的新設計思維,核心在於將運算密度最大化。過去雲端資料中心傾向使用大量中低規格的伺服器來執行分散式運算,但隨著模型參數量突破千億甚至兆億等級,跨機通訊的延遲與功耗成為瓶頸。新一代設計轉向「高密度整合」,例如在單一機箱內整合更多GPU、更快的記憶體頻寬與更高效率的散熱方案。具體來說,NVIDIA的DGX H100伺服器單機即配備8顆H100 GPU,而下一代Blackwell架構更計畫將單機GPU提升至16顆,每顆GPU需搭配80GB的HBM3記憶體,總記憶體容量高達1.28TB。這意味著單機對HBM記憶體的需求量從640GB成長至1.28TB,增幅達到一倍。此外,為了滿足GPU高速互聯,NVLink交換器的用量也必須倍增,連帶使得PCB板的層數增加、電源供應模組的瓦數提升。這些設計變更不僅讓單機的零組件數量與規格同步升級,也讓供應鏈需要投入更多產能來因應。然而,上游晶圓廠與封測業者的擴產速度受制於設備交期與建廠時程,短期內難以跟上市場需求的成長。
二、產能缺口持續擴大的原因與影響
產能缺口持續擴大的主因,在於AI伺服器零組件的高度客製化與技術門檻。以HBM記憶體為例,全球僅有SK海力士、三星與美光三家供應商,而HBM3的良率提升速度遠低於標準DRAM,加上封裝製程需要與GPU晶片進行先進異質整合,導致每月產能成長有限。同樣的情況也出現在CoWoS先進封裝上,台積電雖然積極擴充產能,但2024年的月產能仍僅能滿足約六成的訂單需求。另一方面,AI伺服器對高階電源管理IC、高頻電容與散熱方案的需求同樣呈現幾何級數增長,這些零組件的供應商多為中小型業者,擴產意願與能力都相對保守。產能缺口造成的影響已經開始浮現:部分雲端服務商如微軟、亞馬遜延後了新資料中心的啟用時程,AI晶片交貨週期從原本的12週拉長到24週以上,甚至出現加價搶貨的亂象。對終端用戶而言,AI模型的訓練與部署成本也將隨著伺服器採購成本上揚而增加,不利於AI應用普及。
三、產業如何應對供應鏈挑戰?
面對產能缺口持續擴大的困境,供應鏈上下游業者已展開多層次應對措施。首先,系統整合廠如廣達、緯穎與英業達加速推動「在地化生產」策略,在北美、歐洲與東南亞設立新的組裝線,以縮短運輸時間並降低地緣政治風險。其次,零組件供應商開始與晶片設計商進行更深度的聯合設計(Co-design),例如記憶體廠直接與GPU廠商合作優化HBM封裝參數,縮短驗證週期。第三,部分業者轉向採用「多元供應商策略」,例如電源管理IC業者引入第二、第三供應來源,以分散單一廠商的產能限制。此外,散熱方案也從傳統氣冷轉向液冷,雖然初期建置成本較高,但能有效提升散熱效率並降低對風扇與散熱片的依賴。值得注意的是,台灣電子零組件製造商正積極投入「去瓶頸化」技術,例如透過設備改裝與製程優化,在現有產線中擠出更多產能。目前看來,產能缺口可能要到2025下半年才會逐步緩解,但前提是關鍵設備交期與建廠進度符合預期。對於AI伺服器新設計所帶來的長期需求增長,產業界普遍認為這並非短期泡沫,而是一場結構性的供應重組,能率先突破產能瓶頸的業者,將在新一輪AI硬體浪潮中取得領先地位。
【其他文章推薦】
電動堆高機、柴油堆高機怎麼選?差異一次比較