根據TrendForce最新研究,DeepSeek近期連續發表DeepSeek-V3、DeepSeek-R1等AI模型,將促使終端客戶未來更審慎評估投入AI基礎設施的合理性,採用更具效率的軟體運算模型,以降低對GPU等硬體的依賴。CSP則可能擴大採用自家ASIC基礎設施,以降低建置成本。因此,2025年以後產業對GPU AI晶片或半導體實際需求可能出現變化。
TrendForce表示,全球AI server市場自2023年起快速成長,預期2025年占整體server出貨比例將逾15%,至2028年有望接近20%。近年大型CSP業者應AI訓練需求積極擴建,自2025年起將擴展重心至邊緣AI推理,除了採用NVIDIA Blackwell等新一代GPU平台,AWS等也加大開發自家ASIC力道,以提升成本效益、滿足特定AI應用需求。中國CSP和DeepSeek等相關AI業者面對美國晶片出口禁令,著重開發更高效的AI晶片或演算法,以促進AI需求和應用的多元發展。
AI 行業過去依賴擴大模型、增加數據和提升硬體效能來發展,但成本與效率成為挑戰。DeepSeek 採用蒸餾模型(Model Distillation)技術,壓縮大型模型以提升推理速度並降低硬體需求,同時充分發揮 NVIDIA Hopper 降規版晶片的效益,最大化運算資源利用。其成本優勢來自高效能硬體選擇、新型蒸餾技術及 API 開源策略,不僅優化技術與商業應用的平衡,也展現 AI 產業向高效發展的趨勢。
TrendForce指出,在美國晶片禁令持續的情況下,預期中國AI市場將朝兩個重點方向發展。首先, AI相關業者將加速投入自主AI晶片或供應鏈發展,如中系大型CSP業者等除盡量採購目前尚可取得的H20外,未來將加速擴大發展自有ASIC,應用於自家資料中心。其次,中國將利用既有的互聯網基礎優勢,以軟體補足硬體缺陷,上述DeepSeek打破常規,改採蒸餾技術強化AI應用機會即是。
整體而言,預期未來美國政府可能對中國相關AI或半導體禁令趨嚴下,迫使欲投入AI發展的中國業者加速發展自有AI晶片或HBM等硬體。儘管其效能不及NVIDIA等GPU方案,然主要為滿足中國市場自用資料中心基礎建設,單位晶片效能已非唯一考量。此外,DeepSeek等業者近期朝AI多模態模型發展,力求在更低的訓練成本下,於特定應用領域達到類似效能,以加速實現商用化。
若有興趣進一步了解並購買TrendForce旗下半導體研究處相關報告與產業數據,請至https://www.trendforce.com.tw/research/dram查閱,或洽詢SR_MI@trendforce.com。
相關文章
相關報告