
美國時間3月18日,英偉達在美國聖何塞舉辦年度GTC(GPU技術大會)。 作為全球最受矚目的科技盛會之一,今年的GTC吸引了約2.5萬名觀眾線下參會,另有30萬人通過線上直播收看。 英偉達CEO黃仁勛在主題演講中表示:“隨着AI技術的爆發,GTC的規模也在逐年擴大。去年,有人稱GTC是AI行業的‘伍德斯托克音樂節’,今年我們搬進了體育場——GTC已成為AI領域的‘超級碗’。” 本次大會上,英偉達發布了一系列重磅新品,包括Blackwell GPU、硅光交換機、機器人模型等。與此同時,黃仁勛在演講中反覆強調,隨着AI行業整體訓練需求的放緩,以及DeepSeek在模型推理領域的創新突破,AI推理時代即將到來。 然而,在演講結束後,英偉達股價收跌超3.4%,收於115.43美元/股,盤後繼續下跌0.56%。
Blackwell Ultra GPU:AI推理時代的“算力核彈”作為本屆GTC的重頭戲,英偉達正式發布了新一代數據中心級AI GPU——NVIDIA Blackwell Ultra GPU。 此前有市場傳聞稱,英偉達曾考慮將Blackwell Ultra更名為B300,但最終官方仍沿用了原始命名。相較於上一代B200 GPU,Blackwell Ultra GPU的計算性能提升了50%,達到約15P FLOPS(基於低精度FP4浮點格式),並採用HBM3E高帶寬存儲,內存容量由192GB提升至288GB。 兩大系統集成方案:GB300 NVL72 與 HGX B300 NVL16基於Blackwell Ultra GPU,英偉達為雲計算廠商及大型企業客戶推出了兩款系統解決方案: AI推理市場的加速布局 不同於A100、H100等主要用於AI模型預訓練的產品,英偉達此次明確定位Blackwell Ultra為AI推理優化(AI-Reasoning),併兼顧訓練及多場景AI應用。 在DeepSeek成功以極低算力成本完成模型開發後,市場一度擔憂英偉達AI芯片的需求是否會放緩。對此,黃仁勛回應稱,雖然AI廠商過去將大量算力投入模型訓練,但推理仍然需要龐大的GPU計算資源和高性能網絡。DeepSeek的創新不僅沒有減少市場需求,反而證明了AI推理將催生更大規模的算力需求。 黃仁勛在演講中強調,Blackwell GPU已全面投產,並透露英偉達正在推進下一代Rubin架構。預計Rubin GPU在FP4標準下的算力性能將達到50P FLOPS(約為Blackwell Ultra的3.3倍),Rubin Ultra GPU將達100P FLOPS,並搭載HBM4/ HBM4E存儲,預計於2026-2027年陸續推出。 此外,英偉達還正式公布了2028年推出的全新架構——Feynman,該命名致敬物理學家理查德·費曼(Richard Feynman)。
Agentic AI與AI推理的算力挑戰今年GTC不同於往年密集發布新產品的節奏,黃仁勛在正式公布新品前,花費大量時間闡述“Agentic AI(智能體AI)”的概念,並探討AI推理帶來的巨大變革。 英偉達的AI技術發展路線圖顯示,AI技術的發展分為三個階段: Generative AI(生成式AI):以語言大模型(LLM)和聊天機器人為核心,專注於文本、圖像生成。 Agentic AI(智能體AI):具備自主決策和執行能力,能夠理解任務、進行複雜推理、制定計劃並自主執行多步驟操作。 Physical AI(具身AI):賦能機器人,使其具備更強的環境理解和交互能力。
黃仁勛指出,生成式AI階段的Scaling Law法則(“更大規模的模型=更智能的AI”)主要集中在模型訓練階段。但隨着AI向Agentic AI演進,推理將成為新的核心動力,算力需求將遠超訓練階段。 以AI模型的Token生成為例,Agentic AI的推理任務複雜度更高,可能涉及數百萬乃至數十億級別的Token處理量。隨着用戶訪問量的激增,AI推理計算需求的增長遠超100倍。 在現場演示中,Blackwell Ultra NVL72集群運行DeepSeek-R1 671B模型交互時,僅需10秒即可給出答案,而H100集群則需要90秒。 此外,英偉達發布了一款AI推理優化軟件——Dynamo,該軟件能夠在數千顆GPU間協調推理計算,並通過分解任務,提高大模型推理效率。 黃仁勛預測,到2028年,全球數據中心投資規模將突破1萬億美元,遠超此前的市場預期。
硅光交換機、機器人模型與量子計算研究中心硅光網絡交換機:突破超大規模數據中心瓶頸英偉達此次發布了兩款基於硅光技術的新型交換機: 這兩款交換機採用“光電共封裝技術”(CPO),將光通信直接集成到交換機芯片上,相比傳統外掛式光模塊,大幅降低數據傳輸延遲。英偉達計劃於2026年正式推出Spectrum-X交換機。 GROOT N1機器人模型開源英偉達宣布開源GROOT N1機器人基礎模型。該模型採用雙系統架構,一個系統負責理解環境與指令,另一個系統執行精確動作,以模擬人類認知過程。 此外,英偉達推出Omniverse 3D實時仿真平台,助力機器人開發者訓練和測試智能體AI。 量子計算研究中心落地波士頓英偉達還宣布將在波士頓設立加速量子研究中心(NVAQC),專注於量子計算架構與算法研究。 儘管量子計算仍面臨技術挑戰,黃仁勛強調,其目標並非取代傳統計算,而是作為AI超級計算機的增強工具,在新材料、藥物研發等特定領域發揮作用。
總結:AI推理時代全面到來本屆GTC不僅展示了Blackwell Ultra GPU的強大算力,也明確了AI行業未來的重點:推理將成為核心驅動力。 隨着Agentic AI時代的到來,AI推理計算需求正迎來指數級增長,英偉達的GPU、網絡和AI推理軟件正在重塑整個計算生態。未來,隨着Rubin、Feynman架構的推進,AI芯片的性能天花板仍在不斷突破。 GPU的市場需求依然會很強勁一段時間,包括二手市場。如果你有閒置的GPU,you may sell gpu to save your business cost... If you want to learn more, check this blog post, where to sell GPU.
|