設萬維讀者為首頁 萬維讀者網 -- 全球華人的精神家園 廣告服務 聯繫我們 關於萬維
 
首  頁 新  聞 視  頻 博  客 論  壇 分類廣告 購  物
搜索>> 發表日誌 控制面板 個人相冊 給我留言
幫助 退出
 
redclay的博客  
Computer Hardware Information  
網絡日誌正文
英偉達GTC 2025:Blackwell Ultra GPU發布,AI推理時代來臨 2025-03-28 17:30:07

gtc2025.png

美國時間3月18日,英偉達在美國聖何塞舉辦年度GTC(GPU技術大會)。 作為全球最受矚目的科技盛會之一,今年的GTC吸引了約2.5萬名觀眾線下參會,另有30萬人通過線上直播收看。

英偉達CEO黃仁勛在主題演講中表示:“隨着AI技術的爆發,GTC的規模也在逐年擴大。去年,有人稱GTC是AI行業的‘伍德斯托克音樂節’,今年我們搬進了體育場——GTC已成為AI領域的‘超級碗’。”

本次大會上,英偉達發布了一系列重磅新品,包括Blackwell GPU、硅光交換機、機器人模型等。與此同時,黃仁勛在演講中反覆強調,隨着AI行業整體訓練需求的放緩,以及DeepSeek在模型推理領域的創新突破,AI推理時代即將到來。

然而,在演講結束後,英偉達股價收跌超3.4%,收於115.43美元/股,盤後繼續下跌0.56%。


Blackwell Ultra GPU:AI推理時代的“算力核彈”

作為本屆GTC的重頭戲,英偉達正式發布了新一代數據中心級AI GPU——NVIDIA Blackwell Ultra GPU

此前有市場傳聞稱,英偉達曾考慮將Blackwell Ultra更名為B300,但最終官方仍沿用了原始命名。相較於上一代B200 GPU,Blackwell Ultra GPU的計算性能提升了50%,達到約15P FLOPS(基於低精度FP4浮點格式),並採用HBM3E高帶寬存儲,內存容量由192GB提升至288GB

兩大系統集成方案:GB300 NVL72 與 HGX B300 NVL16

基於Blackwell Ultra GPU,英偉達為雲計算廠商及大型企業客戶推出了兩款系統解決方案:

  • GB300 NVL72——機架級解決方案,每個機架內集成72顆Blackwell B300 GPU36顆基於ARM架構的Grace CPU,AI算力性能較上一代提升超50%。

  • HGX B300 NVL16——採用NVLink高速互聯,連接8顆Blackwell Ultra GPU,專為大規模AI推理優化,相較於H100在大模型推理速度上提升11倍。

AI推理市場的加速布局
不同於A100、H100等主要用於AI模型預訓練的產品,英偉達此次明確定位Blackwell Ultra為AI推理優化(AI-Reasoning),併兼顧訓練及多場景AI應用。

在DeepSeek成功以極低算力成本完成模型開發後,市場一度擔憂英偉達AI芯片的需求是否會放緩。對此,黃仁勛回應稱,雖然AI廠商過去將大量算力投入模型訓練,但推理仍然需要龐大的GPU計算資源和高性能網絡。DeepSeek的創新不僅沒有減少市場需求,反而證明了AI推理將催生更大規模的算力需求。

黃仁勛在演講中強調,Blackwell GPU已全面投產,並透露英偉達正在推進下一代Rubin架構。預計Rubin GPU在FP4標準下的算力性能將達到50P FLOPS(約為Blackwell Ultra的3.3倍),Rubin Ultra GPU將達100P FLOPS,並搭載HBM4/ HBM4E存儲,預計於2026-2027年陸續推出

此外,英偉達還正式公布了2028年推出的全新架構——Feynman,該命名致敬物理學家理查德·費曼(Richard Feynman)。


Agentic AI與AI推理的算力挑戰

今年GTC不同於往年密集發布新產品的節奏,黃仁勛在正式公布新品前,花費大量時間闡述“Agentic AI(智能體AI)”的概念,並探討AI推理帶來的巨大變革。

英偉達的AI技術發展路線圖顯示,AI技術的發展分為三個階段:

  1. Generative AI(生成式AI):以語言大模型(LLM)和聊天機器人為核心,專注於文本、圖像生成。

  2. Agentic AI(智能體AI):具備自主決策和執行能力,能夠理解任務、進行複雜推理、制定計劃並自主執行多步驟操作。

  3. Physical AI(具身AI):賦能機器人,使其具備更強的環境理解和交互能力。

黃仁勛指出,生成式AI階段的Scaling Law法則(“更大規模的模型=更智能的AI”)主要集中在模型訓練階段。但隨着AI向Agentic AI演進,推理將成為新的核心動力,算力需求將遠超訓練階段。

以AI模型的Token生成為例,Agentic AI的推理任務複雜度更高,可能涉及數百萬乃至數十億級別的Token處理量。隨着用戶訪問量的激增,AI推理計算需求的增長遠超100倍

在現場演示中,Blackwell Ultra NVL72集群運行DeepSeek-R1 671B模型交互時,僅需10秒即可給出答案,而H100集群則需要90秒

此外,英偉達發布了一款AI推理優化軟件——Dynamo,該軟件能夠在數千顆GPU間協調推理計算,並通過分解任務,提高大模型推理效率。

黃仁勛預測,到2028年,全球數據中心投資規模將突破1萬億美元,遠超此前的市場預期。


硅光交換機、機器人模型與量子計算研究中心

硅光網絡交換機:突破超大規模數據中心瓶頸

英偉達此次發布了兩款基於硅光技術的新型交換機:

  • NVIDIA Spectrum-X(基於以太網,適用於企業級網絡)。

  • NVIDIA Quantum-X(基於InfiniBand,適用於高性能計算集群)。

這兩款交換機採用“光電共封裝技術”(CPO),將光通信直接集成到交換機芯片上,相比傳統外掛式光模塊,大幅降低數據傳輸延遲。英偉達計劃於2026年正式推出Spectrum-X交換機。

GROOT N1機器人模型開源

英偉達宣布開源GROOT N1機器人基礎模型。該模型採用雙系統架構,一個系統負責理解環境與指令,另一個系統執行精確動作,以模擬人類認知過程。

此外,英偉達推出Omniverse 3D實時仿真平台,助力機器人開發者訓練和測試智能體AI。

量子計算研究中心落地波士頓

英偉達還宣布將在波士頓設立加速量子研究中心(NVAQC),專注於量子計算架構與算法研究。

儘管量子計算仍面臨技術挑戰,黃仁勛強調,其目標並非取代傳統計算,而是作為AI超級計算機的增強工具,在新材料、藥物研發等特定領域發揮作用。


總結:AI推理時代全面到來

本屆GTC不僅展示了Blackwell Ultra GPU的強大算力,也明確了AI行業未來的重點:推理將成為核心驅動力

隨着Agentic AI時代的到來,AI推理計算需求正迎來指數級增長,英偉達的GPU、網絡和AI推理軟件正在重塑整個計算生態。未來,隨着Rubin、Feynman架構的推進,AI芯片的性能天花板仍在不斷突破。

GPU的市場需求依然會很強勁一段時間,包括二手市場。如果你有閒置的GPU,you may sell gpu to save your business cost... If you want to learn more, check this blog post, where to sell GPU.


瀏覽(449) (0) 評論(0)
發表評論
我的名片
redclay
註冊日期: 2022-02-08
訪問總量: 8,663 次
點擊查看我的個人資料
Calendar
最新發布
· 高性能 GPU 出售策略指南
· 英偉達GTC 2025:Blackwell Ultr
· SK Hynix 推出革命性的 300TB 固
· AMD 的旗艦 AI 加速器 MI325X 對
· 【轉】How to choose Intel CPUs
· 舊的計算機顯卡還有回收的價值嗎
分類目錄
【科技】
· 高性能 GPU 出售策略指南
· 英偉達GTC 2025:Blackwell Ultr
【生活】
· SK Hynix 推出革命性的 300TB 固
· AMD 的旗艦 AI 加速器 MI325X 對
· 【轉】How to choose Intel CPUs
· 舊的計算機顯卡還有回收的價值嗎
存檔目錄
2025-04-21 - 2025-04-21
2025-03-28 - 2025-03-28
2024-07-04 - 2024-07-04
2022-10-01 - 2022-10-28
 
關於本站 | 廣告服務 | 聯繫我們 | 招聘信息 | 網站導航 | 隱私保護
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.