黃仁勛又夸了DeepSeek,新一代“算力巨獸”正在量產,性能暴增5倍

摘要:“Rubin的到來恰逢其時,因為訓練和推理的AI計算需求正在激增。”
北京時間1月6日早五點,英偉達CEO黃仁勛在CES 2026開幕前的 keynote 演講中,用90分鐘為全球科技產業描繪了一幅激進且完整的未來圖景。
在這場信息密度極高的演講中,他不僅宣告人工智能的發展重心正從純粹的“數字智能”邁向與物理世界交互的“物理AI”新紀元,更以一系列開源重器——從世界模型Cosmos、自動駕駛系統AlphaMio到新一代AI芯片架構Vera Rubin——展示了英偉達作為全棧巨頭的野心:即為這個新時代構建從底層芯片、基礎設施到頂層模型與應用的全部基石。

當AI時代的算力需求正無限放大,英偉達仍在通過對計算平臺的極限升級,試圖吃下這個龐大的數字世界算力基座。
DeepSeek帶來的啟示,開源是創新主引擎
演講伊始,黃仁勛便以歷史性的視角定調感慨:“每隔10到15年,計算行業就會發生一次平臺遷移。”他強調,當前我們正同時經歷兩大遷移:一是應用轉向以AI為核心構建;二是整個軟件開發和運行范式被重塑——從“編程”轉向“訓練”,從CPU轉向GPU,從執行預編譯代碼轉向實時生成內容。

“這意味著過去十年價值約10萬億美元的計算產業,正在被現代化改造。”黃仁勛指出,驅動這場變革的資金,來自全球研發預算向AI的轉移以及海量的風險投資。
他特別用大量篇幅盛贊了開源模型的革命性作用,并再一次感嘆了DeepSeek讓世界震驚,開源讓AI迅速擴散,沒有人愿意掉隊。“開源模型已經觸及技術前沿,”黃仁勛表示,雖然頂尖開源模型與最前沿專有模型之間仍有約6個月的差距,但這種快速迭代正激活全球創新。
“我們怎么可能讓智能的數字形式拋下任何人?”他反問道。英偉達自身也投入了價值數十億美元的DGX超級計算機集群來推動開源模型發展,并在蛋白質結構預測(Open Fold Three)、天氣預測(Forecast Net)等多個科學領域取得突破。
智能體與物理AI——從理解語言到理解世界
黃仁勛詳細闡述了AI能力演進的下一個關鍵階段:從大語言模型的“記憶與生成”邁向智能體(Agent)的“推理與行動”。他解釋,早期模型會產生“幻覺”,是因為它們缺乏在回答前進行“基礎研究”的能力。而現代智能體框架能夠進行思維鏈推理,主動規劃步驟、調用工具,從而解決從未被明確訓練過的新問題。

“這為各種應用打開了大門。我們不再需要在第一天就訓練AI懂得一切。”黃仁勛說。這一智能體架構本質上是多模型、多云、混合式的,能夠根據任務動態選擇最佳模型,并結合企業私有的定制化模型,形成既前沿又專屬的AI能力。
然而,真正的挑戰在于讓AI理解物理世界。“一個小孩都懂的常識——物體恒存、重力、摩擦力——對AI來說完全陌生。”黃仁勛指出,這引出了演講的核心主題:物理AI。為此,需要構建一個由三臺計算機組成的完整系統:一臺用于訓練AI模型,一臺用于在機器人或汽車上實時推理(“邊緣計算”),而第三臺則用于高精度物理模擬,以生成訓練數據并評估AI行為的安全性。
世界模型Cosmos與自動駕駛系統AlphaMio
隨后,黃仁勛隆重介紹了英偉達應對物理AI挑戰的核心答案:NVIDIA Cosmos。這是一個開源的、“前沿級”的世界基礎模型,它并非基于語言,而是基于對互聯網規模視頻、真實駕駛數據和3D模擬的學習,從而建立起對世界運作方式的統一表征。Cosmos能夠根據單張圖片生成逼真視頻,或從3D場景描述中生成物理合理的運動軌跡。更重要的是,它能在交互式閉環模擬中響應AI的動作,并進行因果推理。
“Cosmos將計算轉化為數據。”黃仁勛強調,這解決了在現實世界中收集海量、尤其是罕見“長尾”場景數據的成本與效率瓶頸。
基于Cosmos生成的海量合成數據與真實數據,英偉達訓練并開源了其首個端到端自動駕駛系統——NVIDIA AlphaMio。黃仁勛宣稱,這是“世界上第一個具備思考推理能力的自動駕駛汽車AI”。AlphaMio不僅能處理傳感器輸入并控制車輛,更能向乘客解釋它即將采取的行動及其背后的推理過程。這種“可解釋性”和應對未知場景的推理能力,是處理自動駕駛“長尾問題”的關鍵。他宣布,首款搭載AlphaMio的梅賽德斯-奔馳汽車將于2026年第一季度上路。
算力需求激增,生逢其時的Vera Rubin
演講到后半程,黃仁勛終于拿出了主菜,重磅芯片新架構。
面對AI模型規模每年增長10倍、計算需求爆炸的挑戰,黃仁勛說他們不得不重新設計每一款芯片,并現場正式揭示了英偉達的下一代AI芯片架構:NVIDIA Vera Rubin。其命名來源于發現暗物質的天文學家薇拉·魯賓,寓意照亮AI計算的未知領域。

“Rubin 的到來恰逢其時,因為訓練和推理的 AI 計算需求正在激增”,黃仁勛表示,他解釋道,在摩爾定律放緩的當下,僅靠晶體管數量微增(Rubin GPU晶體管數僅為Blackwell的1.6倍)無法實現性能飛躍。Vera Rubin的秘訣在于 “極端協同設計” ——對公司內部所有芯片進行徹底重新設計,使其作為一個整體系統工作。并一次性展示了6款芯片:Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9(CX9)智能網卡、BlueField-4 DPU、Spectrum-X 102.4T CPO。黃仁勛評價其“每一顆都是革命性的”,都值得單獨開一場發布會。

Vera CPU與Rubin GPU:新一代CPU性能功耗比提升2倍,GPU的AI浮點性能達到Blackwell的5倍。
革命性NVFP4張量核心:這是一個能動態自適應調整精度以優化Transformer模型吞吐量的專用處理器,黃仁譽其為“突破性工作”,并暗示可能成為未來行業標準。
全棧革新:從集成硅光子的Spectrum-X以太網交換機(512個200Gb/s端口),到為AI工作負載重塑的BlueField-4 DPU(用于管理爆炸式增長的KV緩存上下文內存),再到徹底簡化、無電纜的DGX機箱設計, Vera Rubin是一次從芯片到系統的全面重構。
黃仁勛展示了一個包含1152個GPU的Vera Rubin POD,其機柜重達約2噸,內部包含2英里長的銅纜。盡管性能巨幅提升,其散熱仍僅需45攝氏度溫水,能效顯著。他總結,Vera Rubin將使訓練一個10萬億參數大模型所需的系統數量減少至Blackwell的四分之一,同時推理成本降低一個數量級,是“通往AI下一個前沿的巨大飛躍”。
黃仁勛還表示,“如果Vera Rubin要趕在今年,現在必須已經在生產中。今天我可以告訴大家,Vera Rubin正在全力生產中。”
生態與未來——機器人普及與工業數字化
最后,黃仁勛將視角擴展至更廣闊的產業。他宣布與西門子達成重磅合作,將英偉達的物理AI模型與Omniverse數字孿生平臺深度集成到西門子的工業軟件與自動化系統中,共同推動從芯片設計、工廠規劃到生產運維的全面數字化革命。
“最初是他們(EDA和工業軟件公司)創造了英偉達,現在我們有幸用創造的技術去變革他們的行業。”黃仁勛說。
演講在充滿未來感的氛圍中結束。黃仁勛總結道,自動駕駛汽車僅是物理AI的第一個主流市場,相同的技術棧(三臺計算機、合成數據生成、模擬)正催生機器人革命的到來,從機械臂到人形機器人。他邀請多個機器人合作伙伴登場,并戲稱:“機器人領域的‘ChatGPT時刻’即將到來。”
黃仁勛此次演講已遠超單一產品發布的范疇,而是一次對AI及計算產業未來十年的系統性宣言。通過開源關鍵模型(Cosmos, AlphaMio)與發布顛覆性硬件(Vera Rubin),英偉達正強勢定義“物理AI”時代的技術標準與基礎設施。其戰略核心清晰無比:以全棧式的開放生態,牢牢占據從數據中心到機器人指尖的每一個計算節點。一個由AI驅動、虛實交融的物理世界,其基石正在今夜被英偉達一塊塊奠定。