馬斯克最大算力中心建成了:全球首個GW級超算集群,再創(chuàng)世界紀錄
1月18號,全球首個GW級超算集群Colossus 2,正式投入運行。
馬斯克興奮喊話:
這是全球首個達到1GW的超算集群,4月還將進一步升級至1.5GW。

網(wǎng)友直呼瘋狂:「1.5GW,光是插座估計都得給墻壁裝滿了。」

有了這劑算力強心針,Grok的忠實擁躉已經(jīng)提前開香檳,開始暢想Grok5的統(tǒng)治時代。

但在全網(wǎng)狂歡的背后,更多的人是苦不堪言——
2026年夏天,美國13個州的6700萬居民,可能要因數(shù)據(jù)中心的存在被停電,沒空調吹了。
全球首個GW級訓練集群
老馬的執(zhí)行力太恐怖了。
不靠亞馬遜,不靠微軟,也沒有「星際之門」計劃,一己之力于孟菲斯平地建起一座1GW的超級超算集群。
前一代超算集群Colossus 1從無到有僅用了122天。
它配備約20萬顆英偉達H100/H200和約3萬顆英偉達GB200 NVL72。
而在此基礎上翻了好幾倍,功率達到1GW的Colossus 2,只花了僅僅不到一年。
1GW是什么概念?
一般來說,1GW可以為75萬戶家庭供電,輕松供電一整個舊金山。
一座核電站的功率差不多也就是1GW。
如果按馬斯克所說,今年4月份,Colossus 2將升級至1.5GW,最終總裝機容量達到2GW,這個數(shù)字將與美國大多數(shù)主要城市的用電量相當。
按照規(guī)劃,徹底完工后的Colossus 2將內置55張GPU,遠超Meta的15萬、微軟10萬,以及谷歌的分布式基礎設施。
而這龐大的資源,全部為Grok獨自享用。
此前,曾有爆料稱Grok 5的參數(shù)將達到驚人的6萬億左右,是Grok 4的兩倍以上。
原因便是基于Colossus 2:
當時有觀點認為Grok 5將在擁有數(shù)十萬張英偉達GPU的Colossus 2上訓練,耗電量約為1GW。

如今,Colossus 2已正式上線,1GW的條件也正正好好滿足。
而隨著前段時間xAI E輪融資200億美元的進賬,Grok 5的Scaling籌碼還在進一步增加。這意味著更大的模型參數(shù),更快的訓練速度、迭代速度,部署速度。
當OpenAI還在為2027年的算力基礎設施發(fā)愁時,xAI已經(jīng)把一座「城市級」AI 工廠開機運行,將Grok 5提前扶上了市場心目中的下一個SOTA。
正如網(wǎng)友所說,AI時代,速度就是最強的護城河。
居民受不了啦!
不過,并非所有人都因這種「速度」受益。
據(jù)《華爾街日報》消息,美國非營利電網(wǎng)運營商PJM,未來可能在極端高溫或嚴寒天氣期間,輪流對區(qū)域內的居民斷電。
這意味著,美國13個州的6700萬人,在今年不得不迎來一個相當難熬的夏天。
要說清楚這個問題,得先明白PJM是干嘛的。
PJM,簡單來說就是美國能源系統(tǒng)的交通指揮中心,它根據(jù)實時用電需求,協(xié)調發(fā)電廠何時增發(fā)、何時降載,以維持供需平衡。
然而,大模型大力出奇跡的競賽正在破壞這種平衡。
在數(shù)據(jù)中心建設熱潮推動下,PJM預計未來10年電力需求將以年均4.8%的速度增長。
對一個多年需求變化不大的系統(tǒng)來說,這樣的增速相當罕見。
一邊需求激增,另一邊,供給的增速卻相當緩慢。新建電廠的速度甚至都跟不上老電廠的退役速度,電網(wǎng)容量面臨飽和。
供需一旦出現(xiàn)偏差,電網(wǎng)頻率就會波動,進而可能損壞發(fā)電廠等關鍵基礎設施。
為避免這些風險,PJM只能兩害相權取其輕,通過在用電高峰期輪流停電來卸壓。
PJM也不是沒想過其他辦法。
去年9月,PJM發(fā)布了一系列提議,希望數(shù)據(jù)中心在高峰時段主動降低用電量,或改從其他渠道獲取電力支持。
然而,亞馬遜、谷歌、微軟等幾乎都表示了反對,認為這是對數(shù)據(jù)中心的歧視。
值得一提的是,PJM主要負責美國東海岸地區(qū),而xAI的Colossus位于中南部,并不在PJM電網(wǎng)覆蓋范圍內。
同時,為減少對當?shù)仉娋W(wǎng)的沖擊,xAI還部署了168個特斯拉Megapack電池儲能系統(tǒng),在用電高峰期提供電力緩沖,盡量避免周邊居民遭遇停電。