英偉達(dá)大舉進(jìn)軍CPU,AI推理時(shí)代大廠加速推進(jìn)全棧異構(gòu)布局
日前Meta與英偉達(dá)簽署的一項(xiàng)多年期合同受到廣泛關(guān)注,其中約定Meta不僅將采購數(shù)百萬顆Blackwell和Rubin GPU,搭建大規(guī)模AI數(shù)據(jù)中心,還采用英偉達(dá)Grace CPU作為獨(dú)立服務(wù)器芯片。這也是該款CPU首次實(shí)現(xiàn)大規(guī)模部署,表明英偉達(dá)在GPU之外,仍致力于大力推進(jìn)旗下CPU產(chǎn)品線的發(fā)展。
而另據(jù)最新消息,AMD也在積極推進(jìn)旗下Instinct MI450(基于Instinct GPU 和代號(hào)為“Venice”的第六代AMD EPYC? CPU)的發(fā)展,其與Meta簽訂的最新協(xié)議中,MI450將被用于Meta下一代AI基礎(chǔ)設(shè)施,合同金額達(dá)600億美元。
上述事情表明,隨著AI技術(shù)不斷迭代發(fā)展,計(jì)算范式也在不斷演進(jìn)改變,并對(duì)芯片產(chǎn)業(yè)的競爭格局產(chǎn)生重大影響,單一計(jì)算單元很難滿足多元需求。這使越來越多芯片大廠選擇在CPU、GPU、NPU等不同技術(shù)方向上協(xié)同發(fā)力。全棧異構(gòu)架構(gòu)已成芯片大廠的必爭之地。
全棧異構(gòu)布局持續(xù)提速
2025年底至今,CPU市場掀起一波小高潮,供需失衡態(tài)勢(shì)初現(xiàn)。有媒體報(bào)稱,英特爾、AMD的服務(wù)器CPU都出現(xiàn)產(chǎn)能提前售罄的情況,部分型號(hào)交貨周期達(dá)到6個(gè)月。
對(duì)此,有觀點(diǎn)認(rèn)為,這一市場熱度標(biāo)志著CPU在AI時(shí)代的價(jià)值回歸。此前,在AI計(jì)算中GPU憑借強(qiáng)大的并行計(jì)算能力占據(jù)絕對(duì)主導(dǎo),CPU僅承擔(dān)基礎(chǔ)的通用計(jì)算任務(wù),使用率相對(duì)有限。但隨著生成式AI、多模態(tài)模型的普及,人工智能計(jì)算范式將從“訓(xùn)練主導(dǎo)”轉(zhuǎn)向“訓(xùn)推并重”,尤其是AI進(jìn)入智能體時(shí)代以后,任務(wù)調(diào)度、工具調(diào)用等環(huán)節(jié)對(duì)CPU的依賴將大幅提升。
這一改變將推動(dòng)CPU使用率的攀升。在大模型預(yù)訓(xùn)練和微調(diào)階段,CPU負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)、分片與索引,將海量數(shù)據(jù)有序整理后輸送給GPU集群,為矩陣乘法等核心運(yùn)算提供高效支撐;在多模態(tài)推理場景中,CPU承擔(dān)圖像、視頻的解碼任務(wù),緩解GPU的算力壓力,保障多格式數(shù)據(jù)的順暢處理。
未來AI將向邊緣與端側(cè)深度滲透,場景的多樣性對(duì)算力將提出更加苛刻的要求,既要滿足高強(qiáng)度并行計(jì)算,也要兼顧低功耗、高靈活性,單一芯片無法覆蓋全場景需求,全棧異構(gòu)必將成為行業(yè)標(biāo)配。而這樣的趨勢(shì)判斷,使得國際與國內(nèi)芯片廠商都選擇同步布局GPU、CPU乃至NPU技術(shù),以實(shí)現(xiàn)多芯片的全棧異構(gòu)協(xié)同,搶占市場先機(jī)。
英偉達(dá)、英特爾大廠發(fā)力
2020 年英偉達(dá)就計(jì)劃以400億美元價(jià)格從軟銀手中收購 Arm公司股權(quán)。這一交易雖然最終被叫停,但英偉達(dá)與Arm的合作并未結(jié)束,英偉達(dá)仍是Arm的主要用戶與合作伙伴。英偉達(dá)的Grace和Vera CPU,仍然使用Arm的知識(shí)產(chǎn)權(quán)和指令集。去年的GTC大會(huì)上,英偉達(dá)推出GB300平臺(tái),整合Grace CPU與B300 GPU,大幅提升AI推理性能;英偉達(dá)還官宣下一代Vera Rubin平臺(tái),采用定制Arm架構(gòu)Vera CPU與Rubin GPU的組合,進(jìn)一步突破算力與能效極限,瞄準(zhǔn)下一代AI推理與智能體場景,以鞏固其在數(shù)據(jù)中心領(lǐng)域的主導(dǎo)地位。
英特爾在全力推進(jìn)18A(1.8nm級(jí))制程工藝落地的同時(shí),也在加速補(bǔ)全GPU短板。在今年1月舉辦的CES展會(huì)上,英特爾發(fā)布了首款基于Intel 18A制程打造的計(jì)算平臺(tái)第三代酷睿Ultra處理器(代號(hào) Panther Lake)。值得關(guān)注的是,2026年初英特爾正式任命原高通工程高級(jí)副總裁Eric Demers擔(dān)任首席GPU架構(gòu)師。Eric Demers將負(fù)責(zé)設(shè)計(jì)AI加速GPU,進(jìn)一步補(bǔ)強(qiáng)GPU研發(fā)實(shí)力,全力構(gòu)建x86+GPU+NPU的全棧異構(gòu)解決方案。

AMD一直具備CPU與GPU異構(gòu)能力。去年4月,Instinct MI350 系列(CDNA4 架構(gòu))上市,主打 CPU+GPU 3D 堆疊 異構(gòu),AI 推理能效大幅提升,同時(shí)在銳龍AI系列中集成 XDNA 2 NPU,強(qiáng)化端側(cè)與嵌入式 AI。前文提到的MI450 將于今年發(fā)布,采用 2nm 制程工藝與 CDNA 5 架構(gòu),將被首批用于Meta的AI基礎(chǔ)設(shè)施當(dāng)中。
高通則依托驍龍平臺(tái)實(shí)現(xiàn)CPU、GPU、NPU的深度整合。憑借端側(cè)生態(tài)優(yōu)勢(shì),高通將全棧異構(gòu)能力下沉到邊緣計(jì)算與消費(fèi)電子領(lǐng)域。
國內(nèi)廠商自主突圍
國內(nèi)芯片廠商立足自主可控的情況下,也在加速全棧異構(gòu)領(lǐng)域的突圍。海光信息作為國內(nèi)少數(shù)實(shí)現(xiàn)CPU與GPU同步量產(chǎn)的廠商,全力推進(jìn)全棧異構(gòu)布局。公司量產(chǎn)的海光三號(hào)CPU采用x86兼容架構(gòu),大幅提升數(shù)據(jù)中心通用計(jì)算能力,可高效承擔(dān)AI推理中的數(shù)據(jù)調(diào)度與預(yù)處理任務(wù);同時(shí),其深算系列GPGPU持續(xù)迭代,兼容CUDA/ROCm生態(tài),在AI訓(xùn)練與推理場景中實(shí)現(xiàn)國產(chǎn)替代,通過HSL高速互聯(lián)協(xié)議實(shí)現(xiàn)CPU與GPU的低時(shí)延協(xié)同,已在金融、運(yùn)營商、智算中心等場景規(guī)模化落地,成為國內(nèi)全棧異構(gòu)布局的核心力量。
阿里平頭哥以RISC-V架構(gòu)為基礎(chǔ),構(gòu)建云邊端一體的全棧異構(gòu)方案。其玄鐵系列RISC-V CPU持續(xù)拓展生態(tài),覆蓋端側(cè)與邊緣設(shè)備,為全棧異構(gòu)布局提供通用計(jì)算支撐;同時(shí),平頭哥推出含光系列NPU(用于云端推理)與真武810E訓(xùn)推一體芯片,搭配通用GPU,形成CPU+GPU+NPU的全棧協(xié)同架構(gòu),依托阿里云生態(tài)實(shí)現(xiàn)大規(guī)模部署。
除了全棧布局的代表企業(yè),國內(nèi)眾多廠商在特定AI領(lǐng)域深耕細(xì)作,結(jié)合CPU或GPU技術(shù)形成特色異構(gòu)解決方案。地平線專注于車載AI芯片領(lǐng)域,其征程系列車載SoC持續(xù)迭代,其中征程6系列采用第三代納什架構(gòu),集成18核心的ARM Cortex-A78AE CPU、200G FLOPS算力的GPU與四核自研BPU(NPU),最高AI算力達(dá)560TOPS,可接入24路攝像頭與多種傳感器,支持全場景NOA高階智駕,通過CPU、GPU、NPU的協(xié)同優(yōu)化,成為車載AI異構(gòu)解決方案的標(biāo)桿。
摩爾線程聚焦通用GPU研發(fā),其MTT S系列GPU持續(xù)迭代,提升圖形渲染與AI推理能力,推出的夸娥萬卡集群方案實(shí)現(xiàn)大規(guī)模AI訓(xùn)練,補(bǔ)齊國產(chǎn)通用GPU短板,同時(shí)與通用CPU協(xié)同,為AI推理、工業(yè)視覺等場景提供異構(gòu)算力支撐。
景嘉微在自研 JM 系列GPU的基礎(chǔ)上,通過定增募資近40億元,加強(qiáng)GPGPU研發(fā),面向數(shù)據(jù)中心、AI訓(xùn)練等場景。通過控股子公司無錫誠恒微電子,完成邊端側(cè)AI SoC芯片CH37系列的研發(fā)突破,采用高集成度單芯片架構(gòu),集成高端CPU、GPU、NPU、GPGPU、ISP等處理單元,提供64TOPS@INT8的峰值A(chǔ)I算力。
AI推理時(shí)代的算力競爭,已從單芯片參數(shù)比拼升級(jí)為全棧系統(tǒng)效率的較量。CPU價(jià)值的回歸、全棧異構(gòu)的普及,將重塑全球芯片產(chǎn)業(yè)的競爭格局。國際大廠憑借技術(shù)積累、生態(tài)優(yōu)勢(shì)與規(guī)模效應(yīng),加速推進(jìn)全棧異構(gòu)產(chǎn)品落地與生態(tài)卡位。國內(nèi)廠商則需立足自主創(chuàng)新,在全棧布局與垂直領(lǐng)域雙線突破,加速實(shí)現(xiàn)國產(chǎn)替代。