英偉達大舉進軍CPU，AI推理時代大廠加速推進全棧異構(gòu)布局

2026-02-28 來源：愛集微

日前Meta與英偉達簽署的一項多年期合同受到廣泛關(guān)注，其中約定Meta不僅將采購數(shù)百萬顆Blackwell和Rubin GPU，搭建大規(guī)模AI數(shù)據(jù)中心，還采用英偉達Grace CPU作為獨立服務器芯片。這也是該款CPU首次實現(xiàn)大規(guī)模部署，表明英偉達在GPU之外，仍致力于大力推進旗下CPU產(chǎn)品線的發(fā)展。

而另據(jù)最新消息，AMD也在積極推進旗下Instinct MI450（基于Instinct GPU 和代號為“Venice”的第六代AMD EPYC? CPU）的發(fā)展，其與Meta簽訂的最新協(xié)議中，MI450將被用于Meta下一代AI基礎(chǔ)設(shè)施，合同金額達600億美元。

上述事情表明，隨著AI技術(shù)不斷迭代發(fā)展，計算范式也在不斷演進改變，并對芯片產(chǎn)業(yè)的競爭格局產(chǎn)生重大影響，單一計算單元很難滿足多元需求。這使越來越多芯片大廠選擇在CPU、GPU、NPU等不同技術(shù)方向上協(xié)同發(fā)力。全棧異構(gòu)架構(gòu)已成芯片大廠的必爭之地。

全棧異構(gòu)布局持續(xù)提速

2025年底至今，CPU市場掀起一波小高潮，供需失衡態(tài)勢初現(xiàn)。有媒體報稱，英特爾、AMD的服務器CPU都出現(xiàn)產(chǎn)能提前售罄的情況，部分型號交貨周期達到6個月。

對此，有觀點認為，這一市場熱度標志著CPU在AI時代的價值回歸。此前，在AI計算中GPU憑借強大的并行計算能力占據(jù)絕對主導，CPU僅承擔基礎(chǔ)的通用計算任務，使用率相對有限。但隨著生成式AI、多模態(tài)模型的普及，人工智能計算范式將從“訓練主導”轉(zhuǎn)向“訓推并重”，尤其是AI進入智能體時代以后，任務調(diào)度、工具調(diào)用等環(huán)節(jié)對CPU的依賴將大幅提升。

這一改變將推動CPU使用率的攀升。在大模型預訓練和微調(diào)階段，CPU負責數(shù)據(jù)的存儲、分片與索引，將海量數(shù)據(jù)有序整理后輸送給GPU集群，為矩陣乘法等核心運算提供高效支撐；在多模態(tài)推理場景中，CPU承擔圖像、視頻的解碼任務，緩解GPU的算力壓力，保障多格式數(shù)據(jù)的順暢處理。

未來AI將向邊緣與端側(cè)深度滲透，場景的多樣性對算力將提出更加苛刻的要求，既要滿足高強度并行計算，也要兼顧低功耗、高靈活性，單一芯片無法覆蓋全場景需求，全棧異構(gòu)必將成為行業(yè)標配。而這樣的趨勢判斷，使得國際與國內(nèi)芯片廠商都選擇同步布局GPU、CPU乃至NPU技術(shù)，以實現(xiàn)多芯片的全棧異構(gòu)協(xié)同，搶占市場先機。

英偉達、英特爾大廠發(fā)力

2020 年英偉達就計劃以400億美元價格從軟銀手中收購 Arm公司股權(quán)。這一交易雖然最終被叫停，但英偉達與Arm的合作并未結(jié)束，英偉達仍是Arm的主要用戶與合作伙伴。英偉達的Grace和Vera CPU，仍然使用Arm的知識產(chǎn)權(quán)和指令集。去年的GTC大會上，英偉達推出GB300平臺，整合Grace CPU與B300 GPU，大幅提升AI推理性能；英偉達還官宣下一代Vera Rubin平臺，采用定制Arm架構(gòu)Vera CPU與Rubin GPU的組合，進一步突破算力與能效極限，瞄準下一代AI推理與智能體場景，以鞏固其在數(shù)據(jù)中心領(lǐng)域的主導地位。

英特爾在全力推進18A（1.8nm級）制程工藝落地的同時，也在加速補全GPU短板。在今年1月舉辦的CES展會上，英特爾發(fā)布了首款基于Intel 18A制程打造的計算平臺第三代酷睿Ultra處理器（代號 Panther Lake）。值得關(guān)注的是，2026年初英特爾正式任命原高通工程高級副總裁Eric Demers擔任首席GPU架構(gòu)師。Eric Demers將負責設(shè)計AI加速GPU，進一步補強GPU研發(fā)實力，全力構(gòu)建x86+GPU+NPU的全棧異構(gòu)解決方案。

AMD一直具備CPU與GPU異構(gòu)能力。去年4月，Instinct MI350 系列（CDNA4 架構(gòu)）上市，主打 CPU+GPU 3D 堆疊異構(gòu)，AI 推理能效大幅提升，同時在銳龍AI系列中集成 XDNA 2 NPU，強化端側(cè)與嵌入式 AI。前文提到的MI450 將于今年發(fā)布，采用 2nm 制程工藝與 CDNA 5 架構(gòu)，將被首批用于Meta的AI基礎(chǔ)設(shè)施當中。

高通則依托驍龍平臺實現(xiàn)CPU、GPU、NPU的深度整合。憑借端側(cè)生態(tài)優(yōu)勢，高通將全棧異構(gòu)能力下沉到邊緣計算與消費電子領(lǐng)域。

國內(nèi)廠商自主突圍

國內(nèi)芯片廠商立足自主可控的情況下，也在加速全棧異構(gòu)領(lǐng)域的突圍。海光信息作為國內(nèi)少數(shù)實現(xiàn)CPU與GPU同步量產(chǎn)的廠商，全力推進全棧異構(gòu)布局。公司量產(chǎn)的海光三號CPU采用x86兼容架構(gòu)，大幅提升數(shù)據(jù)中心通用計算能力，可高效承擔AI推理中的數(shù)據(jù)調(diào)度與預處理任務；同時，其深算系列GPGPU持續(xù)迭代，兼容CUDA/ROCm生態(tài)，在AI訓練與推理場景中實現(xiàn)國產(chǎn)替代，通過HSL高速互聯(lián)協(xié)議實現(xiàn)CPU與GPU的低時延協(xié)同，已在金融、運營商、智算中心等場景規(guī)?；涞?，成為國內(nèi)全棧異構(gòu)布局的核心力量。

阿里平頭哥以RISC-V架構(gòu)為基礎(chǔ)，構(gòu)建云邊端一體的全棧異構(gòu)方案。其玄鐵系列RISC-V CPU持續(xù)拓展生態(tài)，覆蓋端側(cè)與邊緣設(shè)備，為全棧異構(gòu)布局提供通用計算支撐；同時，平頭哥推出含光系列NPU（用于云端推理）與真武810E訓推一體芯片，搭配通用GPU，形成CPU+GPU+NPU的全棧協(xié)同架構(gòu)，依托阿里云生態(tài)實現(xiàn)大規(guī)模部署。

除了全棧布局的代表企業(yè)，國內(nèi)眾多廠商在特定AI領(lǐng)域深耕細作，結(jié)合CPU或GPU技術(shù)形成特色異構(gòu)解決方案。地平線專注于車載AI芯片領(lǐng)域，其征程系列車載SoC持續(xù)迭代，其中征程6系列采用第三代納什架構(gòu)，集成18核心的ARM Cortex-A78AE CPU、200G FLOPS算力的GPU與四核自研BPU（NPU），最高AI算力達560TOPS，可接入24路攝像頭與多種傳感器，支持全場景NOA高階智駕，通過CPU、GPU、NPU的協(xié)同優(yōu)化，成為車載AI異構(gòu)解決方案的標桿。

摩爾線程聚焦通用GPU研發(fā)，其MTT S系列GPU持續(xù)迭代，提升圖形渲染與AI推理能力，推出的夸娥萬卡集群方案實現(xiàn)大規(guī)模AI訓練，補齊國產(chǎn)通用GPU短板，同時與通用CPU協(xié)同，為AI推理、工業(yè)視覺等場景提供異構(gòu)算力支撐。

景嘉微在自研 JM 系列GPU的基礎(chǔ)上，通過定增募資近40億元，加強GPGPU研發(fā)，面向數(shù)據(jù)中心、AI訓練等場景。通過控股子公司無錫誠恒微電子，完成邊端側(cè)AI SoC芯片CH37系列的研發(fā)突破，采用高集成度單芯片架構(gòu)，集成高端CPU、GPU、NPU、GPGPU、ISP等處理單元，提供64TOPS@INT8的峰值A(chǔ)I算力。

AI推理時代的算力競爭，已從單芯片參數(shù)比拼升級為全棧系統(tǒng)效率的較量。CPU價值的回歸、全棧異構(gòu)的普及，將重塑全球芯片產(chǎn)業(yè)的競爭格局。國際大廠憑借技術(shù)積累、生態(tài)優(yōu)勢與規(guī)模效應，加速推進全棧異構(gòu)產(chǎn)品落地與生態(tài)卡位。國內(nèi)廠商則需立足自主創(chuàng)新，在全棧布局與垂直領(lǐng)域雙線突破，加速實現(xiàn)國產(chǎn)替代。

相關(guān)文章

行業(yè)動態(tài)

三星與美國得州達成和解，此前因非法數(shù)據(jù)收集被起訴

超200名谷歌與OpenAI員工簽署公開信拒絕向五角大樓提供軍事AI技術(shù)

美政府爆發(fā)AI分歧：多機構(gòu)質(zhì)疑馬斯克Grok安全性國防部執(zhí)意部署

熱讀文章

苗圩出席統(tǒng)籌推進疫情防控和產(chǎn)業(yè)轉(zhuǎn)型升級促進制造業(yè)通信業(yè)穩(wěn)定發(fā)展發(fā)布會

一圖讀懂2020年《政府工作報告》

工業(yè)富聯(lián)：擬7763萬美元收購鴻海精密美國子公司相關(guān)資產(chǎn)

英偉達大舉進軍CPU，AI推理時代大廠加速推進全棧異構(gòu)布局

英偉達大舉進軍CPU，AI推理時代大廠加速推進全棧異構(gòu)布局