中文字幕大香视频蕉免费丨国产精无久久久久久久免费丨亚洲色大成成人网站久久丨网站黄在线丨把少妇弄高潮了www麻豆丨极品少妇xxxx精品少妇小说丨国产成人免费看一级大黄丨伊人激情丨狠狠插av丨久久综合九色欧美综合狠狠丨国产成人8x视频网站入口丨天堂av资源丨国产九一精品丨av网天堂丨久久久久久久久久久免费av丨免费看国产zzzwww色丨国产 日韩 欧美 制服丝袜丨日本黄色录相丨久久精品99久久久久久2456丨亚洲精品无码人妻无码丨黄色免费视频丨三级毛片国产三级毛片丨亚洲精品久久午夜麻豆丨亚洲网站免费观看丨日本三级全黄少妇三2020

歡迎訪問深圳市中小企業(yè)公共服務平臺電子信息窗口

英偉達大舉進軍CPU,AI推理時代大廠加速推進全棧異構(gòu)布局

2026-02-28 來源:愛集微
61

關(guān)鍵詞: 英偉達 Meta AI推理

日前Meta與英偉達簽署的一項多年期合同受到廣泛關(guān)注,其中約定Meta不僅將采購數(shù)百萬顆Blackwell和Rubin GPU,搭建大規(guī)模AI數(shù)據(jù)中心,還采用英偉達Grace CPU作為獨立服務器芯片。這也是該款CPU首次實現(xiàn)大規(guī)模部署,表明英偉達在GPU之外,仍致力于大力推進旗下CPU產(chǎn)品線的發(fā)展。 

而另據(jù)最新消息,AMD也在積極推進旗下Instinct MI450(基于Instinct GPU 和代號為“Venice”的第六代AMD EPYC? CPU)的發(fā)展,其與Meta簽訂的最新協(xié)議中,MI450將被用于Meta下一代AI基礎(chǔ)設(shè)施,合同金額達600億美元。 

上述事情表明,隨著AI技術(shù)不斷迭代發(fā)展,計算范式也在不斷演進改變,并對芯片產(chǎn)業(yè)的競爭格局產(chǎn)生重大影響,單一計算單元很難滿足多元需求。這使越來越多芯片大廠選擇在CPU、GPU、NPU等不同技術(shù)方向上協(xié)同發(fā)力。全棧異構(gòu)架構(gòu)已成芯片大廠的必爭之地。 

全棧異構(gòu)布局持續(xù)提速 

2025年底至今,CPU市場掀起一波小高潮,供需失衡態(tài)勢初現(xiàn)。有媒體報稱,英特爾、AMD的服務器CPU都出現(xiàn)產(chǎn)能提前售罄的情況,部分型號交貨周期達到6個月。 

對此,有觀點認為,這一市場熱度標志著CPU在AI時代的價值回歸。此前,在AI計算中GPU憑借強大的并行計算能力占據(jù)絕對主導,CPU僅承擔基礎(chǔ)的通用計算任務,使用率相對有限。但隨著生成式AI、多模態(tài)模型的普及,人工智能計算范式將從“訓練主導”轉(zhuǎn)向“訓推并重”,尤其是AI進入智能體時代以后,任務調(diào)度、工具調(diào)用等環(huán)節(jié)對CPU的依賴將大幅提升。 

這一改變將推動CPU使用率的攀升。在大模型預訓練和微調(diào)階段,CPU負責數(shù)據(jù)的存儲、分片與索引,將海量數(shù)據(jù)有序整理后輸送給GPU集群,為矩陣乘法等核心運算提供高效支撐;在多模態(tài)推理場景中,CPU承擔圖像、視頻的解碼任務,緩解GPU的算力壓力,保障多格式數(shù)據(jù)的順暢處理。 

未來AI將向邊緣與端側(cè)深度滲透,場景的多樣性對算力將提出更加苛刻的要求,既要滿足高強度并行計算,也要兼顧低功耗、高靈活性,單一芯片無法覆蓋全場景需求,全棧異構(gòu)必將成為行業(yè)標配。而這樣的趨勢判斷,使得國際與國內(nèi)芯片廠商都選擇同步布局GPU、CPU乃至NPU技術(shù),以實現(xiàn)多芯片的全棧異構(gòu)協(xié)同,搶占市場先機。 

英偉達、英特爾大廠發(fā)力 

2020 年英偉達就計劃以400億美元價格從軟銀手中收購 Arm公司股權(quán)。這一交易雖然最終被叫停,但英偉達與Arm的合作并未結(jié)束,英偉達仍是Arm的主要用戶與合作伙伴。英偉達的Grace和Vera CPU,仍然使用Arm的知識產(chǎn)權(quán)和指令集。去年的GTC大會上,英偉達推出GB300平臺,整合Grace CPU與B300 GPU,大幅提升AI推理性能;英偉達還官宣下一代Vera Rubin平臺,采用定制Arm架構(gòu)Vera CPU與Rubin GPU的組合,進一步突破算力與能效極限,瞄準下一代AI推理與智能體場景,以鞏固其在數(shù)據(jù)中心領(lǐng)域的主導地位。 

英特爾在全力推進18A(1.8nm級)制程工藝落地的同時,也在加速補全GPU短板。在今年1月舉辦的CES展會上,英特爾發(fā)布了首款基于Intel 18A制程打造的計算平臺第三代酷睿Ultra處理器(代號 Panther Lake)。值得關(guān)注的是,2026年初英特爾正式任命原高通工程高級副總裁Eric Demers擔任首席GPU架構(gòu)師。Eric Demers將負責設(shè)計AI加速GPU,進一步補強GPU研發(fā)實力,全力構(gòu)建x86+GPU+NPU的全棧異構(gòu)解決方案。

 AMD一直具備CPU與GPU異構(gòu)能力。去年4月,Instinct MI350 系列(CDNA4 架構(gòu))上市,主打 CPU+GPU 3D 堆疊 異構(gòu),AI 推理能效大幅提升,同時在銳龍AI系列中集成 XDNA 2 NPU,強化端側(cè)與嵌入式 AI。前文提到的MI450 將于今年發(fā)布,采用 2nm 制程工藝與 CDNA 5 架構(gòu),將被首批用于Meta的AI基礎(chǔ)設(shè)施當中。 

高通則依托驍龍平臺實現(xiàn)CPU、GPU、NPU的深度整合。憑借端側(cè)生態(tài)優(yōu)勢,高通將全棧異構(gòu)能力下沉到邊緣計算與消費電子領(lǐng)域。 

國內(nèi)廠商自主突圍 

國內(nèi)芯片廠商立足自主可控的情況下,也在加速全棧異構(gòu)領(lǐng)域的突圍。海光信息作為國內(nèi)少數(shù)實現(xiàn)CPU與GPU同步量產(chǎn)的廠商,全力推進全棧異構(gòu)布局。公司量產(chǎn)的海光三號CPU采用x86兼容架構(gòu),大幅提升數(shù)據(jù)中心通用計算能力,可高效承擔AI推理中的數(shù)據(jù)調(diào)度與預處理任務;同時,其深算系列GPGPU持續(xù)迭代,兼容CUDA/ROCm生態(tài),在AI訓練與推理場景中實現(xiàn)國產(chǎn)替代,通過HSL高速互聯(lián)協(xié)議實現(xiàn)CPU與GPU的低時延協(xié)同,已在金融、運營商、智算中心等場景規(guī)?;涞?,成為國內(nèi)全棧異構(gòu)布局的核心力量。 

阿里平頭哥以RISC-V架構(gòu)為基礎(chǔ),構(gòu)建云邊端一體的全棧異構(gòu)方案。其玄鐵系列RISC-V CPU持續(xù)拓展生態(tài),覆蓋端側(cè)與邊緣設(shè)備,為全棧異構(gòu)布局提供通用計算支撐;同時,平頭哥推出含光系列NPU(用于云端推理)與真武810E訓推一體芯片,搭配通用GPU,形成CPU+GPU+NPU的全棧協(xié)同架構(gòu),依托阿里云生態(tài)實現(xiàn)大規(guī)模部署。 

除了全棧布局的代表企業(yè),國內(nèi)眾多廠商在特定AI領(lǐng)域深耕細作,結(jié)合CPU或GPU技術(shù)形成特色異構(gòu)解決方案。地平線專注于車載AI芯片領(lǐng)域,其征程系列車載SoC持續(xù)迭代,其中征程6系列采用第三代納什架構(gòu),集成18核心的ARM Cortex-A78AE CPU、200G FLOPS算力的GPU與四核自研BPU(NPU),最高AI算力達560TOPS,可接入24路攝像頭與多種傳感器,支持全場景NOA高階智駕,通過CPU、GPU、NPU的協(xié)同優(yōu)化,成為車載AI異構(gòu)解決方案的標桿。 

摩爾線程聚焦通用GPU研發(fā),其MTT S系列GPU持續(xù)迭代,提升圖形渲染與AI推理能力,推出的夸娥萬卡集群方案實現(xiàn)大規(guī)模AI訓練,補齊國產(chǎn)通用GPU短板,同時與通用CPU協(xié)同,為AI推理、工業(yè)視覺等場景提供異構(gòu)算力支撐。 

景嘉微在自研 JM 系列GPU的基礎(chǔ)上,通過定增募資近40億元,加強GPGPU研發(fā),面向數(shù)據(jù)中心、AI訓練等場景。通過控股子公司無錫誠恒微電子,完成邊端側(cè)AI SoC芯片CH37系列的研發(fā)突破,采用高集成度單芯片架構(gòu),集成高端CPU、GPU、NPU、GPGPU、ISP等處理單元,提供64TOPS@INT8的峰值A(chǔ)I算力。 

AI推理時代的算力競爭,已從單芯片參數(shù)比拼升級為全棧系統(tǒng)效率的較量。CPU價值的回歸、全棧異構(gòu)的普及,將重塑全球芯片產(chǎn)業(yè)的競爭格局。國際大廠憑借技術(shù)積累、生態(tài)優(yōu)勢與規(guī)模效應,加速推進全棧異構(gòu)產(chǎn)品落地與生態(tài)卡位。國內(nèi)廠商則需立足自主創(chuàng)新,在全棧布局與垂直領(lǐng)域雙線突破,加速實現(xiàn)國產(chǎn)替代。