中文字幕大香视频蕉免费丨国产精无久久久久久久免费丨亚洲色大成成人网站久久丨网站黄在线丨把少妇弄高潮了www麻豆丨极品少妇xxxx精品少妇小说丨国产成人免费看一级大黄丨伊人激情丨狠狠插av丨久久综合九色欧美综合狠狠丨国产成人8x视频网站入口丨天堂av资源丨国产九一精品丨av网天堂丨久久久久久久久久久免费av丨免费看国产zzzwww色丨国产 日韩 欧美 制服丝袜丨日本黄色录相丨久久精品99久久久久久2456丨亚洲精品无码人妻无码丨黄色免费视频丨三级毛片国产三级毛片丨亚洲精品久久午夜麻豆丨亚洲网站免费观看丨日本三级全黄少妇三2020

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

阿里發(fā)布Qwen3-Coder,為4800億參數(shù)開源代碼模型

2025-07-24 來源:愛集微 原創(chuàng)文章
295

關(guān)鍵詞: 阿里Qwen3-Coder 混合專家模型 代碼強化學(xué)習(xí) 代理式編程 開源模型

近日,阿里巴巴集團(tuán)正式發(fā)布了全新開源代碼模型 Qwen3-Coder,引起了廣泛關(guān)注。此次發(fā)布的 Qwen3-Coder-480B-A35B-Instruct(以下簡稱 Qwen3-Coder)是該系列中最強大的版本,擁有高達(dá)4,800億的總參數(shù)量和350億的激活參數(shù),原生支持256K token的上下文,并可擴展到1百萬token,支持358種編程語言。

Qwen3-Coder采用了混合專家(MoE)模型架構(gòu),配備了96個查詢(Q)注意力頭和8個鍵/值(KV)注意力頭,擁有160個專家,其中8個專家被激活。在預(yù)訓(xùn)練階段,該模型從數(shù)據(jù)、上下文和合成數(shù)據(jù)三個角度進(jìn)行擴展,以提升代碼能力;在后訓(xùn)練階段,研究團(tuán)隊通過在真實代碼任務(wù)上擴展代碼強化學(xué)習(xí)(Code RL)訓(xùn)練,顯著提升了代碼執(zhí)行成功率。

值得一提的是,Qwen3-Coder在代理式編碼、代理式瀏覽器使用和代理式工具使用上達(dá)到了開源模型的領(lǐng)先水平,媲美Claude Sonnet 4。其代碼庫上線一小時便收獲了5.1k Star,足見其受歡迎程度。此外,阿里還推出了基于Qwen3-Coder的命令行工具Qwen Code,進(jìn)一步提升了其在代理式編程任務(wù)上的表現(xiàn)。

Qwen3-Coder的發(fā)布是阿里Qwen3系列模型的最新進(jìn)展。三個月前,阿里發(fā)布了Qwen3系列,包括兩款MoE模型和六款密集模型。其中的旗艦?zāi)P蚎wen3-235B-A22B,總參數(shù)量高達(dá)2,350億,激活參數(shù)為220億。此次發(fā)布的Qwen3-Coder取消了混合思維模式,專注于非思考模式,以獲得最佳質(zhì)量。