DeepSeek新架構“MODEL1”代碼曝光,最快2月發布
近日, DeepSeek在GitHub上的代碼庫更新中,意外曝光了名為“MODEL1”的全新模型架構標識,這被廣泛認為是其下一代旗艦模型DeepSeek V4的技術基礎。多方信息顯示,該模型最快有望于2026年2月中旬,即農歷新年期間正式發布。

代碼泄露玄機,架構徹底重構
此次曝光源于DeepSeek對其開源推理加速庫FlashMLA的更新。在橫跨114個文件的代碼變動中,出現了28處“MODEL1”標識符,其技術路徑與現有的V32(即DeepSeek-V3.2)架構存在顯著差異,暗示這是一個經過徹底重構的新設計。

根據泄露的代碼信息,新架構的核心革新聚焦于底層性能優化。具體調整涉及鍵值(KV)緩存布局、稀疏性處理方式以及對FP8數據格式解碼的支持等關鍵技術環節。這些改進旨在針對性解決大模型運行中高內存占用與計算效率的瓶頸,為模型在同等硬件資源下實現更強的性能奠定基礎。

發布時間指向春節
關于新模型的發布時間,市場傳聞與此次代碼更新相互印證。本月初,外媒The Information爆料稱,DeepSeek計劃在2月中旬農歷新年期間推出新一代旗艦AI模型——DeepSeek V4。隨后,國內多家媒體也引述知情人士消息確認了這一發布窗口。
有報道稱,內部初步測試表明,DeepSeek V4在代碼生成與理解能力上已超過市場上的其他頂級模型。此前,DeepSeek于2025年1月發布的推理模型R1已在數學和代碼推理上樹立了標桿,而V4有望在此基礎上實現新的躍升。
國產AI能否再次引領突破?
DeepSeek此番動向引發了國內外科技社區的密切關注。

如果DeepSeek V4能如期發布并兌現其性能承諾,這可能標志著國產大模型首次在編程等核心能力上實現對國際頭部模型的全面超越。有海外博主評論稱:“如果我們能再迎來像DeepSeek那樣的突破性時刻,那將是具有里程碑意義的?!?/span>
此外,新架構的優化也順應了行業降低推理成本的大趨勢。英偉達此前已通過其Blackwell架構與TensorRT-LLM的協同優化,將DeepSeek-R1的單Token推理成本大幅降低。DeepSeek自身在模型架構效率上的革新,將進一步推動大語言模型的應用普及。
目前,深度求索公司尚未對“MODEL1”代碼曝光及新模型的發布傳聞作出任何官方回應。業界正屏息以待,看DeepSeek是否會在2026年新春為世界帶來又一次驚喜。