阿裡巴巴推出更高效的Qwen3-Next人工智能模型

日期： 2025年9月12日上午7:27

PANews 9月12日消息，阿裡巴巴旗下通義千問發佈了下一代基礎模型架構Qwen3-Next，並開源了基於該架構的Qwen3-Next-80B-A3B係列模型。該結構相比Qwen3的MoE模型結構,進行了以下核心改進：混合注意力機制、高稀疏度MoE結構、一係列訓練穩定友好的優化，以及提升推理效率的多token預測機制。基於Qwen3-Next的模型結構，阿裡訓練了Qwen3-Next-80B-A3B-Base模型，該模型擁有800億參數僅激活30億參數。該Base模型實現了與Qwen3-32B dense模型相近甚至略好的性能，而它的訓練成本(GPU hours) 僅為Qwen3-32B的十分之一不到，在32k以上的上下文下的推理吞吐則是Qwen3-32B的十倍以上，實現了極致的訓練和推理性價比。

内容來源：PANews

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可，禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載，請發郵件至 content@finet.com.hk，獲得書面確認及授權後，方可轉載。

更多精彩内容，請點擊：財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

PANews

PANews是區塊鏈和Web3.0領域領先的智庫型信息平台，為行業用戶提供具有國際視野的前沿資訊與報告。PANews優質多元的内容以圖文、音頻、視頻等形式在全網多渠道覆蓋，包含推特、微博、抖音、視頻號等主流平台，旨在成為用戶的Web3信息官。PANews同時還是騰訊新聞的内容合作夥伴，内容被福佈斯、財新等媒體引用，獲得騰訊新聞、今日頭條、澎湃新聞等頒發的相關獎項。PANews的兩位聯合創始人均為福

關注我們

請輸入關鍵字：

熱門搜尋：

阿裡巴巴推出更高效的Qwen3-Next人工智能模型

PANews

上一篇新聞

下一篇新聞

相關文章

視頻

【今日IPO】业绩亮眼却大跌！东鹏饮料深陷破发

【今日IPO】芯片板块大涨爱芯元智逆势大跌

【今日IPO】光环褪去！林清轩持续破发遇多重考验

【今日IPO】零收入闯港股！睿触机器人上市引争议

【今日IPO】七年闯关终上岸！溜溜梅冲刺港股

快訊

請輸入關鍵字：

熱門搜尋：

阿裡巴巴推出更高效的Qwen3-Next人工智能模型

PANews

上一篇新聞

下一篇新聞

相關文章

視頻

【今日IPO】业绩亮眼却大跌！东鹏饮料深陷破发

【今日IPO】芯片板块大涨 爱芯元智逆势大跌

【今日IPO】光环褪去！林清轩持续破发遇多重考验

【今日IPO】零收入闯港股！睿触机器人上市引争议

【今日IPO】七年闯关终上岸！溜溜梅冲刺港股

快訊

【今日IPO】芯片板块大涨爱芯元智逆势大跌