請輸入關鍵字:

熱門搜尋:

阿裡巴巴推出更高效的Qwen3-Next人工智能模型

日期: 2025年9月12日 上午7:27

PANews 9月12日消息,阿裡巴巴旗下通義千問發佈了下一代基礎模型架構Qwen3-Next,並開源了基於該架構的Qwen3-Next-80B-A3B係列模型。該結構相比Qwen3的MoE模型結構,進行了以下核心改進:混合注意力機制、高稀疏度MoE結構、一係列訓練穩定友好的優化,以及提升推理效率的多token預測機制。基於Qwen3-Next的模型結構,阿裡訓練了Qwen3-Next-80B-A3B-Base模型,該模型擁有800億參數僅激活30億參數。該Base模型實現了與Qwen3-32B dense模型相近甚至略好的性能,而它的訓練成本(GPU hours) 僅為Qwen3-32B的十分之一不到,在32k以上的上下文下的推理吞吐則是Qwen3-32B的十倍以上,實現了極致的訓練和推理性價比。

内容來源:PANews

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。

更多精彩内容,請點擊: 財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

視頻

快訊

17:33
香港證監會取得針對盧衍溢及Major Success的全球性凍結令
17:26
香港聯交所計劃收窄每周股票期權行使價間距
17:12
香港聯交所:對利時集團控股(00526.HK)及7名前高管採取紀律行動
17:05
香港證監會:高科橋(09963.HK)股權高度集中
16:49
北京君正(300223.SZ)發行H股獲中國證監會備案
16:48
香港五月份整體出口和進口貨值按年分別上升40.8%和42.0%
16:32
嘉利國際(01050.HK)年度股東應佔溢利同比增長32% 末期息4.5港仙
16:25
【異動股】港股跌幅榜前十,國家聯合資源(00254.HK)跌86.31%,新明中國股權(02964.HK)跌80.39%
16:25
【異動股】港股漲幅榜前十,中國前沿科技集團(01661.HK)漲+55.04%,百信國際(00574.HK)漲+42.11%
16:14
鉑科新材:公司TLVR電感去年開始批量出貨 今年將持續配合服務客戶和產業鏈