Techub News 消息,據 CryptoBriefing 報道,新浪微博研究團隊發布 VibeThinker-3B 語言模型。該模型僅含 30 億參數,但在 AIME 2026 數學競賽基準測試中獲得 94.3 分,與擁有 6710 億參數的 DeepSeek V3.2 性能相當,在 LiveCodeBench v6 編碼測試中也達到 80.2 的 Pass@1 分數。該模型基於 Qwen2.5-Coder-3B 架構構建,團隊通過課程式監督微調、多領域強化學習和離線自蒸餾技術提升性能。目前模型權重與代碼已在 Hugging Face 和 GitHub 以 MIT 協議完全開源。分析指出,此類高效小型模型更易於在分布式網絡中運行,對加密貨幣領域去中心化 AI 項目具有建設性意義。
內容來源:TECHUB NEWS
財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。
香港領先,世界一流的科技媒體平台 在數字化時代,Web3技術的崛起為媒體行業注入了新的活力。作為香港領先的Web3媒體平台,Techub News憑借其專業的團隊、豐富的資源和創新的業務模式,成為了行業内的佼佼者。Techub News,作為香港的科技媒體翹楚,致力於打造「香港領先,世界一流」的科技媒體和新媒體集群。Techub News平台提供最新、最快、最專業的Web3科技資訊,為用戶呈現科技前沿的無限魅力。