Techub News 消息,據 CryptoBriefing 報道,新浪微博研究團隊發布 VibeThinker-3B 語言模型。該模型僅含 30 億參數,但在 AIME 2026 數學競賽基準測試中獲得 94.3 分,與擁有 6710 億參數的 DeepSeek V3.2 性能相當,在 LiveCodeBench v6 編碼測試中也達到 80.2 的 Pass@1 分數。該模型基於 Qwen2.5-Coder-3B 架構構建,團隊通過課程式監督微調、多領域強化學習和離線自蒸餾技術提升性能。目前模型權重與代碼已在 Hugging Face 和 GitHub 以 MIT 協議完全開源。分析指出,此類高效小型模型更易於在分布式網絡中運行,對加密貨幣領域去中心化 AI 項目具有建設性意義。
內容來源:TECHUB NEWS
更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)