Techub News 消息,據 CryptoBriefing 報道,新浪微博研究團隊發布 VibeThinker-3B 語言模型。該模型僅含 30 億參數,但在 AIME 2026 數學競賽基準測試中獲得 94.3 分,與擁有 6710 億參數的 DeepSeek V3.2 性能相當,在 LiveCodeBench v6 編碼測試中也達到 80.2 的 Pass@1 分數。該模型基於 Qwen2.5-Coder-3B 架構構建,團隊通過課程式監督微調、多領域強化學習和離線自蒸餾技術提升性能。目前模型權重與代碼已在 Hugging Face 和 GitHub 以 MIT 協議完全開源。分析指出,此類高效小型模型更易於在分布式網絡中運行,對加密貨幣領域去中心化 AI 項目具有建設性意義。
內容來源:TECHUB NEWS
財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。