Techub News 消息,DeepSeek 發布 DSpark 推測解碼框架,可在不犧牲輸出質量的前提下,將其 DeepSeek-V4 模型的單用戶生成速度提升 60%至 85%,吞吐量提升 51%至 400%。DSpark 採用「半並行」方法,結合高吞吐量並行生成與自適應驗證,通過同時生成多個候選令牌並選擇性驗證實現加速。該框架已部署於實際生產環境,並開源了訓練評估代碼庫 DeepSpec 及模型檢查點,且兼容 Gemma、Qwen 等開源模型,有望顯著改善去中心化計算網絡的單位經濟效益。(CryptoBriefing)
內容來源:TECHUB NEWS
更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)