Techub News 消息,@VitalikButerin 發推稱,DeepSeek v4 已推出 2-bit 量化版本,可在 90GB 内存内運行,但在 Apple 硬件上處理速度可達每秒 35 個 token,而在 AMD 平台上僅約每秒 7 個 token,呼籲進一步優化多硬件適配支持。 該評測揭示了大型語言模型在消費級硬件部署時的性能瓶頸。目前該模型雖通過量化技術降低内存門檻,但跨平台速度差異顯著,可能影響其在非蘋果生態中的普及應用。
内容來源:TECHUB NEWS
更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)