請輸入關鍵字:

熱門搜尋:

【杜蘭說AI】大模型的“大”到底是啥?

2025年5月9日 上午10:10

大模型的“大”到底是啥?
一共四個維度,
第一,
參數規模,
就像是你吃火鍋時鍋的大小,
也是一切的基礎,
ChatGPT就是一口1750億參數的巨型火鍋,
因為夠大,
所以能涮的食材也多。

這又涉及到了咱們的第二個維度,
訓練數據的規模,
就是咱們涮火鍋的食材種類,
食材越多越豐富,
涮鍋的味道就越香,
這也就是為啥說
“訓練數據決定了模型的知識廣度和深度”。

第三是計算量,
也叫訓練模型的能源消耗,
計算量大不大,
就是在問你這鍋的火力大不大?
一般肯定是火力越強熟得越快,
但也有像DeepSeek這樣,
著名的550萬美元能耗的火鍋,
主打一個“智能控溫”,
能耗小,
湯也能熟。

最後一個叫上下文窗口,
它決定的是模型能同時處理的信息量,
這回咱得支個桌了,
上下文窗口越大,
就相當於你放火鍋的餐桌越大,
那能放的菜品肯定也越多,
模型一次能處理的信息也就越多。

總結起來就是,
大模型就是一鍋容量大、食材多、火力強、桌面寬的火鍋。
好了,
吃個火鍋獎勵一下自己吧。

更多精彩內容
請登陸
財華香港網 (https://www.finet.hk/)或
現代電視 (https://www.fintv.hk)

相關視頻

快訊

17:41
余偉文:未來一段時間港匯和港息的走勢 仍存在較多變數
17:37
上交所舉辦「科創板市場宣介和QFII相關政策解讀」線上培訓班
17:35
香港證監會與老撾監管機構高層在香港會晤
17:31
建設銀行(00939.HK)完成發行400億元無固定期限資本債券
17:14
明辉国际(03828.HK)一季度收入同比減少4.8%
16:57
百果園集團(02411.HK)建議實行H股全流通
16:53
中国石油化工股份(00386.HK)控股股東完成可交換債券發行
16:42
和譽-B(02256.HK)附屬CSF-1R抑制劑匹米替尼獲國家藥監局納入優先審評
16:32
李家超:進一步優化旅遊配套 發掘更多旅遊熱點 繼續提升香港吸引力
16:26
國家發改委:做好「立改廢釋」 進一步完善促進民營經濟發展的制度機制