請輸入關鍵字:

熱門搜尋:

【杜蘭說AI】大模型的“大”到底是啥?

2025年5月9日 上午10:10

大模型的“大”到底是啥?
一共四個維度,
第一,
參數規模,
就像是你吃火鍋時鍋的大小,
也是一切的基礎,
ChatGPT就是一口1750億參數的巨型火鍋,
因為夠大,
所以能涮的食材也多。

這又涉及到了咱們的第二個維度,
訓練數據的規模,
就是咱們涮火鍋的食材種類,
食材越多越豐富,
涮鍋的味道就越香,
這也就是為啥說
“訓練數據決定了模型的知識廣度和深度”。

第三是計算量,
也叫訓練模型的能源消耗,
計算量大不大,
就是在問你這鍋的火力大不大?
一般肯定是火力越強熟得越快,
但也有像DeepSeek這樣,
著名的550萬美元能耗的火鍋,
主打一個“智能控溫”,
能耗小,
湯也能熟。

最後一個叫上下文窗口,
它決定的是模型能同時處理的信息量,
這回咱得支個桌了,
上下文窗口越大,
就相當於你放火鍋的餐桌越大,
那能放的菜品肯定也越多,
模型一次能處理的信息也就越多。

總結起來就是,
大模型就是一鍋容量大、食材多、火力強、桌面寬的火鍋。
好了,
吃個火鍋獎勵一下自己吧。

更多精彩內容
請登陸
財華香港網 (https://www.finet.hk/)或
現代電視 (https://www.fintv.hk)

相關視頻

快訊

17:31
【盈喜】時代天使(06699.HK)料年度淨利潤同比增加140%至200%
17:21
中國人民銀行決定授權中國銀行股份有限公司科倫坡分行擔任斯里蘭卡人民幣清算行
17:12
如祺出行(09680.HK)料年度股東應佔綜合虧損同比收窄不少於43.4%
17:01
軒竹生物-B(02575.HK)軒悅寧第三個適應症上市申請獲國家藥監局批准
16:48
巨濤海洋石油服務(03303.HK)料年度公司擁有人應佔溢利同比減少83.79%至67.58%
16:37
香港金管局與澳門金管局簽署修訂諒解備忘錄以進一步加強合作
16:28
香港2月樓宇買賣合約總值按年升119.7%
16:20
【異動股】港股跌幅榜前十,倢冠控股(08606.HK)跌32.71%,金威醫療(08143.HK)跌28.57%
16:20
【異動股】港股漲幅榜前十,中油燃氣(00603.HK)漲117.03%,百勤油服(02178.HK)漲71.23%
16:13
愛麗家居(603221.SH)美國工廠及墨西哥工廠產能利用率持續爬坡 均處於正常經營狀態