請輸入關鍵字:

熱門搜尋:

【杜蘭說AI】大模型的“大”到底是啥?

2025年5月9日 上午10:10

大模型的“大”到底是啥?
一共四個維度,
第一,
參數規模,
就像是你吃火鍋時鍋的大小,
也是一切的基礎,
ChatGPT就是一口1750億參數的巨型火鍋,
因為夠大,
所以能涮的食材也多。

這又涉及到了咱們的第二個維度,
訓練數據的規模,
就是咱們涮火鍋的食材種類,
食材越多越豐富,
涮鍋的味道就越香,
這也就是為啥說
“訓練數據決定了模型的知識廣度和深度”。

第三是計算量,
也叫訓練模型的能源消耗,
計算量大不大,
就是在問你這鍋的火力大不大?
一般肯定是火力越強熟得越快,
但也有像DeepSeek這樣,
著名的550萬美元能耗的火鍋,
主打一個“智能控溫”,
能耗小,
湯也能熟。

最後一個叫上下文窗口,
它決定的是模型能同時處理的信息量,
這回咱得支個桌了,
上下文窗口越大,
就相當於你放火鍋的餐桌越大,
那能放的菜品肯定也越多,
模型一次能處理的信息也就越多。

總結起來就是,
大模型就是一鍋容量大、食材多、火力強、桌面寬的火鍋。
好了,
吃個火鍋獎勵一下自己吧。

更多精彩內容
請登陸
財華香港網 (https://www.finet.hk/)或
現代電視 (https://www.fintv.hk)

相關視頻

快訊

19:59
解禁壓力之下,三花智控股價大跌超7%
19:53
單日暴漲逾109%!偉業控股股價為何一飛衝天?
19:37
【IPO前哨】丸美生物「不完美」:盈利縮水,分紅惹爭議
19:21
【百強透視】蜜雪、古茗等擠進全球TOP50!胡潤榜單揭曉餐飲資本新寵
17:34
中國疏浚環保(00871.HK):劉亞軍獲任執行董事及行政總裁
17:27
撥康視雲-B(02592.HK)附屬治療老花眼的眼用乳液提交新藥臨床試驗申請
17:17
新華保險(01336.HK)前11個月原保險保費收入同比增長16%
17:13
證監會:加快科創板「1+6」改革舉措落地 儘快落地商業不動產REITs試點
17:02
香港第三季本地居民總收入按年上升1.5%
16:57
香港10月商品整體出口貨量及進口貨量分別按年上升14.6%及15.7%

付饒說RWA

這里是連接現實資產與數字世界的思想陣地。 付饒是RWA.ltd CEO,香港國際新經濟研究院執行董事...

PANews

PANews是區塊鏈和Web3.0領域領先的智庫型信息平台,為行業用戶提供具有國際視野的前沿資訊與報...

有連雲

國内領先的智能金融信息引擎

長橋証券

投資的本質是認知的變現,研究的意義是認知的提升!...