請輸入關鍵字：

熱門搜尋：

恒生指數公司香港金管局智匯礦業油氣油氣及煉化工程造車新勢力

FinTV 現代電視

【杜蘭說AI】大模型的“大”到底是啥？

2025年5月9日上午10:10

大模型的“大”到底是啥？
一共四個維度，
第一，
參數規模，
就像是你吃火鍋時鍋的大小，
也是一切的基礎，
ChatGPT就是一口1750億參數的巨型火鍋，
因為夠大，
所以能涮的食材也多。

這又涉及到了咱們的第二個維度，
訓練數據的規模，
就是咱們涮火鍋的食材種類，
食材越多越豐富，
涮鍋的味道就越香，
這也就是為啥說
“訓練數據決定了模型的知識廣度和深度”。

第三是計算量，
也叫訓練模型的能源消耗，
計算量大不大，
就是在問你這鍋的火力大不大？
一般肯定是火力越強熟得越快，
但也有像DeepSeek這樣，
著名的550萬美元能耗的火鍋，
主打一個“智能控溫”，
能耗小，
湯也能熟。

最後一個叫上下文窗口，
它決定的是模型能同時處理的信息量，
這回咱得支個桌了，
上下文窗口越大，
就相當於你放火鍋的餐桌越大，
那能放的菜品肯定也越多，
模型一次能處理的信息也就越多。

總結起來就是，
大模型就是一鍋容量大、食材多、火力強、桌面寬的火鍋。
好了，
吃個火鍋獎勵一下自己吧。

更多精彩內容
請登陸
財華香港網 (https://www.finet.hk/)或
現代電視 (https://www.fintv.hk)

相關視頻

【杜蘭說AI】AI戰爭有多狠？

元宵節傍晚起月全食　天文台稱能否觀賞視乎雲量雨勢

香港貨運物流業協會稱中東及歐洲貨運物流鏈受影響料成本升三成

澳洲央行：若通脹預期出現失控風險本月或再加息

國際油價收市升逾6%　市場憂慮中東戰事持續影響原油供應

積金局：未來會繼續推動強積金減費

縱橫遊有兩團約20人正在迪拜　袁振寧：提醒團友盡量不要外出

新資本投資者計劃兩年近3200宗申請　料吸引約950億元投資

陳茂波：中東局勢對金融市場影響大　本港匯率穩定是優勢

地產代理：二手交投在農曆新年長假期後復甦

本港1月出口按年升幅加快至33.8%　進口升38.1%

印尼政府再度在香港發行點心債　同步發行歐元債券

快訊

更多

17:31: 【盈喜】時代天使(06699.HK)料年度淨利潤同比增加140%至200%
17:21: 中國人民銀行決定授權中國銀行股份有限公司科倫坡分行擔任斯里蘭卡人民幣清算行
17:12: 如祺出行(09680.HK)料年度股東應佔綜合虧損同比收窄不少於43.4%
17:01: 軒竹生物-Ｂ(02575.HK)軒悅寧第三個適應症上市申請獲國家藥監局批准
16:48: 巨濤海洋石油服務(03303.HK)料年度公司擁有人應佔溢利同比減少83.79%至67.58%
16:37: 香港金管局與澳門金管局簽署修訂諒解備忘錄以進一步加強合作
16:28: 香港2月樓宇買賣合約總值按年升119.7%
16:20: 【異動股】港股跌幅榜前十，倢冠控股(08606.HK)跌32.71%，金威醫療(08143.HK)跌28.57%
16:20: 【異動股】港股漲幅榜前十，中油燃氣(00603.HK)漲117.03%，百勤油服(02178.HK)漲71.23%
16:13: 愛麗家居(603221.SH)美國工廠及墨西哥工廠產能利用率持續爬坡均處於正常經營狀態

專欄

付饒說RWA

這里是連接現實資產與數字世界的思想陣地。付饒是RWA.ltd CEO，香港國際新經濟研究院執行董事...

有連雲

國内領先的智能金融信息引擎

: 余豐慧
: 邱震海
: 賈康
: 梁海明
海南大學「一帶一路」研究院院長 ,香港經濟學家、絲路智谷研究院院長。
: 楊德龍
: 傅健慈
中國人民大學法學博士 ,全國港澳研究會理事 ,英國皇家特許法律行政人員學院院士.
: 汪揚
BS ,MS ,PhD ,香港科技大學副校長（大學拓展） ,港股100強研究中心顧問
: 梅新育
商務部國際貿易經濟合作研究院研究員
: 許照中
六福金融主席兼行政總裁
: 施永青
中原集團主席兼總裁