请输入关键字:

热门搜寻:

【杜兰说AI】大模型的“大”到底是啥?

2025年5月9日 上午10:10

大模型的“大”到底是啥?
一共四个维度,
第一,
参数规模,
就像是你吃火锅时锅的大小,
也是一切的基础,
ChatGPT就是一口1750亿参数的巨型火锅,
因为够大,
所以能涮的食材也多。

这又涉及到了咱们的第二个维度,
训练数据的规模,
就是咱们涮火锅的食材种类,
食材越多越丰富,
涮锅的味道就越香,
这也就是为啥说
“训练数据决定了模型的知识广度和深度”。

第三是计算量,
也叫训练模型的能源消耗,
计算量大不大,
就是在问你这锅的火力大不大?
一般肯定是火力越强熟得越快,
但也有像DeepSeek这样,
着名的550万美元能耗的火锅,
主打一个“智能控温”,
能耗小,
汤也能熟。

最後一个叫上下文窗口,
它决定的是模型能同时处理的信息量,
这回咱得支个桌了,
上下文窗口越大,
就相当於你放火锅的餐桌越大,
那能放的菜品肯定也越多,
模型一次能处理的信息也就越多。

总结起来就是,
大模型就是一锅容量大丶食材多丶火力强丶桌面宽的火锅。
好了,
吃个火锅奖励一下自己吧。

更多精彩内容
请登陆
财华香港网(https://www.finet.hk/)或
现代电视(https://www.fintv.hk)

相關視頻

快讯

17:36
远大医药(00512.HK)治疗严重过敏反应的肾上腺素鼻喷雾剂获颁发药品注册证书
17:31
中国海洋石油(00883.HK):陈泽铭辞任独立非执行董事
17:24
京东物流(02618.HK):Laura J.Peterson获任独立非执行董事
17:18
讯飞医疗科技(02506.HK)获八位股东自愿延长禁售期
17:06
和黄医药(00013.HK)凡瑞格拉替尼二线治疗肝内胆管癌中国新药上市申请获受理并获纳入优先审评
16:53
疯狂体育(00082.HK):周京平离任独立非执行董事
16:46
国务院关税税则委员会:自2026年1月1日起调整部分商品关税税率税目
16:35
IFBH(06603.HK)拟回购不超已发行股本总额5%的股份
16:25
香港发展局:成立产业园公司 提速北都产业发展
16:20
【异动股】港股跌幅榜前十,PACIFIC LEGEND(08547.HK)跌42.35%,威扬酒业控股(08509.HK)跌27.27%

付饶说RWA

这里是连接现实资产与数字世界的思想阵地。 付饶是RWA.ltd CEO,香港国际新经济研究院执行董事...

有连云

国内领先的智能金融信息引擎

长桥証券

投资的本质是认知的变现,研究的意义是认知的提升!...

PANews

PANews是区块链和Web3.0领域领先的智库型信息平台,为行业用户提供具有国际视野的前沿资讯与报...