请输入关键字:

热门搜寻:

【杜兰说AI】GPT-4.5三大关键词 贵!小强!情商!

2025年3月19日 下午14:20

GPT-4.5刚发布的时候,
我就觉得得让子弹再飞一会儿,
结果就过了一个周末,
各种声音全都出来了。

我个人差不多就三个感觉哈。
第一,
知道你openai贵,
但也不能这麽离谱啊?
输入价格75刀,
输出价格150刀,
比DeepSeek贵了快300倍。
如此恐怖的成本提升下,
GPT-4.5的性能怎麽样呢?

这就是我的第二个感受,
确实变强了,但只有一点点。
官方给出的基准测试里,
GPT-4.5是碾压GPT-4o的,
在最新的一项编码测试里,
也超越了DeepSeek-R1丶o1丶GPT-4o等模型,
但在一些比较困难的学术基准测试上,
就不太够看了,
在某些偏实用的评估基准上,
甚至是全班垫底。

不过OpenAI官方这次也特意强调,
说GPT-4.5的真正厉害之处,
在於它能够更好地理解人类的意思,
并以更细致入微的“情商”来解读微妙的暗示或隐含的期望。
用奥特曼的话来说,
就是你会感觉在和一个“有思想的人”说话。
因为GPT-4.5现在只向Pro用户开放,
我没买它的会员,
所以只看了一些用户PO到网上的图。
对此我的第三个感觉是,
看起来确实有人情味儿了些,
会先安慰你,
给你情绪价值,
而不是直接给一堆解决方案。
但这就能证明它比别家更强吗?
很难说。
更何况它收费还那麽贵,
颇有一种要算法有情商丶
要推理有情商丶
要应用还是只有情商的感觉。

最後再给大家展开一下啊,
这次的GPT-4.5还有一个意义,
它很有可能是OpenAI的最後一代非推理模型。
什麽意思呢?
现在业界大模型架构是“重推理”的,
也就是基於传统的语言模型,
通过思维链丶自我验证等多步中间推理生成答案,
擅长编程丶学术写作以及分析覆杂问题,
典型代表就是DeepSeek-R1和GPT-o1。
与之相对的就是非推理大模型,
主要依赖预训练阶段的高质量参数进行学习,
逻辑推理能力稍弱,
更侧重於流畅的语言生成和上下文理解,
代表是GPT-o3-mini。

这几天推理模型阵营的DeepSeek
刚刚把自己压箱底的宝贝都拿了出来,
搞得全球的开发者都一片沸腾,
这边非推理模型GPT-4.5的风评,
大家又都有目共睹,
所以我估计,
以後大部分AI的方向,
可能都将会彻底转向推理。

更多精彩内容
请登陆
财华香港网(https://www.finet.hk/)或
现代电视(https://www.fintv.hk)

相關視頻

快讯

10:54
科技股普涨!百度集团续升8%,旗下昆仑芯申请上市
17:36
上交所公开募集不动产投资信托基金(REITs)业务办法(试行)
17:29
央行印发《非银行支付机构分类评级管理办法》
17:18
中国证监会印发《中国证监会关于推出商业不动产投资信托基金试点的公告》
17:13
国家外汇局:三季度中国经常账户顺差14165亿元 资本和金融账户逆差17144亿元
17:03
香港金管局:截至11月30日外汇基金总资产41069亿港元
16:56
2024年全国体育产业总规模38421亿元
16:45
香港金管局:11月份新批出按揭贷款额较环比减少7%至291亿港元
16:32
香港金管局:11月份港元货币供应量M2及M3同比均上升4.5%
16:29
交银国际(03329.HK):谭岳衡辞任执行董事

付饶说RWA

这里是连接现实资产与数字世界的思想阵地。 付饶是RWA.ltd CEO,香港国际新经济研究院执行董事...

长桥証券

投资的本质是认知的变现,研究的意义是认知的提升!...

有连云

国内领先的智能金融信息引擎

PANews

PANews是区块链和Web3.0领域领先的智库型信息平台,为行业用户提供具有国际视野的前沿资讯与报...