請輸入關鍵字:

熱門搜尋:

【杜蘭說AI】GPT-4.5三大關鍵詞 貴!小強!情商!

2025年3月19日 下午14:20

GPT-4.5剛發布的時候,
我就覺得得讓子彈再飛一會兒,
結果就過了一個周末,
各種聲音全都出來了。

我個人差不多就三個感覺哈。
第一,
知道你openai貴,
但也不能這麽離譜啊?
輸入價格75刀,
輸出價格150刀,
比DeepSeek貴了快300倍。
如此恐怖的成本提升下,
GPT-4.5的性能怎麽樣呢?

這就是我的第二個感受,
確實變強了,但只有一點點。
官方給出的基準測試里,
GPT-4.5是碾壓GPT-4o的,
在最新的一項編碼測試里,
也超越了DeepSeek-R1、o1、GPT-4o等模型,
但在一些比較困難的學術基準測試上,
就不太夠看了,
在某些偏實用的評估基準上,
甚至是全班墊底。

不過OpenAI官方這次也特意強調,
說GPT-4.5的真正厲害之處,
在於它能夠更好地理解人類的意思,
並以更細致入微的“情商”來解讀微妙的暗示或隱含的期望。
用奧特曼的話來說,
就是你會感覺在和一個“有思想的人”說話。
因為GPT-4.5現在只向Pro用戶開放,
我沒買它的會員,
所以只看了一些用戶PO到網上的圖。
對此我的第三個感覺是,
看起來確實有人情味兒了些,
會先安慰你,
給你情緒價值,
而不是直接給一堆解決方案。
但這就能證明它比別家更強嗎?
很難說。
更何況它收費還那麽貴,
頗有一種要算法有情商、
要推理有情商、
要應用還是只有情商的感覺。

最後再給大家展開一下啊,
這次的GPT-4.5還有一個意義,
它很有可能是OpenAI的最後一代非推理模型。
什麽意思呢?
現在業界大模型架構是“重推理”的,
也就是基於傳統的語言模型,
通過思維鏈、自我驗證等多步中間推理生成答案,
擅長編程、學術寫作以及分析覆雜問題,
典型代表就是DeepSeek-R1和GPT-o1。
與之相對的就是非推理大模型,
主要依賴預訓練階段的高質量參數進行學習,
邏輯推理能力稍弱,
更側重於流暢的語言生成和上下文理解,
代表是GPT-o3-mini。

這幾天推理模型陣營的DeepSeek
剛剛把自己壓箱底的寶貝都拿了出來,
搞得全球的開發者都一片沸騰,
這邊非推理模型GPT-4.5的風評,
大家又都有目共睹,
所以我估計,
以後大部分AI的方向,
可能都將會徹底轉向推理。

更多精彩內容
請登陸
財華香港網 (https://www.finet.hk/)或
現代電視 (https://www.fintv.hk)

相關視頻

快訊

17:39
中國證券業協會發佈《證券公司並表管理指引(試行)》
17:32
中國人民銀行副行長、國家外匯管理局局長朱鶴新訪問日本相關機構
17:30
國家新聞出版署等十部門印發《網絡出版科技創新引領計劃》
17:20
中國中冶:2025年將結合行業發展情況等因素 在綜合評估後進行減值計提
17:11
商務部:2025年1-3月全國吸收外資2692.3億元人民幣
17:10
創識科技(300941.SZ):目前沒有涉及跨境支付業務
16:51
國家發展改革委與柬埔寨有關部門簽署三份合作文件
16:47
金融監管總局:保險公司應當優化代理制保險銷售顧問的管理機制
16:33
國家發改委與馬來西亞有關部門簽署三份合作文件
16:21
有研新材:公司在固態電解質原材料方面有所佈局