請輸入關鍵字:

熱門搜尋:

斯坦福HAI《2025年人工智能指數報告》精華

日期:2025年4月14日 下午4:25

作者:Stanford HAI(斯坦福人工智能研究院)

編譯:Felix,PANews

斯坦福 HAI 近期發佈了長達 456 頁的《2025 年人工智能指數報告》。以下是人工智能趨勢的一些關鍵要點:

1.人工智能變得比想象的要強大得多

在新的基準測試 MMMU、GPQA 和 SWE-bench 中,人工智能的表現大幅提升:得分分別提高了 18.8%、48.9% 和 67.3%。除了基準測試外,人工智能係統在生成高質量視頻方面取得重大進展,在某些情況下,大型語言模型(LLM)甚至在限時的編程任務中超越了人類。

注:

MMMU 是一個精心設計的新型基準,專為大學水平的多學科多模態理解和推理而設,旨在評估基礎模型在廣泛任務中的專家級多模態理解能力。

GPQA 是一個具有挑戰性的數據集,包含 448 道由不同領域專家編寫的高質量且難度極高的多項選擇題。在相應領域擁有或正在攻讀博士學位的專家,準確率僅為 65%,而技能高超的非專家驗證者盡管平均花費時間超過 30 分鐘且可不受限制地訪問網絡,準確率也只有 34%。

SWE-bench 是一個用於評估大型語言模型(LLM)在從 GitHub 收集的真實世界軟件問題上的表現的基準。

斯坦福HAI《2025年人工智能指數報告》精華

2.人工智能更高效、更易獲取且更經濟實惠

參數更少的小型人工智能模型的能力日益增強:在短短兩年内,參數數量減少了約 100 倍,但其在大規模多任務語言理解(MMLU)測試中的得分仍超過 60%。

開源模型與閉源模型之間的差距也在縮小,在某些基準測試中,性能差距從 8% 降至僅 1.7%。

斯坦福HAI《2025年人工智能指數報告》精華

此外,從 2022 年 11 月到 2024 年 10 月,達到 GPT-3.5 水平的係統的推理成本下降了 280 倍以上。在硬件層面,成本每年下降 30%,而能源效率每年提高 40%。

高級人工智能的門檻正在迅速降低。更不用說像 DeepSeek 這樣的稀疏模型的開發,在專家混合(MoE)的結構下,只有相關的參數會被激活以回答用戶的查詢,使整個事情更加高效。

的確,隨著規模更小但能力更強的 AI 模型不斷湧現,AI 模型訓練的要求降低了,成本效益高的分佈式訓練有望在未來十年成為主流。目前有一些頂尖項目正在基於不同的理論框架開展相關研究。

3.人工智能正日益融入日常生活

2023 年,美國食品藥品監督管理局(FDA)批準了 223 款人工智能輔助醫療設備,而 2015 年這一數字僅為 6 款。在道路上,自動駕駛汽車已不再是實驗品:美國最大的運營商之一 Waymo 每周提供超過 15 萬次自動駕駛服務,而百度的 Apollo Go 無人駕駛出租車車隊如今已在中國多個城市投入運營。

斯坦福HAI《2025年人工智能指數報告》精華

4.企業在人工智能領域的投資大幅增加,推動創紀錄的投資和應用

人工智能在商業中的應用也在加速:2024 年,78% 的組織正在使用人工智能,而前一年這一比例為 55%。與此同時,越來越多的研究證實,人工智能能夠提高生産力,並有助於縮小整個勞動力隊伍中的技能差距。

事實上,隨著人工智能導致客戶期望值呈指數級增長,現有解決方案會在一夜之間顯得過時,從而使現有企業失去適應的機會,産品市場匹配崩潰的情況會更頻繁地發生。

5.盡管全球對人工智能的樂觀情緒上升,但亞洲人對人工智能更為樂觀

在中國(83%)、印度尼西亞(80%)和泰國(77%)等國家,大多數人認為人工智能産品和服務利大於弊。相比之下,在加拿大(40%)、美國(39%)和荷蘭(36%)等地,樂觀情緒仍遠低於此。

不過,這種態度正在轉變:自 2022 年以來,一些此前持懷疑態度的國家的樂觀情緒顯著增長,包括德國(增長 10%)、法國(增長 10%)、加拿大(增長 8%)、英國(增長 8%)和美國(增長 4%)。

斯坦福HAI《2025年人工智能指數報告》精華

6.人工智能在科研中的影響力日益增強,已成為推動科學進步的重要驅動力

人工智能日益增長的重要性在重大科學獎項中有所體現:兩項諾貝爾獎分別授予了在深度學習(物理學)和將其應用於蛋白質折疊(化學)方面做出貢獻的研究,而圖靈獎則表彰了在強化學習方面的開創性貢獻。

顯然,人工智能正以指數級、出乎意料的速度飛速發展,這對大多數人來說意義非凡。因此,人工智能安全也變得越來越重要。雖然人工智能讓僞造變得更容易,但密碼學則讓僞造變得更加困難。期待著那些能夠利用區塊鏈的原生屬性(可驗證性和透明性)來構建這一領域實用解決方案的加密項目。

相關閱讀:專訪a16z創始人Chris Dixon:人工智能與加密技術的交匯

内容來源:PANews

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。

下載財華財經APP,把握投資先機
https://www.finet.com.cn/app

更多精彩内容,請點擊:
財華網(https://www.finet.hk/)
財華智庫網(https://www.finet.com.cn)
現代電視FINTV(https://www.fintv.hk)

PANews

PANews是區塊鏈和Web3.0領域領先的智庫型信息平台,為行業用戶提供具有國際視野的前沿資訊與報告。PANews優質多元的内容以圖文、音頻、視頻等形式在全網多渠道覆蓋,包含推特、微博、抖音、視頻號等主流平台,旨在成為用戶的Web3信息官。PANews同時還是騰訊新聞的内容合作夥伴,内容被福佈斯、財新等媒體引用,獲得騰訊新聞、今日頭條、澎湃新聞等頒發的相關獎項。PANews的兩位聯合創始人均為福

相關文章

4月14日
Deribit上BTC 10萬美元看漲期權佔超75%期權活動,7萬美元看跌次之
4月14日
Arete Capital合夥人:除非中美關係嚴重升級,否則BTC已於7.4萬美元觸底
4月14日
Aergo官網因DDoS攻擊暫時無法訪問
4月14日
Odin.fun開發者Bob Bodily清倉其在該平台上所有資産,係被盜所致
4月14日
佛羅裡達州現僞造McAfee彈窗的新型詐騙,通過劫持電腦騙取比特幣與金條
4月14日
Eric Trump:BTC是最有價值的存儲手段之一
4月14日
FalconX熱錢包近6個小時向CEX轉移約3300萬枚OM,價值約2073萬美元
4月14日
火幣HTX將於今晚8點聯合首發上綫KERNEL (KernelDao),同步新增KERNEL/USDT (10X) 逐倉槓桿交易
4月14日
Ai&Meme日報,一圖了解過去24小時熱門Ai&Meme(2025.4.11)
4月14日
行情:MANA日内漲幅4.89%,OM日内跌幅85.20%

視頻

快訊

20:03
海南封關落地!板塊投資機遇幾何?
19:46
機器人板塊集體走強,人形機器人從「炫技」邁向「上崗」
17:34
國家網信辦會同中國證監會深入整治涉資本市場網上虛假不實信息
17:28
碩奧國際(02336.HK):馮櫓銘獲任董事會主席
17:19
復宏漢霖(02696.HK)HLX18治療多種實體瘤的1期臨床試驗申請獲美FDA批准
17:11
國家外匯局:11月銀行結匯2095億美元 售匯1938億美元
17:04
中國白銀集團(00815.HK)認購協議已部分完成
16:50
美高梅中國(02282.HK):馮小峰獲任首席執行官
16:39
超大現代(00682.HK)完成配售3295萬股 淨籌約719萬港元
16:32
香港10月批出六份建築圖則