請輸入關鍵字:

熱門搜尋:

OpenAI推出名為MLE-bench的新基準,用於評估AI代理開發機器學習解決方案的能力

日期:2024年10月12日 下午5:42

PANews 10月12日消息,據The Decoder報道,OpenAI推出了名為MLE-bench的新基準,旨在評估AI代理在機器學習解決方案開發中的表現。該基準涵蓋75項Kaggle競賽,重點評估當前機器學習開發的挑戰性任務,並將AI結果與人類表現進行比較。初步測試中,o1-preview模型與AIDE框架結合表現最佳,在16.9%的競賽中獲得銅牌,超過了Anthropic的Claude 3.5 Sonnet。通過增加嘗試次數,o1-preview的成功率翻倍至34.1%。OpenAI認為,MLE-bench有助於評估核心ML工程技能,盡管它並未涵蓋所有AI研究領域。

内容來源:PANews

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。

下載財華財經APP,把握投資先機
https://www.finet.com.cn/app

更多精彩内容,請點擊:
財華網(https://www.finet.hk/)
財華智庫網(https://www.finet.com.cn)
現代電視FINTV(https://www.fintv.hk)

相關文章

10月12日
OKX將上綫X(X empire)進行現貨交易,並為X提供上市前期貨
10月12日
律所Pomerantz對Coinbase Global提起集體訴訟
10月12日
Murad 4個月前以9.8萬美元購入的1025萬枚SPX已升值至789萬美元
10月12日
Upbit使韓國交易所開啓「鱿魚遊戲」?遭壟斷調查,佔數字銀行K Bank存款20%
10月12日
鏈上風險投資平台Fission Labs完成160萬美元的Pre-Seed輪融資
10月12日
數讀崛起中的Sui生態:交易筆數短時突破1億,DeFi激增的背後社交和遊戲才是底色?
10月12日
ApeCoin DAO社區擬解散四個非必要工作組的提案正在投票
10月12日
某地址3小時前將59.56億枚PEPE兌換為754,943枚SPX
10月12日
神魚借助Arkham找回舊合約地址滯留資金,感歎行業進步
10月12日
上海人工智能生態基金正式發佈,基金規模100億元

視頻

快訊

19:38
「降價」信號強化!紙業股集體下滑,玖龍紙業跌超8%
19:32
天瑞汽車内飾大跌逾41%,股價上演「過山車」
17:32
威勝控股(03393.HK)附屬中標巴西CPFL項目 合同金額超8000萬元
17:21
渤海銀行(09668.HK):聘任謝凱擔任首席信息官
17:19
國務院辦公廳發佈《關於全鏈條打擊涉煙違法活動的意見》
17:11
海天味業(603288.SH)未來三年每年現金分紅比例不低於80%
17:01
和嘉控股(00704.HK)要求上市覆核委員會覆核上市委員會的決定
16:51
環球醫療(02666.HK):馬萬銘獲任非執行董事
16:45
中國光大控股(00165.HK):蘇揚獲任執行董事兼副總裁
16:41
【港股收評】三大指數漲跌不一!紙業股領跌,航空股現5連漲