請輸入關鍵字：

熱門搜尋：

岚图汽车恩典生命科技盈喜科拓股份同仁堂医养香港医委会

OpenAI推出名為MLE-bench的新基準，用於評估AI代理開發機器學習解決方案的能力

PANews

日期： 2024年10月12日下午5:42

PANews 10月12日消息，據The Decoder報道，OpenAI推出了名為MLE-bench的新基準，旨在評估AI代理在機器學習解決方案開發中的表現。該基準涵蓋75項Kaggle競賽，重點評估當前機器學習開發的挑戰性任務，並將AI結果與人類表現進行比較。初步測試中，o1-preview模型與AIDE框架結合表現最佳，在16.9%的競賽中獲得銅牌，超過了Anthropic的Claude 3.5 Sonnet。通過增加嘗試次數，o1-preview的成功率翻倍至34.1%。OpenAI認為，MLE-bench有助於評估核心ML工程技能，盡管它並未涵蓋所有AI研究領域。

内容來源：PANews

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可，禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載，請發郵件至 content@finet.com.hk，獲得書面確認及授權後，方可轉載。

更多精彩内容，請點擊：財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

PANews

PANews是區塊鏈和Web3.0領域領先的智庫型信息平台，為行業用戶提供具有國際視野的前沿資訊與報告。PANews優質多元的内容以圖文、音頻、視頻等形式在全網多渠道覆蓋，包含推特、微博、抖音、視頻號等主流平台，旨在成為用戶的Web3信息官。PANews同時還是騰訊新聞的内容合作夥伴，内容被福佈斯、財新等媒體引用，獲得騰訊新聞、今日頭條、澎湃新聞等頒發的相關獎項。PANews的兩位聯合創始人均為福

上一篇新聞

OKX將上綫X(X empire)進行現貨交易，並為X提供上市前期貨

下一篇新聞

安全公司：Python軟件包索引中發現能竊取加密貨幣的惡意軟件

相關文章

10月12日: OKX將上綫X(X empire)進行現貨交易，並為X提供上市前期貨
10月12日: 律所Pomerantz對Coinbase Global提起集體訴訟
10月12日: Murad 4個月前以9.8萬美元購入的1025萬枚SPX已升值至789萬美元
10月12日: Upbit使韓國交易所開啓「鱿魚遊戲」？遭壟斷調查，佔數字銀行K Bank存款20%
10月12日: 鏈上風險投資平台Fission Labs完成160萬美元的Pre-Seed輪融資
10月12日: 數讀崛起中的Sui生態：交易筆數短時突破1億，DeFi激增的背後社交和遊戲才是底色？
10月12日: ApeCoin DAO社區擬解散四個非必要工作組的提案正在投票
10月12日: 某地址3小時前將59.56億枚PEPE兌換為754,943枚SPX
10月12日: 神魚借助Arkham找回舊合約地址滯留資金，感歎行業進步
10月12日: 上海人工智能生態基金正式發佈，基金規模100億元

視頻

【今日IPO】590亿电力龙头四方股份，冲刺港股上市

2026年6月18日下午4:33

【今日IPO】超购千倍！芯碁微装首日大涨74%

2026年6月26日下午5:53

【今日IPO】南酸枣糕第一股！齐云山食品过聆讯

2026年6月26日下午4:24

【今日IPO】超购2115倍！科拓股份首日暴涨191%

2026年6月26日下午5:54

【今日IPO】港股IPO热度高涨，多股排队登陆港交所

2026年6月16日下午5:33

快訊

17:32: 創聯控股(02371.HK)附屬與支付科技公司訂立合作備忘錄
17:21: 中國燃氣(00384.HK)年度股东應佔溢利同比降16.38%至27.19億港元末期息20港仙
17:17: 【盈喜】中國織材控股(03778.HK)料中期扭虧為盈
17:09: 本間高爾夫(06858.HK)年度扭虧為盈溢利約11.2億日圓
17:00: 國家外匯局：5月中國外匯市場總計成交23.14萬億元人民幣
16:55: 國家外匯局：5月貨物和服務貿易順差4644億元
16:47: 香港交易所：歡迎首隻追蹤香港交易所科技100指數的交易所買賣基金上市
16:40: 香港再度委任強制性公積金計劃管理局執行董事
16:30: 香港特區政府擬修例改革醫委會
16:25: 【異動股】港股跌幅榜前十，恩典生命科技(02112.HK)跌44.12%，潪澔發展控股(08423.HK)跌24.32%