請輸入關鍵字:

熱門搜尋:

首個AI高考全卷評測結果發佈:最高分303 數學全不及格

日期:2024年6月19日 下午4:19

6月19日,據《科創板日報》訊,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考「語數外」全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分為420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,為303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分。

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。

更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
財華智庫網(https://www.finet.com.cn)

現代電視 (https://www.fintv.hk)

相關文章

6月18日
霧凇資本在香港設立地區總部
6月14日
中汽協:5月新能源汽車銷量95.5萬輛 同比增長33.3%
6月14日
中汽協:5月汽車銷量241.7萬輛 同比增長1.5%
6月11日
中汽協:4月汽車零部件類產品出口金額87.6億美元
6月7日
台積電5月營收約2296.2億元新台幣 同比增加30.1%
6月6日
中國保險行業協會發佈《保險汽車風險測試規程》系列標準
6月5日
國產商用飛機完成首次加注可持續航空燃料(SAF)演示飛行
6月3日
AMD蘇姿豐:銳龍9000系列桌面處理器將於7月上市
5月31日
OpenCSG創大模型編程世界紀錄
5月30日
百度何俊傑:大模型不應該只向内卷算力、卷參數 更應該向外卷場景、卷問題

視頻

快訊

17:38
金融監管總局:三季度末中國銀行業金融機構本外幣資產總額474.3萬億元 同比增長7.9%
17:35
軒竹生物-B(02575.HK)建議實施H股全流通
17:29
香港金管局:10月外匯基金境外資產增加500億港元至35091億港元
17:22
香港證監會:梁鳳儀獲再度委任為行政總裁
17:18
央行:11月17日將開展8000億元買斷式逆回購操作
17:12
復宏漢霖(02696.HK)POHERDY(帕妥珠單抗)的生物製品許可申請獲美国FDA批准
17:03
派格生物醫藥-B(02565.HK)核心產品PB-119新藥上市申請獲中國國家藥監局批准
16:54
合生創展集團(00754.HK)前10個月總合約銷售金額約131.65億元
16:41
硬蛋創新(00400.HK)第三季度經營溢利按年增長34.7%
16:32
香港特區入境事務處:明日起尼泊爾國民可免簽證過境