請輸入關鍵字:

熱門搜尋:

首個AI高考全卷評測結果發佈:最高分303 數學全不及格

日期: 2024年6月19日 下午4:19

6月19日,據《科創板日報》訊,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考「語數外」全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分為420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,為303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分。

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。

下載APP 下載財華財經APP,把握投資先機
更多精彩内容,請點擊: 財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

視頻

快訊

17:33
​香港2月底官方外匯儲備資產為4392億美元
17:27
【盈喜】大禹金融(01073.HK)料年度稅後淨溢利增加至3700萬港元
17:22
【盈喜】徽商銀行(03698.HK)料2025年淨利潤169.3億元 同比增長6.3%
17:15
保利置業集團(00119.HK)2月合同銷售金額約22億元
17:09
迅策(03317.HK)預期2025年虧損約1.3億元
16:54
維立志博-B(09887.HK):利信™於一線食管鱗狀細胞癌II期試驗的首例患者入組
16:48
​滴普科技(01384.HK)預計2025年淨虧損同比收窄23%以上
16:35
江山控股(00295.HK)前2個月總發電量約3.48萬兆瓦時
16:29
上期所:鉛期貨合約交割品級中替代品對標準品貼水150元/噸
16:25
明星電力:正在規劃自身的算力基礎資源建設