請輸入關鍵字:

熱門搜尋:

首個AI高考全卷評測結果發佈:最高分303 數學全不及格

日期:2024年6月19日 下午4:19

6月19日,據《科創板日報》訊,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考「語數外」全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分為420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,為303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分。

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。

更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
財華智庫網(https://www.finet.com.cn)

現代電視 (https://www.fintv.hk)

相關文章

6月18日
霧凇資本在香港設立地區總部
6月14日
中汽協:5月新能源汽車銷量95.5萬輛 同比增長33.3%
6月14日
中汽協:5月汽車銷量241.7萬輛 同比增長1.5%
6月11日
中汽協:4月汽車零部件類產品出口金額87.6億美元
6月7日
台積電5月營收約2296.2億元新台幣 同比增加30.1%
6月6日
中國保險行業協會發佈《保險汽車風險測試規程》系列標準
6月5日
國產商用飛機完成首次加注可持續航空燃料(SAF)演示飛行
6月3日
AMD蘇姿豐:銳龍9000系列桌面處理器將於7月上市
5月31日
OpenCSG創大模型編程世界紀錄
5月30日
百度何俊傑:大模型不應該只向内卷算力、卷參數 更應該向外卷場景、卷問題

視頻

快訊

17:35
香港金管局:6月底綜合利率為1.26厘
17:31
信和置業(00083.HK):廖懿妮獲任執行董事
17:18
【盈喜】華寶國際(00336.HK)料中期稅前利潤同比上升約91.3%至124.3%
17:02
長城汽車(02333.HK)上半年歸屬股東淨利潤同比減少10.22%
16:44
工信部:移動用戶上網流量連續6個月實現兩位數增長
16:38
【大行報告】畢馬威:香港資產及財富管理業務持續增長 稅改與虛擬資產監管將吸引全球資管公司
16:17
深交所發佈關於試點公司債券續發行和資產支持證券擴募業務有關事項的通知
16:12
工信部:以5G、人工智能大模型等為代表的數字技術迅速發展
15:54
工信部:會同相關部門印發實施紡織、輕工、食品、醫藥等行業數字化轉型方案
15:45
工信部:近期將印發機械、汽車、電力裝備等行業穩增長工作方案