請輸入關鍵字:

熱門搜尋:

首個AI高考全卷評測結果發佈:最高分303 數學全不及格

日期:2024年6月19日 下午4:19

6月19日,據《科創板日報》訊,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考「語數外」全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分為420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,為303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分。

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。

下載財華財經APP,把握投資先機
https://www.finet.com.cn/app

更多精彩内容,請點擊:
財華網(https://www.finet.hk/)
財華智庫網(https://www.finet.com.cn)
現代電視FINTV(https://www.fintv.hk)

相關文章

6月18日
霧凇資本在香港設立地區總部
6月14日
中汽協:5月新能源汽車銷量95.5萬輛 同比增長33.3%
6月14日
中汽協:5月汽車銷量241.7萬輛 同比增長1.5%
6月11日
中汽協:4月汽車零部件類產品出口金額87.6億美元
6月7日
台積電5月營收約2296.2億元新台幣 同比增加30.1%
6月6日
中國保險行業協會發佈《保險汽車風險測試規程》系列標準
6月5日
國產商用飛機完成首次加注可持續航空燃料(SAF)演示飛行
6月3日
AMD蘇姿豐:銳龍9000系列桌面處理器將於7月上市
5月31日
OpenCSG創大模型編程世界紀錄
5月30日
百度何俊傑:大模型不應該只向内卷算力、卷參數 更應該向外卷場景、卷問題

視頻

快訊

17:37
上交所發佈商業火箭企業適用科創板第五套上市標準審核指引
17:31
深交所推出2026年降費措施 預計降費超8億元
17:24
中國人民銀行發佈《銀行間外匯市場管理規定》
17:13
國家能源局:11月核發綠證2.58億個
17:05
國家外匯管理局:11月中國國際收支貨物和服務貿易進出口規模44183億元
17:03
四部門:探索創新開發專項為小微企業支付員工工資的金融產品
16:51
央行等四部門:探索設立融資擔保就業貢獻度指標
16:46
上海黃金交易所:做好2026年元旦期間市場風險控制工作
16:34
四部門:加大對首貸、首擔客戶的開拓力度,降低融資準入門檻
16:27
石頭科技(688169.SH)發行境外上市股份(H股)獲中國證監會備案