请输入关键字:

热门搜寻:

首个AI高考全卷评测结果发布:最高分303 数学全不及格

日期:2024年6月19日 下午4:19

6月19日,据《科创板日报》讯,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有75分。

财华网所刊载内容之知识产权为财华网及相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至content@finet.com.hk,获得书面确认及授权后,方可转载。

下载财华财经APP,把握投资先机
https://www.finet.com.cn/app

更多精彩内容,请点击:
财华网(https://www.finet.hk/)
财华智库网(https://www.finet.com.cn)
现代电视FINTV(http://www.fintv.hk)

相關文章

6月18日
雾凇资本在香港设立地区总部
6月14日
中汽协:5月新能源汽车销量95.5万辆 同比增长33.3%
6月14日
中汽协:5月汽车销量241.7万辆 同比增长1.5%
6月11日
中汽协:4月汽车零部件类产品出口金额87.6亿美元
6月7日
台积电5月营收约2296.2亿元新台币 同比增加30.1%
6月6日
中国保险行业协会发布《保险汽车风险测试规程》系列标准
6月5日
国产商用飞机完成首次加注可持续航空燃料(SAF)演示飞行
6月3日
AMD苏姿丰:锐龙9000系列桌面处理器将于7月上市
5月31日
OpenCSG创大模型编程世界纪录
5月30日
百度何俊杰:大模型不应该只向内卷算力、卷参数 更应该向外卷场景、卷问题

视频

快讯

17:32
圣龙股份:公司机器人关节驱动系统等新兴领域已进行前瞻性布局
17:25
强生旗下创新治疗药物埃万妥单抗注射液在华获批
17:18
大商所发布2026年元旦交易时间安排
17:07
圣龙股份:与福耀玻璃有相关合作
16:55
隆基绿能与欧洲光伏储能工程承包商Solarpro签订合作
16:46
中国华电新能源装机突破1亿千瓦
16:36
大商所发布2026年元旦节假期调整相关品种期货合约涨跌停板幅度通知
16:31
东方日升:目前公司异质结电池平均量产效率突破26.3%
16:26
新开普:目前没有集成电路芯片的生产制造业务
16:22
国家烟草局:防范化解电子烟过剩产能风险 逐步淘汰落后产线并核减相应产能