AI大模型高考评测：语英成绩优异，数学全军覆没

2024-06-21 12:19:30

　　据新浪科技报道，上海人工智能实验室旗下的司南评测体系OpenCompass对七个大型语言模型进行了高考“语数外”全卷能力测试，并发布了首个大模型高考全卷评测结果。

　　此次测试的语文、数学和英语三科总分为420分。测试结果显示，阿里巴巴的通义千问2-72B以303分的成绩排名第一，OpenAI的GPT-4以296分紧随其后，位居第二。上海人工智能实验室的书生浦语2.0排名第三。这三个大模型的得分率均超过70%。法国初创公司Mistral的大模型排名末尾。

AI大模型高考评测：语英成绩优异，数学全军覆没

　　从测试结果来看，大模型在语文和英语考试中的表现普遍较好，但在数学科目上表现欠佳，最高分仅为75分，全部未能及格。

AI大模型高考评测：语英成绩优异，数学全军覆没

标签高考全军覆没优异模型评测

上一篇：“霸凌式教育”赵菊英账号被封，网友拍手称快
下一篇：高颜值电动车4天内3次被盗，价值3万元

小米推出REDMI A系列电视节能版

小米公司正式推出了REDMI A系列电视节能版，此系列电视...[详细]

NVIDIA新一代RTX PRO专业显卡细节

贾跃亭回应“下周回国”梗：FF成功为

酒店机器人行业面临挑战，云迹科技净

NVIDIA RTX 5060移动版显卡性能曝

TP-Link面临美国政府调查，或因掠夺

小米华为领跑，REDMI Turbo 4 Pro成

索尼或推进半导体业务分拆上市

保时捷或将在两到三年内停止在中国

独家专栏

小米推出REDMI A系列电视节能版

NVIDIA新一代RTX PRO专业显卡细节

精彩推荐

热门排行

热门标签

极品飞车

延期

发售

新作

镜头

曝光

土耳其

低价

预购

羊毛

开启

沃茨

封禁

喷射

战士

公平

确保

竞技

我就

婚姻生活

转眼

感谢

神话

爱情

地平线

战神

更像

尘封

奇幻

大陆