【ITBEAR科技资讯】6月25日消息,近日,随着各省2024年高考成绩陆续揭晓,学霸们的成绩成为热议焦点。与此同时,一场别开生面的“AI高考”也吸引了广泛关注。据悉,有媒体组织了一场AI大模型的高考模拟测试,旨在评估这些模型在解答高考试题时的表现。
最新发布的高考新课标Ⅰ卷大模型评测报告显示,GPT-4o在文科总分中拔得头筹,获得了562分的高分。而在国内产品中,字节跳动旗下的豆包紧随其后,取得了542.5分的优异成绩。据ITBEAR科技资讯了解,本次大模型高考评测完全采用河南省的高考试卷,河南高考文科本科一批录取分数线为521分,豆包等三款国产AI成功突破一本线,展现了出色的能力。
在文科领域,特别是语文和英语考试中,AI大模型展现出了与人类考生相媲美的水平。国产大模型凭借对中文语言的深入理解,在语文考试中表现出色,百小应、字节豆包和腾讯元宝等模型在语文考试中名列前茅。而在英语考试中,大模型在阅读、语言运用等客观题方面取得了较高的分数,甚至有的模型获得了满分。然而,在写作部分,AI大模型的表现尚待提高,最高分仅为29分。
然而,在理科方面,AI大模型的表现则显得较为薄弱。大模型的理科最高分尚未达到480分,多数模型的理科总分在400分以下。特别是在数学、化学和物理等科目中,AI大模型的表现与人类顶尖考生存在较大差距。数学考试中,仅有GPT-4o、文心一言4.0和豆包等少数模型获得了60分以上的成绩。化学和物理的平均分数更是低至34分和39分,显示出AI大模型在理科领域的不足。
这场“AI高考”不仅为我们展示了AI大模型在高考模拟测试中的表现,也揭示了AI在教育领域的应用潜力和挑战。随着技术的不断进步,AI在教育领域的应用将更加广泛,为人类的教育事业带来更多可能性。