大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

豆包大模型高考评测达到清华北大录取线

ITBEAR科技资讯 2025-06-26

日前,字节跳动Seed团队公布2025高考全科测试结果。该测试采用全国新一卷和山东省自主命题,豆包Seed1.6-Thinking模型的文科和理科成绩分别达到683分和648分。在同期测试的国内外5款顶级模型中,豆包文科成绩获最高分,理科仅次于谷歌Gemini 2.5 Pro,后者成绩为655分。

测试结果显示,豆包的语文、英语、物理、历史、地理、政治六门学科获最高分,数学成绩也超过140分;DeepSeek R1获得数学最高分145分;Gemini 2.5 Pro以82分获得化学最高分,并与OpenAI o3一起获得生物最高分,成绩为77分。

Seed团队表示,首次测试时使用的网络版考卷清晰度较低,各大模型在化学、生物两门非常依赖图像的考试中丢分较多。该团队在获得更高清版本的高考试题图片后,采用图文交织的方式对化学和生物重新进行测试,发现豆包模型在这两科上能够提升近30分,理科总成绩可达到676分,验证了全模态推理可以更大程度激发模型的潜力。

据悉,山东省高考为“3+3”形式,语数英为基础学科,自选三门科目采用等级分数转换成绩。据山东当地资深高中老师分析,豆包赋分成绩组合,最高可达690分左右,参照2025年山东地区一分一段表,排名约在前80位,有望考上清华、北大等顶尖学府。


问界M8单周销量破5000,BBA大败局来了
问界M8单周销量达5122台,BBA正在遭受痛击,大溃败的时候来了。

2025-06-19

某车又下地道了,大马力后驱车到底怎么开?
文 | AUTO芯球作者 | 雷慢好家伙!绿化带战神的名号已经满足不了某车的车主们了,这不,刚又有车开始下地道了,这是又想混一个“地道战神”的名号吗?可是,问题来了,你们发现没,开这车的精神小伙们,为什么那么多飙车失控和摆尾失控的例子?狂飙失控还好理

2025-06-19