大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

豆包大模型高考评测达到清华北大录取线

ITBEAR科技资讯 2025-06-26

日前,字节跳动Seed团队公布2025高考全科测试结果。该测试采用全国新一卷和山东省自主命题,豆包Seed1.6-Thinking模型的文科和理科成绩分别达到683分和648分。在同期测试的国内外5款顶级模型中,豆包文科成绩获最高分,理科仅次于谷歌Gemini 2.5 Pro,后者成绩为655分。

测试结果显示,豆包的语文、英语、物理、历史、地理、政治六门学科获最高分,数学成绩也超过140分;DeepSeek R1获得数学最高分145分;Gemini 2.5 Pro以82分获得化学最高分,并与OpenAI o3一起获得生物最高分,成绩为77分。

Seed团队表示,首次测试时使用的网络版考卷清晰度较低,各大模型在化学、生物两门非常依赖图像的考试中丢分较多。该团队在获得更高清版本的高考试题图片后,采用图文交织的方式对化学和生物重新进行测试,发现豆包模型在这两科上能够提升近30分,理科总成绩可达到676分,验证了全模态推理可以更大程度激发模型的潜力。

据悉,山东省高考为“3+3”形式,语数英为基础学科,自选三门科目采用等级分数转换成绩。据山东当地资深高中老师分析,豆包赋分成绩组合,最高可达690分左右,参照2025年山东地区一分一段表,排名约在前80位,有望考上清华、北大等顶尖学府。


官宣!陈都灵代言零跑A10,全球上市发布会加速提档至3月26日
3月10日,社交媒体一条“#都灵跑了#”的话题引发网友热议,纷纷猜测“都灵为什么跑了?跑去哪?”。3月13日答案揭晓:零跑汽车发布代言人海报,正式官宣演员陈都灵成为零跑A10代言人,一语双关零跑A10怎么开都灵。与此同时,在代言人热度与本周大量媒体试驾口

2026-03-13

双冠加冕,价值领航!问界M9持续引领豪华SUV价值标杆
近日,中国汽车流通协会发布了《2026年2月中国汽车保值率报告》,问界M9一举荣获2026年2月国产增程混动及纯电动车型保值率双榜第一,其中增程车型实现连续七个月蝉联榜首,纯电车型连续三个月稳坐冠军宝座,持续引领豪华SUV价值标杆。双榜加冕,技术实力构筑

2026-03-12

能打败宁王的只有宁王,宁德时代日赚近2亿强的可怕!
“我们在给宁德时代打工。”几年前一位车企老总的话,如今听起来更像一句预言。2025年,动力电池巨头宁德时代交出了一份让整个制造业都沉默的成绩单:全年营收4237.02亿元,净利润722.01亿元,相当于每天净赚近2亿元。这个数字不仅刷新了自身历史纪录,还超过

2026-03-12