AI在线 AI在线

国产AI高考数学实力比拼:夸克领先豆包、元宝

2025年高考刚落下帷幕,一场关于“AI能否解数学高考题”的实战测试同步上演。 在专业媒体的两轮测评中,夸克分别以145分和146分位列第一,超越豆包,成为国产AI数学能力的新标杆。 在公开测评中,参赛模型包括夸克、豆包、元宝以及ChatGPT,统一使用2025年全国一卷数学试题,全部关闭联网搜索,仅开启深度思考模式。

2025年高考刚落下帷幕,一场关于“AI能否解数学高考题”的实战测试同步上演。在专业媒体的两轮测评中,夸克分别以145分和146分位列第一,超越豆包,成为国产AI数学能力的新标杆。

1749814083992.png

在公开测评中,参赛模型包括夸克、豆包、元宝以及ChatGPT,统一使用2025年全国一卷数学试题,全部关闭联网搜索,仅开启深度思考模式。

在知名媒体蓝鲸财经的评测中,夸克以145分成功登顶。其中,在选择题、填空题方面,夸克的正确率高达93%,位居第一。在8道单项选择题中,所有AI产品都没有答对第六题,通过思维链发现,答错原因是为AI在识别图中的向量坐标和箭头方向时出现偏差。

1749814120544.jpg

而在“四木相对论”的评测中,夸克更是以146分,再次登顶。在答题速度上,夸克位列第一,豆包位列第二。以做解答题为例,夸克能在4分钟内完成一道题,其他产品的平均时间在6分钟左右。

1749814150596.jpg

支撑夸克解题能力的是“夸克学习灵知大模型”。该模型以通义千问为基础,依托百亿级学习资料库和后训练能力,尤其擅长解决理科类复杂问题,能为用户带来启发式学习的全新体验。

相关资讯

AI 搜索热潮背后:注定要逾越场景的门槛

在 2024 上半年并算不明朗的 AI 应用局势中,AI 搜索正成为新共识并迎来了一波热潮,短时间内涌现出了多个 AI 搜索产品。 其中,国外原生 AI 搜索工具 Perplexity AI 最新估值已经接近30 亿美元、GenSpark、You 均表现不俗;国内天工 AI 、秘塔搜索等也在打磨自身产品力。 AI 搜索不仅在产品形态上革新了传统搜索引擎的信息罗列模式以及备受诟病的竞价排名广告,还能解决聊天机器人信息滞后和幻觉问题,让传统搜索引擎的交互变得更加智能。
7/4/2024 6:11:00 PM
王悦

张雪峰直言:AI 能取代我最好!教育博主对未来充满信心

在6月24日的一场直播中,知名教育博主张雪峰针对 “是否担心被 AI 取代” 的提问,给出了出人意料的回答。 他表示:“能被取代最好!” 这一观点引发了观众的热议。 张雪峰认为,当前 AI 的发展速度确实让人惊叹,尤其是在高考志愿填报方面,如 “夸克” 等智能平台,已经能够生成专业的报考报告,并具备深度搜索功能,这些在几年前是难以想象的。
6/24/2025 9:00:41 AM
AI在线

豆包AI高考成绩达清北录取线!文科683分领跑国内外顶级模型

字节跳动Seed团队近日公布了2025高考全科测试的惊人结果:豆包Seed1.6-Thinking模型在高考中取得文科683分、理科648分的优异成绩,达到清华北大录取分数线,在国内外AI模型高考测试中表现抢眼。 此次测试采用全国新一卷和山东省自主命题试卷,豆包与谷歌Gemini2.5Pro、DeepSeek R1、OpenAI o3等5款国内外顶级AI模型同台竞技。 豆包文科成绩683分在参测模型中获得最高分,理科成绩648分仅次于谷歌Gemini2.5Pro的655分。
6/26/2025 11:00:48 AM
AI在线
  • 1