AI在线 AI在线

国产AI高考数学实力比拼:夸克领先豆包、元宝

2025年高考刚落下帷幕,一场关于“AI能否解数学高考题”的实战测试同步上演。 在专业媒体的两轮测评中,夸克分别以145分和146分位列第一,超越豆包,成为国产AI数学能力的新标杆。 在公开测评中,参赛模型包括夸克、豆包、元宝以及ChatGPT,统一使用2025年全国一卷数学试题,全部关闭联网搜索,仅开启深度思考模式。

2025年高考刚落下帷幕,一场关于“AI能否解数学高考题”的实战测试同步上演。在专业媒体的两轮测评中,夸克分别以145分和146分位列第一,超越豆包,成为国产AI数学能力的新标杆。

1749814083992.png

在公开测评中,参赛模型包括夸克、豆包、元宝以及ChatGPT,统一使用2025年全国一卷数学试题,全部关闭联网搜索,仅开启深度思考模式。

在知名媒体蓝鲸财经的评测中,夸克以145分成功登顶。其中,在选择题、填空题方面,夸克的正确率高达93%,位居第一。在8道单项选择题中,所有AI产品都没有答对第六题,通过思维链发现,答错原因是为AI在识别图中的向量坐标和箭头方向时出现偏差。

1749814120544.jpg

而在“四木相对论”的评测中,夸克更是以146分,再次登顶。在答题速度上,夸克位列第一,豆包位列第二。以做解答题为例,夸克能在4分钟内完成一道题,其他产品的平均时间在6分钟左右。

1749814150596.jpg

支撑夸克解题能力的是“夸克学习灵知大模型”。该模型以通义千问为基础,依托百亿级学习资料库和后训练能力,尤其擅长解决理科类复杂问题,能为用户带来启发式学习的全新体验。

相关资讯

AI 搜索热潮背后:注定要逾越场景的门槛

在 2024 上半年并算不明朗的 AI 应用局势中,AI 搜索正成为新共识并迎来了一波热潮,短时间内涌现出了多个 AI 搜索产品。 其中,国外原生 AI 搜索工具 Perplexity AI 最新估值已经接近30 亿美元、GenSpark、You 均表现不俗;国内天工 AI 、秘塔搜索等也在打磨自身产品力。 AI 搜索不仅在产品形态上革新了传统搜索引擎的信息罗列模式以及备受诟病的竞价排名广告,还能解决聊天机器人信息滞后和幻觉问题,让传统搜索引擎的交互变得更加智能。
7/4/2024 6:11:00 PM
王悦

Adobe AI代理再扩军:新增产品支持与全球上线数据洞察代理

Adobe持续推进其AI代理生态扩展,正式发布“产品支持代理”,旨在简化Adobe Experience Platform中的故障排除流程,并优化客户体验管理。 同时,Adobe宣布其“数据洞察代理”现已在全球范围内上线。 新发布的“产品支持代理”由Adobe Experience Platform Agent Orchestrator提供技术支持,能够在AI Assistant的对话界面中,为用户提供即时的操作指导和支持案例创建流程。
6/6/2025 11:00:55 AM
AI在线

OpenAI 升级 ChatGPT 语音模式,体验更自然对话

OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。 这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。 在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。
6/9/2025 11:00:56 AM
AI在线
  • 1