AI在线 AI在线

国产AI高考数学实力比拼:夸克领先豆包、元宝

2025年高考刚落下帷幕,一场关于“AI能否解数学高考题”的实战测试同步上演。 在专业媒体的两轮测评中,夸克分别以145分和146分位列第一,超越豆包,成为国产AI数学能力的新标杆。 在公开测评中,参赛模型包括夸克、豆包、元宝以及ChatGPT,统一使用2025年全国一卷数学试题,全部关闭联网搜索,仅开启深度思考模式。

2025年高考刚落下帷幕,一场关于“AI能否解数学高考题”的实战测试同步上演。在专业媒体的两轮测评中,夸克分别以145分和146分位列第一,超越豆包,成为国产AI数学能力的新标杆。

1749814083992.png

在公开测评中,参赛模型包括夸克、豆包、元宝以及ChatGPT,统一使用2025年全国一卷数学试题,全部关闭联网搜索,仅开启深度思考模式。

在知名媒体蓝鲸财经的评测中,夸克以145分成功登顶。其中,在选择题、填空题方面,夸克的正确率高达93%,位居第一。在8道单项选择题中,所有AI产品都没有答对第六题,通过思维链发现,答错原因是为AI在识别图中的向量坐标和箭头方向时出现偏差。

1749814120544.jpg

而在“四木相对论”的评测中,夸克更是以146分,再次登顶。在答题速度上,夸克位列第一,豆包位列第二。以做解答题为例,夸克能在4分钟内完成一道题,其他产品的平均时间在6分钟左右。

1749814150596.jpg

支撑夸克解题能力的是“夸克学习灵知大模型”。该模型以通义千问为基础,依托百亿级学习资料库和后训练能力,尤其擅长解决理科类复杂问题,能为用户带来启发式学习的全新体验。

相关资讯

AI 搜索热潮背后:注定要逾越场景的门槛

AI 搜索热潮背后:注定要逾越场景的门槛

在 2024 上半年并算不明朗的 AI 应用局势中,AI 搜索正成为新共识并迎来了一波热潮,短时间内涌现出了多个 AI 搜索产品。 其中,国外原生 AI 搜索工具 Perplexity AI 最新估值已经接近30 亿美元、GenSpark、You 均表现不俗;国内天工 AI 、秘塔搜索等也在打磨自身产品力。 AI 搜索不仅在产品形态上革新了传统搜索引擎的信息罗列模式以及备受诟病的竞价排名广告,还能解决聊天机器人信息滞后和幻觉问题,让传统搜索引擎的交互变得更加智能。
7/4/2024 6:11:00 PM 王悦
张雪峰直言:AI 能取代我最好!教育博主对未来充满信心

张雪峰直言:AI 能取代我最好!教育博主对未来充满信心

在6月24日的一场直播中,知名教育博主张雪峰针对 “是否担心被 AI 取代” 的提问,给出了出人意料的回答。 他表示:“能被取代最好!” 这一观点引发了观众的热议。 张雪峰认为,当前 AI 的发展速度确实让人惊叹,尤其是在高考志愿填报方面,如 “夸克” 等智能平台,已经能够生成专业的报考报告,并具备深度搜索功能,这些在几年前是难以想象的。
6/24/2025 9:00:41 AM AI在线
领跑AI To C赛道  夸克品牌焕新“2亿人的AI全能助手”

领跑AI To C赛道 夸克品牌焕新“2亿人的AI全能助手”

1月15日,阿里智能信息事业群旗下夸克升级品牌Slogan—“2亿人的AI全能助手”,亮出加速探索AI To C应用的全新业务态势。 第三方数据显示,夸克用户规模持续保持高速增长,并领跑AI应用赛道,其中00后年轻用户占比超过一半。 00后AI应用第一站经过两年多的快速发展,国内AI大模型已经从比拼“模型参数”到解决“实际问题”。
1/15/2025 11:53:00 AM 新闻助手