AI在线 AI在线

国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行

网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R1 等通用大模型。

网易有道今日宣布开源“子曰 3”系列大模型的数学模型(Confucius3-Math),宣称是国内首个专注于数学教育、可在单块消费级 GPU 上高效运行的开源推理模型

图片

网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R1 等通用大模型。尤其在 GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中,“子曰 3 数学模型”的得分可达 98.5 分。

图片

网易有道表示,“子曰 3 数学模型”通过大规模增强学习以及一系列的创新算法,实现了更优的成本效益 —— 其训练成本仅为 2.6 万美元(AI在线注:现汇率约合 18.7 万元人民币),推理性能约为 DeepSeek R1 的 15 倍

此外,其在消费级 GPU 即可运行(如 RTX 4090D),降低了教育场景的 AI 应用门槛,服务成本每百万 token 低至 0.15 美元,远低于目前大多数通用大模型。这意味着更广泛的教育机构和开发者都能以低成本部署专业级的数学 AI 应用。

AI在线附开源地址如下:

https://github.com/netease-youdao/Confucius3-Math

Demo 地址:

https://confucius.youdao.com/

论文地址:

https://github.com/netease-youdao/Confucius3-Math/blob/main/Confucius3-Math.pdf

相关资讯

GPT-5展现惊人数学能力,助研究者节省一个月的工作时间

在人工智能领域,最新的进展引发了广泛关注。 OpenAI 的研究员塞巴斯蒂安・布贝克(Sebastien Bubeck)近日在社交媒体平台 X 上分享了他与新一代语言模型 GPT-5的合作经历。 他表示,GPT-5在处理复杂数学任务方面表现卓越,能够完成他原本需要一个月才能完成的工作,仅用一个下午就高效解决了问题。
12/1/2025 10:46:41 AM
AI在线

DeepSeek告诉我:程序员在AI时代不必焦虑

一、AI焦虑的本质:程序员为何担心被取代? 凌晨2点,程序员小王对着屏幕发呆。 GitHub Copilot刚帮他自动补全了代码,但看着一行行自动生成的函数,他突然感到后背发凉:“如果AI连代码都能写,我的价值在哪里?
2/3/2025 10:07:43 PM
方才coding

网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”

据官方介绍,子曰-o1 是 14B 轻量级单模型,支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。
1/22/2025 11:26:32 AM
问舟