AI在线 AI在线

国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行

网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R1 等通用大模型。

网易有道今日宣布开源“子曰 3”系列大模型的数学模型(Confucius3-Math),宣称是国内首个专注于数学教育、可在单块消费级 GPU 上高效运行的开源推理模型

图片

网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R1 等通用大模型。尤其在 GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中,“子曰 3 数学模型”的得分可达 98.5 分。

图片

网易有道表示,“子曰 3 数学模型”通过大规模增强学习以及一系列的创新算法,实现了更优的成本效益 —— 其训练成本仅为 2.6 万美元(AI在线注:现汇率约合 18.7 万元人民币),推理性能约为 DeepSeek R1 的 15 倍

此外,其在消费级 GPU 即可运行(如 RTX 4090D),降低了教育场景的 AI 应用门槛,服务成本每百万 token 低至 0.15 美元,远低于目前大多数通用大模型。这意味着更广泛的教育机构和开发者都能以低成本部署专业级的数学 AI 应用。

AI在线附开源地址如下:

https://github.com/netease-youdao/Confucius3-Math

Demo 地址:

https://confucius.youdao.com/

论文地址:

https://github.com/netease-youdao/Confucius3-Math/blob/main/Confucius3-Math.pdf

相关资讯

DeepSeek告诉我:程序员在AI时代不必焦虑

一、AI焦虑的本质:程序员为何担心被取代? 凌晨2点,程序员小王对着屏幕发呆。 GitHub Copilot刚帮他自动补全了代码,但看着一行行自动生成的函数,他突然感到后背发凉:“如果AI连代码都能写,我的价值在哪里?
2/3/2025 10:07:43 PM
方才coding

网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”

据官方介绍,子曰-o1 是 14B 轻量级单模型,支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。
1/22/2025 11:26:32 AM
问舟

网易有道宣布拥抱 DeepSeek 大模型,智能硬件新品不久后推出

网易有道今日宣布全面拥抱 DeepSeek-R1,AI 学习助手“有道小 P”结合 DeepSeek-R1 超长思维链所提供的思考及分析能力,进一步优化了个性化答疑功能,已经能够提供更具深度、更强准确性的解题思路。
2/6/2025 7:24:24 PM
浩渺
  • 1