AI学会“无师自通”？AZR让模型左右互搏，越打越聪明！

作者：AI在线 2025-05-08 10:00

一项名为Absolute Zero Reasoner（AZR）的创新项目近日引发广泛关注。该项目通过一种全新的“绝对零点”训练范式，让大型语言模型(LLM)能够自主提出问题、编写代码、运行验证，并通过自我博弈(self-play)循环提升编程与数学能力。基于Qwen2.5-7B模型的测试数据显示，AZR在编程能力上提升了5分，数学能力提升了15.2分(满分100分)，展现了其在AI自进化领域的巨大潜力。

核心机制:强化自博弈与零数据训练

AZR的核心创新在于其强化学习验证推理（RLVR）机制。模型以提出者与解决者的双重角色运作:提出者生成具有挑战性的代码推理任务，解决者则编写代码并通过代码执行器验证答案的正确性。这一过程无需任何外部人工标注数据，完全依赖模型自身的迭代与反馈。AIbase了解到，AZR通过动态调整任务难度，持续优化其训练课程(curriculum)，从而实现数学与编程能力的显著提升。社交媒体上，开发者对这一“零数据”训练范式的效率与成果表示惊叹，认为其为AI模型的自进化开辟了新路径。

性能表现:超越传统模型

根据官方数据，AZR在多个基准测试中展现了优异表现。基于Qwen2.5-7B模型的测试表明，其在HumanEval（编程）和MATH(数学)等任务上的性能超越了同类“零数据”模型，整体表现达到开源模型的顶尖水平(state-of-the-art， SoTA)。具体而言，AZR在编程任务中提升了5%的得分，在数学任务中提升了15.2%，远超传统依赖大规模标注数据的模型。AIbase编辑团队认为，AZR的成功得益于其结合代码执行器进行实时验证，确保了推理过程的准确性和可靠性。

硬件需求:高显存成本

尽管AZR在性能上表现卓越，但其训练对硬件资源的需求较高。官方数据显示，运行不同规模的模型需要以下GPU配置:

3B参数模型:2块80GB GPU;

7B/8B参数模型:4块80GB GPU;

14B参数模型:8块80GB GPU。

这一高显存需求可能对普通开发者构成一定门槛，但对于具备高性能计算资源的研究机构或企业而言，AZR的高效自进化能力无疑具有巨大吸引力。社交媒体讨论指出，优化显存使用或开发更轻量化的模型将是AZR未来普及的关键。

AI自进化的未来方向

Absolute Zero Reasoner的发布标志着AI模型从依赖外部数据向自我驱动进化的重大转变。AIbase编辑团队认为，AZR的“零数据”范式不仅降低了数据收集的成本，还为模型在编程、数学等复杂推理任务中的应用提供了新思路。未来，随着硬件优化的推进和多领域任务的扩展，AZR有望进一步提升性能，成为AI自进化领域的标杆项目。

项目地址：https://github.com/LeapLabTHU/Absolute-Zero-Reasoner

Fastino 融资 1750 万美元，利用廉价游戏 GPU 训练 AI 模型

在当今科技行业，AI（人工智能）正迅速崛起，许多巨头公司都在大谈特谈拥有万亿参数的 AI 模型，这些模型通常需要耗费巨资搭建庞大的 GPU 集群。然而，Fastino 却走了一条不同的道路，利用成本低廉的游戏 GPU 进行 AI 模型训练，并成功获得了由 Khosla Ventures 领投的1750万美元融资。这一创新的方式使得 Fastino 能够在资源有限的情况下，实现高效的 AI 模型开发。

5/8/2025 12:01:07 PM AI在线

投资巨头高盛质疑 AI 投资回报：巨额投入能否换来光明未来？

全球知名投行高盛 (Goldman Sachs) 近期对人工智能 (AI) 投资的回报率提出了质疑。尽管各大企业和投资者正斥资数十亿美元用于人工智能研发，但高盛担忧如此巨额的投入能否真正带来丰厚回报。图源 Pexels目前，我们使用的 LLM 大型语言模型（例如 GPT-4o）训练成本就高达数亿美元，下一代模型的训练成本更是预计将飙升至 10 亿美元。风投巨头红杉资本 (Sequoia Capital) 经过测算后表示，整个 AI 行业每年都需要产生 6000 亿美元（AI在线备注：当前约 4.36 万亿元人民币）

7/14/2024 6:01:45 PM 远洋

25万GPU，估值350亿美元冲刺IPO！财务定时炸弹，GenAI不祥之兆

美国云服务公司CoreWeave，已提交上市文件，即将IPO。这是美国近期首个有意义的科技IPO，也是首个直接与AI热潮相关的IPO。 CoreWeave虽然有25万GPU，却频频受到质疑。

3/21/2025 12:56:44 PM 新智元

AI学会“无师自通”？AZR让模型左右互搏，越打越聪明！

相关资讯

​Fastino 融资 1750 万美元，利用廉价游戏 GPU 训练 AI 模型

投资巨头高盛质疑 AI 投资回报：巨额投入能否换来光明未来？

25万GPU，估值350亿美元冲刺IPO！财务定时炸弹，GenAI不祥之兆

Fastino 融资 1750 万美元，利用廉价游戏 GPU 训练 AI 模型