360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

作者：故渊 2024-12-14 10:43

“360 智脑”官方公众号昨日（12 月 13 日）发布博文，宣布推出 360 自研 AI 大模型 360gpt2-o1，推理能力显著提升，在数学和逻辑推理任务上表现出色。

感谢“360 智脑”官方公众号昨日（12 月 13 日）发布博文，宣布推出 360 自研 AI 大模型 360gpt2-o1，推理能力显著提升，在数学和逻辑推理任务上表现出色。

该模型通过合成数据优化、模型后训练和“慢思考”范式实现了技术突破，并在多项权威评测中取得了优异成绩。

在多项基础数学评测（如 MATH、高考数学）以及权威数学竞赛（包括 AIME24、AMC23）中，360gpt2-o1 均取得了显著的成绩，不仅超越了前代模型 360gpt2-pro，也优于 GPT-4o 模型。

360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

在数学竞赛评测中，360gpt2-o1 超过了阿里巴巴最新开源的 o1 系列模型 QWQ-32B-preview。AI在线附上该模型整体架构如下：

360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

优化合成数据

该模型通过指令合成、质量 / 多样性筛选等方法，解决了高质量数学与逻辑推理数据稀缺的问题，有效扩充了训练数据集。

360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

模型后训练

该模型采用两阶段训练策略，先用小模型生成多样化的推理路径，再用大模型进行 RFT 训练和强化学习训练，提升模型推理能力和反思纠错能力。

360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

“慢思考”范式

利用蒙特卡洛树搜索探索多样化解决方案，并引入 LLM 进行错误验证和纠错，模拟人类逐步推理和反思的过程，最终形成包含反思、验证、纠错和回溯的长思维链。

360gpt2-o1 上线：“会思考”的国产大模型，探索 AI 推理新极限

相关标签：

360

相关资讯

20 年前的古董微软 Xbox 360 游戏机成功运行 Llama2.c AI 模型：搭三核 PowerPC 处理器、512MB RAM

20 年前的古董微软 Xbox 360 游戏机成功运行 Llama2.c AI 模型：搭三核 PowerPC 处理器、512MB RAM

X 平台博主 Andrei David 发文，宣布其成功在一台拥有 20 年历史的厚版 Xbox 360 游戏机上安装并运行了一款特制的 Llama2.c AI 模型。

1/12/2025 8:29:58 PM 漾仔

360 Group Unveils Nanometer AI Super Search Intelligence Body, Leading a New Era of Intelligent Analysis

360 Group Unveils Nanometer AI Super Search Intelligence Body, Leading a New Era of Intelligent Analysis

Recently, 360 Group officially launched an innovative product called the "Nano AI Super Search Intelligence Body," marking another significant breakthrough in AI technology. This intelligent body integrates 80 large-scale models, featuring powerful intent parsing capabilities and multimodal generation technology, aiming to provide users with a more efficient search and analysis experience.The functions of this intelligent body are very comprehensive. It not only supports the automatic generation of short video materials but also enables cross-platform user behavior data analysis.

6/16/2025 11:01:54 AM AI在线

腾讯混元3D世界模型震撼发布！360°沉浸场景免费体验，AI重塑虚拟世界未来！

腾讯混元3D世界模型震撼发布！360°沉浸场景免费体验，AI重塑虚拟世界未来！

近日，腾讯在2025世界人工智能大会上正式发布混元3D世界模型1.0，并宣布全面开源，成为业界首个支持沉浸式漫游、交互与仿真的3D世界生成模型。这款模型以其高精度360°场景生成和可交互漫游功能，迅速引发行业热议，为游戏开发、虚拟现实（VR）、数字内容创作等领域打开了无限可能。高精度360°场景生成，视觉体验再升级腾讯混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术，支持通过文字描述或单张图片输入，快速生成高质量、风格多样的360°沉浸式3D场景。

7/28/2025 2:32:13 PM AI在线