AI在线 AI在线

微软 Copilot 全线升级 GPT-5.2,免费开启“专家级”工作流新时代

| 微软今日宣布正式向网页、Windows 及移动端用户推送 OpenAI 迄今为止最强大的模型系列——GPT-5.2。 作为一次极具诚意的免费升级,GPT-5.2将以“智能增强版”模式与现有的 GPT-5.1模型共存,标志着 Copilot 正式进入深度逻辑推理时代。 这一被誉为“专家级”的模型不仅能以更快的速度完成构建电子表格、编写审查代码、理解超长文档等实际任务,更在处理复杂工具调用和图像分析方面表现出了前所未有的成熟度。

| 微软今日宣布正式向网页、Windows 及移动端用户推送 OpenAI 迄今为止最强大的模型系列——GPT-5.2。作为一次极具诚意的免费升级,GPT-5.2将以“智能增强版”模式与现有的 GPT-5.1模型共存,标志着 Copilot 正式进入深度逻辑推理时代。这一被誉为“专家级”的模型不仅能以更快的速度完成构建电子表格、编写审查代码、理解超长文档等实际任务,更在处理复杂工具调用和图像分析方面表现出了前所未有的成熟度。

QQ20251230-092111.png

从性能维度看,GPT-5.2带来的飞跃不仅体现在速度上,更在于其深度思考的能力。微软明确表示,Copilot 上的 GPT-5.2Plus 版本实质上是 GPT-5.2的“思考型”变体。在涵盖44个职业的知识工作任务基准测试中,GPT-5.2Thinking 在高达70.9% 的情况下表现优于或持平行业专业人士,而此前 GPT-5的这一比例仅为38.8%。这种近乎翻倍的进步,使得 OpenAI 能够底气十足地将该模型定位为处理演示文稿、日程安排及各类专业交付物的顶级专家,为办公自动化设定了新的行业天花板。

在硬核的技术基准测试中,GPT-5.2同样展示了其统治地位。在编程领域,它在 SWE-Bench Pro 和 SWE-bench Verified 上的得分均刷新了纪录,显著超越了 GPT-5.1Thinking。而在最具挑战性的逻辑与科学测试中,该模型在 GPQA Diamond 测试中获得了92.4% 的高分,更是在 AIME2025数学测试中达成了100% 的满分成就。

此外,其在 CharXiv 推理和 ARC-AGI-2测试中的大幅提升,印证了微软正通过技术迭代,让 Copilot 从一个基础的助手进化为具备严密逻辑体系的数字智慧体,从而在激烈的 AI 竞赛中持续保持领先优势。

相关资讯

研究显示,AI 用户可与双人团队媲美,提升工作效率

研究显示,AI 用户可与双人团队媲美,提升工作效率

最近的一项研究显示,使用人工智能(AI)的个人在工作表现上可与传统的双人团队相媲美。 此次研究由776名洁(Procter & Gamble)专家参与,他们在一天的工作坊中为多个业务单位开发产品创意。 研究将参与者分成两组,分别是由一名商业专家和一名技术专家组成的团队,和单独的个人,其中一半的团队和个人都获得了 GPT-4和 GPT-4o 的访问权限。
3/24/2025 9:33:00 AM AI在线
OpenAI宣布GPT-4退役,AI浪潮进入新篇章

OpenAI宣布GPT-4退役,AI浪潮进入新篇章

人工智能领域的技术迭代速度令人惊叹。 近日,OpenAI正式宣布,其标志性模型GPT-4将于2025年4月30日从ChatGPT中全面退役,被更先进的GPT-4o取代。 这一消息引发了业界和创作者的广泛讨论,标志着AI大模型时代又一次里程碑式的转折。
4/13/2025 7:34:53 AM AI在线
OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型

OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型

OpenAI 近日正式发布 GPT-5-Codex-Mini,这是一款专为开发者打造的高性价比编程模型,继9月推出的 GPT-5-Codex 后,再次拓宽了智能编程的应用边界。 GPT-5-Codex 基于 GPT-5架构,专注提升代码推理与生成能力,能够在真实软件工程任务中执行包括新项目创建、功能扩展、测试编写与大规模代码重构等多类复杂操作。 其在 SWE-bench Verified 基准测试中取得74.5% 的高分,超越此前的 GPT-5High(72.8%),展现出显著性能优势。
11/10/2025 11:21:27 AM AI在线