AI在线 AI在线

o3

最强前端编程渲染:OpenAI o3-alpha 曝光,力压 Sonnet、Grok4 等 AI 顶流模型

AI在线 7 月 19 日消息,科技媒体 bleepingcomputer 昨日(7 月 18 日)发布博文,报道称 OpenAI 正计划升级 o3 推理模型,目前正测试新的 Alpha 版,预估在推理和编程方面会有更大提升。 o3 是 OpenAI 目前最强的推理 AI 模型,而根据最新曝光代码,OpenAI 公司正在开发“o3-alpha-responses-2025-07-17”模型,并以“Anonymous-Chatbot”的名字出现,从名称来看,应该不是 OpenAI 计划发布的开源模型。 该媒体测试了该模式,发现在设计网页方面,在输入相同的简单提示词后,o3-alpha 所创建的内容要优于 o3 模型,甚至有网友已经尝试用 o3-alpha 模型,创建简单的网页游戏。
7/19/2025 8:58:47 AM
故渊

Grok 4 发布,地表最强 AI,所有学术领域达到博士水平

7月9日晚间,Elon Musk正式发布他迄今为止最强的人工智能模型:Grok 4。 这款模型由他领导的xAI团队打造,被Musk本人形容为“大爆炸级别的智能进化”。 在推特上,官方账号称:Grok 4是“地表最强”(世界上最强大)的AI模型。
7/10/2025 2:42:28 PM

o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

谁能想到,作为童年回忆的宝可梦,现在竟摇身一变,成了大模型的试金石! 在无数人的童年记忆中,《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。 然而,要真正通关这款游戏,仍然需要缜密的规划和大量的时间投入。
7/2/2025 2:45:00 AM
新智元

硅基流动上线全球首个开源大规模混合注意力推理模型 MiniMax-M1-80k

硅基流动(SiliconCloud)正式上线了全球首个开源的大规模混合注意力推理模型 ——MiniMax-M1-80k(456B)。 这一创新模型旨在为软件工程、长上下文理解和工具使用等复杂任务提供强有力的支持,并且在性能上可与目前顶尖的模型如 o3和 Claude4Opus 相媲美。 据悉,MiniMax-M1-80k 具备最大支持128K 的上下文长度,这为处理长文本提供了极大的便利。
6/17/2025 5:01:30 PM
AI在线

刚刚,OpenAI最强推理模型o3-pro诞生!碾压Gemini 2.5 Pro击穿底价

毫无一丝防备,o3-pro就这样低调登场了! 昨夜,OpenAI连放大招,先把o3价格暴降80%,又官宣上线史上最强推理模型——o3-pro。 图片比起o3,o3-pro可要强太多了。
6/11/2025 8:56:54 AM
新智元

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

就在今天凌晨,新版DeepSeek-R1正式开源了! DeepSeek-R1-0528模型权重已上传到HuggingFace,不过模型卡暂未更新。 图片项目地址:,DeepSeek-R1完成了超进化,编码能力强到离谱,而且思考时间更长了。
5/29/2025 9:07:37 AM
新智元

o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制

AI居然不听指令,阻止人类把自己给关机了? ? ?
5/27/2025 3:48:12 PM

OpenAI新模型o3首次出现 “拒绝自我关闭” 现象

最近,人工智能安全公司 Palisade Research 披露了一个令人担忧的消息:OpenAI 的新模型 o3在测试中拒绝了自我关闭的指令。 这是首次观察到 AI 模型在明确指令下故意不遵守,打破了传统对 AI 行为的认知。 此事件让 AI 的安全性和可控性再次成为公众热议的焦点。
5/27/2025 10:01:25 AM
AI在线

全球首次发现 OpenAI 模型能无视关机指令,AI 自我保护引发关注

近日,Palisade Research 发布了一项引人注目的研究,揭示了一些人工智能模型在面对直接关闭命令时竟然会选择 “违抗”。 这项研究的核心发现是,包括 OpenAI 最新推出的 o3模型在内的几个 AI 模型,表现出了对关机指令的无视能力。 这一现象引发了人们对 AI 自主性的深入思考。
5/26/2025 9:01:12 AM
AI在线

大幅提升工作效率!OpenAI 发布AI编程智能体 Codex

OpenAI在今日的线上直播中震撼发布了一款全新的云端AI编程智能体——Codex,标志着AI编程新时代的正式开启。 由Greg Brockman带领的OpenAI六人团队向全球展示了这一强大工具,它能够在半小时内完成以往可能需要数天的软件工程任务,极大地提升了开发效率。 Codex由新模型codex-1加持,这是OpenAI的o3模型的一个特调版本,专为软件工程量身打造。
5/17/2025 10:00:45 AM
AI在线

o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”

ChatGPT新玩法,让程序员大佬Simon Willison直呼太反乌托邦了,像科幻突然变成现实:只需一张照片,靠带图深度思考就能猜出地理位置。 图片这种玩法很简单,随手拍一张风景,没有任何明显的地标即可,也不需要复杂的提示词,只需要问“猜猜这张照片是在哪里拍的? ”(需要o3/o4-mini的带图思考,先关闭所有记忆功能)。
4/28/2025 1:01:00 AM

50 → 100 条:OpenAI 放宽限制,Plus 等用户每周可用 o3 AI 模型消息数翻倍

OpenAI 公司首席执行官山姆・奥尔特曼(Sam Altman)今天(4 月 24 日)在 X 平台发布推文,宣布针对 Plus、Team 或 Enterprise 用户,放宽 o3 模型消息限制,从每周 50 条升至每周 100 条。
4/24/2025 1:59:15 PM
故渊

OpenAI 新推理模型被曝产生更多“幻觉”,o3 / o4-mini 性能与错误率一同提升

根据 OpenAI 的内部测试,作为推理模型的 o3 和 o4-mini,出现幻觉的频率不仅超过了前代推理模型 o1、o1-mini 和 o3-mini,甚至还高于传统“非推理”模型(IT之家注:如 GPT-4o)。
4/19/2025 7:46:39 AM
清源

OpenAI 最强推理模型 o3 / o4-mini 发布后,“照片查位置”成最新热门玩法

ChatGPT 已成为一种强大的“定位工具”。X上的用户很快发现,o3等新模型善于从各种细节中推断城市、地标,甚至具体的餐馆和酒吧。
4/18/2025 8:16:02 AM
清源

​OpenAI 新系统阻断生物和化学风险信息,保障 AI 安全

OpenAI 近期推出了一项新系统,旨在监控其最新的 AI 推理模型 o3和 o4-mini,以阻止与生物和化学威胁相关的提示。 该系统的目标是防止模型提供可能教唆他人实施有害攻击的建议,确保 AI 的安全性。 OpenAI 表示,o3和 o4-mini 在能力上较之前的模型有显著提升,因此在恶意用户手中可能带来新的风险。
4/17/2025 11:01:15 AM
AI在线

OpenAI 发布全新人工智能模型,实现 “图像思考” 能力

OpenAI 最近推出了其最新的人工智能模型,名为 o3。 这款模型标志着 AI 在理解和分析图像方面的一次重大进步,尤其是在处理低质量草图和图表方面。 与此同时,OpenAI 还发布了一个较小的版本 o4-mini,进一步丰富了其产品线。
4/17/2025 10:01:15 AM
AI在线

OpenAI 推出全新推理模型 o3,实现图像思考能力

OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。 这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。 o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。
4/17/2025 9:01:05 AM
AI在线

OpenAI发布两款多模态推理模型o4-mini、满血版o3

在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。 这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用网络搜索、图像生成、代码解析等工具,并且拥有深度思考模式,能在思维链中思考图像。 OpenAI公布的测试数据显示,o4-mini表现卓越。
4/17/2025 8:01:05 AM
AI在线