AI在线 AI在线

推理模型

当人工智能推理遭遇瓶颈:大型推理模型的崩溃

最近,我们听说人工智能已经学会了思考。 OpenAI 的 o1 系列、DeepSeek 的 R1、Claude 的思维模型——这些“大型推理模型”声势浩大地问世,有望在机器解决复杂问题方面取得突破。 与之前那些仅仅通过模式匹配完成任务的模型不同,这些系统显然能够进行“真正的”推理,甚至拥有与人类思维相符的内心独白。
6/13/2025 1:00:00 AM

Mistral的首个强推理模型:拥抱开源,推理速度快10倍

大模型强推理赛道,又迎来一位重量级玩家。 本周二,欧洲人工智能公司 Mistral AI 发布了 Magistral,这是一个全新的大语言模型(LLM)系列,展现了强大的推理能力。 它能够进行不断反思,并解决更复杂的任务。
6/11/2025 2:39:50 PM

法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源

6 月 11 日消息,法国人工智能实验室 Mistral 周二宣布进军推理人工智能模型领域。 6 月 . 10 日,Mistral 正式推出其首个推理模型系列 .
6/11/2025 9:19:46 AM
远洋

AdaptThink:推理模型的自适应思考范式

大家好,我是肆〇柒。 我前几天就看到这么一篇论文关于 AdaptThink。 它主要讲的是如何通过强化学习,来实现Reason Model(推理模型如o1,R1)根据问题难度自适应选择思考模式(思考或不思考),以优化推理质量和效率的平衡。
5/28/2025 2:40:00 AM
肆零柒

Poe2025春季AI模型使用趋势报告:OpenAI与Anthropic双雄争霸 可灵异军突起

全球知名AI模型集成平台Poe发布《2025春季AI模型使用趋势报告》,基于平台上数百万次用户交互,深入分析了文本、图像、视频、音频和推理模型的需求与使用份额变化。 报告揭示了今年以来OpenAI GPT-4.1、Google Gemini2.5Pro、Kuaishou Kling等突破性模型的快速崛起,以及AI使用模式的深刻转变。 AIbase综合最新动态,独家解读这一报告的核心亮点及其对AI生态的深远影响。
5/19/2025 5:00:45 PM
AI在线

微软开源 Phi-4 推理模型:啰嗦AI,反卷出圈

AI圈子最有意思的事,已经不是“谁家模型参数最多”,而是——谁家小模型,能把大模型打趴下。 最近,微软研究院开源了一款“小而强”的研究:Phi-4-reasoning-plus。 这是一款专为深度结构化推理任务设计的开源语言模型。
5/8/2025 4:45:32 PM
文摘菌

小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini

在数学推理和代码竞赛公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
4/30/2025 9:46:36 AM
清源

最先进推理模型! OpenAI 推出 o3 和 o4-mini 模型

译者 | 崔皓审校 | 重楼开篇就在OpenAI推出 GPT 4.1 系列几天后,又发布了o3 和 o4-mini 的推理模型,这表明大模型正式迈向 AGI( 人工通用智能 )。 o3 和 o4-mini 不仅仅是 AI 模型;它们还具备智能性、自治性、可调用工具以及与真实软件对接的技能,是一个真正意义上的AI 系统。 新模型不会被动工作;而是主动使用工具自动完成任务!
4/23/2025 8:30:05 AM
崔皓

OpenAI新推AI模型o3幻觉现象加剧,精准性令人担忧

最近,OpenAI 推出了其最新的 o3和 o4-mini AI 模型,这些模型在许多方面都达到了尖端水平。 然而,新的模型在 “幻觉” 问题上却并没有改善,反而幻觉现象比 OpenAI 之前的多个模型更为严重。 所谓 “幻觉”,是指 AI 模型会错误地生成虚假信息,这是当今最棘手的 AI 问题之一。
4/22/2025 10:01:05 AM
AI在线

OpenAI 推出全新推理模型 o3,实现图像思考能力

OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。 这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。 o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。
4/17/2025 9:01:05 AM
AI在线

ChatGPT首次带图深度思考:OpenAI连发o3/o4 mini,比前代性能更强价格更低

仅隔一天,OpenAI再次突然放大招:一口气,o3和o4 mini同步上线。 图片依然是最热门推理模型,并且这一次,它们终于能够调用ChatGPT里的各种工具了,包括网络搜索、Python、图像分析、文件解释和图像生成。 也就是说,你现在可以也用o3来生成吉卜力风格的奥特曼抱子图了(doge)。
4/17/2025 7:23:10 AM

字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开,4 月 17 日开放接口

该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,同时,模型采用 MoE 架构,总参数 200B,激活参数为 20B,具备显著的推理成本优势,单位推理成本相比 DeepSeek R1 降低 50%。
4/14/2025 12:44:37 PM
清源

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。 在探索的过程中,一个核心的议题是:对于模型推理性能的提升来说,什么有效? 什么无效?
4/13/2025 3:10:00 PM
机器之心

谷歌前科学家出品!Reka开源Reka Flash 3,能力超Gemma 3 27B

Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。 这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。 别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。
3/21/2025 2:01:00 PM
AI在线

腾讯混元全新推理模型 T1 官宣:3 月 21 日发布

腾讯混元今日通过官方公众号宣布,全新的推理模型T1将于本周五(IT之家注:北京时间3月21日23时)正式发布。
3/19/2025 8:58:04 PM
清源

阿里开源推理模型QwQ-32B,性能比肩R1满血版!

Manus 发布之后,随之而来赶到战场的,是阿里。 关于 Manus 的深度测评:. 一手体验首款通用Agent产品Manus昨天夜里,深夜惊雷。
3/10/2025 12:38:48 AM
数字生命卡兹克

消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案

外媒The Information 今晚发布消息称,微软正在开发内部人工智能推理模型,以与OpenAI竞争,并可能向开发者出售。
3/7/2025 10:36:17 PM
清源

32B逆袭671BDeepSeek R1!阿里推理模型炸翻了:小到笔记本就能run,成本仅1/10!又是强化学习带来惊喜!

编辑 | 伊风太震撼了。 阿里直接扔了一张王炸! QwQ-32B,一个参数量如此小的小模型,居然追平了671B的DeepSeek-R1?
3/6/2025 12:43:03 PM
伊风