推理模型
小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini
在数学推理和代码竞赛公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
4/30/2025 9:46:36 AM
清源
最先进推理模型! OpenAI 推出 o3 和 o4-mini 模型
译者 | 崔皓审校 | 重楼开篇就在OpenAI推出 GPT 4.1 系列几天后,又发布了o3 和 o4-mini 的推理模型,这表明大模型正式迈向 AGI( 人工通用智能 )。 o3 和 o4-mini 不仅仅是 AI 模型;它们还具备智能性、自治性、可调用工具以及与真实软件对接的技能,是一个真正意义上的AI 系统。 新模型不会被动工作;而是主动使用工具自动完成任务!
4/23/2025 8:30:05 AM
崔皓
OpenAI新推AI模型o3幻觉现象加剧,精准性令人担忧
最近,OpenAI 推出了其最新的 o3和 o4-mini AI 模型,这些模型在许多方面都达到了尖端水平。 然而,新的模型在 “幻觉” 问题上却并没有改善,反而幻觉现象比 OpenAI 之前的多个模型更为严重。 所谓 “幻觉”,是指 AI 模型会错误地生成虚假信息,这是当今最棘手的 AI 问题之一。
4/22/2025 10:01:05 AM
AI在线
OpenAI 推出全新推理模型 o3,实现图像思考能力
OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。 这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。 o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。
4/17/2025 9:01:05 AM
AI在线
ChatGPT首次带图深度思考:OpenAI连发o3/o4 mini,比前代性能更强价格更低
仅隔一天,OpenAI再次突然放大招:一口气,o3和o4 mini同步上线。 图片依然是最热门推理模型,并且这一次,它们终于能够调用ChatGPT里的各种工具了,包括网络搜索、Python、图像分析、文件解释和图像生成。 也就是说,你现在可以也用o3来生成吉卜力风格的奥特曼抱子图了(doge)。
4/17/2025 7:23:10 AM
字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开,4 月 17 日开放接口
该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,同时,模型采用 MoE 架构,总参数 200B,激活参数为 20B,具备显著的推理成本优势,单位推理成本相比 DeepSeek R1 降低 50%。
4/14/2025 12:44:37 PM
清源
强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展
「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。 在探索的过程中,一个核心的议题是:对于模型推理性能的提升来说,什么有效? 什么无效?
4/13/2025 3:10:00 PM
机器之心
谷歌前科学家出品!Reka开源Reka Flash 3,能力超Gemma 3 27B
Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。 这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。 别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。
3/21/2025 2:01:00 PM
AI在线
腾讯混元全新推理模型 T1 官宣:3 月 21 日发布
腾讯混元今日通过官方公众号宣布,全新的推理模型T1将于本周五(IT之家注:北京时间3月21日23时)正式发布。
3/19/2025 8:58:04 PM
清源
阿里开源推理模型QwQ-32B,性能比肩R1满血版!
Manus 发布之后,随之而来赶到战场的,是阿里。 关于 Manus 的深度测评:. 一手体验首款通用Agent产品Manus昨天夜里,深夜惊雷。
3/10/2025 12:38:48 AM
数字生命卡兹克
消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案
外媒The Information 今晚发布消息称,微软正在开发内部人工智能推理模型,以与OpenAI竞争,并可能向开发者出售。
3/7/2025 10:36:17 PM
清源
32B逆袭671BDeepSeek R1!阿里推理模型炸翻了:小到笔记本就能run,成本仅1/10!又是强化学习带来惊喜!
编辑 | 伊风太震撼了。 阿里直接扔了一张王炸! QwQ-32B,一个参数量如此小的小模型,居然追平了671B的DeepSeek-R1?
3/6/2025 12:43:03 PM
伊风
亚马逊研发新型推理人工智能模型,欲与OpenAI和Anthropic展开竞争
近日,有消息透露,亚马逊正在积极开发一种集成先进推理能力的人工智能模型。 这一新产品计划将在今年6月份以 Nova 品牌推出,Nova 是亚马逊去年年底发布的一系列生成式人工智能模型的一部分。 项目的相关人士表示,该模型旨在采用 “混合推理” 方法,能够在同一个系统中提供快速的回答以及更复杂的推理过程。
3/5/2025 9:23:00 AM
AI在线
彻底理解推理模型和通用模型
以下是通用模型和推理模型的核心总结及其区别,通过表格和关键点快速对比。 一、概念1、通用模型(General-Purpose Models)定义:能够处理多种任务的模型,如文本生成、问答、翻译、摘要等,通常基于大规模预训练(如GPT系列、PaLM等)。 特点:a.广泛适用性:通过海量数据预训练,学习通用语言模式和知识。
3/5/2025 12:22:00 AM
独行者木子李
消息称亚马逊正开发推理模型 Nova:又要快又要能深度思考
据一位直接参与该项目的知情人士透露,这款新产品计划最早在 6 月以“Nova”品牌发布,Nova 是亚马逊去年底推出的一系列生成式AI模型。
3/4/2025 6:17:10 PM
清源
阿里国际站推出Accio搜索引擎 AI"生意助手"提升业务效率
今日,阿里国际站宣布正式上线面向全球B2B买家的首个AI搜索引擎Accio。 该引擎接入了DeepSeek等推理模型,为用户提供深度研究和商业探索功能。 同时,阿里国际站还将其为中国外贸商家推出的"生意助手"AI工具全面接入推理模型。
2/28/2025 4:21:00 PM
AI在线
业界首个“混合AI推理模型”!快OpenAI一步Anthropic跳版本发布:Claude3.7 Sonnet可自行决定思考时长
整理 | 星璇出品 | 51CTO技术栈(微信号:blog51cto)就在OpenAI还在吊胃口之际,最强竞对 Anthropic 深夜开大了! Anthropic 直接把自家的“通用 推理”二合一的模型发布了,并把自家内部在用的AI编程工具也上线,直接可以终端执行任务的那种! 这就带大家看看这家公司在大模型以及AI产品上的不同打法!
2/25/2025 11:59:44 AM
星璇
1/30 训练步骤复刻 DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型 RL 训练方法
现在,开源 RL 训练方法只需要用 1/30 的训练步骤就能赶上相同尺寸的 DeepSeek-R1-Zero 蒸馏 Qwen。
2/22/2025 5:48:21 PM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind