阶跃星辰
8B模型任务击败GPT-5?阶跃星辰开源Deep Think新框架,小模型解锁百万Token测试时计算
8B 模型在数学竞赛任务上超越 GPT-5! 阶跃星辰正式推出并行协同推理(PaCoRe, Parallel Coordinated Reasoning),这是一个全新的训练和推理框架,让大模型的能力不再受限于线性思维链的上下文窗口大小(Context Window)和处理速度,而是基于大规模并行协同的方式,让模型进行前所未有的广度和深度思考。 强大性能的 Gemini Deep Think 模式仅隐约透露其采用“并行思考”扩展测试时计算的思路;而 PaCoRe 以卓越的表现验证了大规模扩展测试时计算的有效性,并完整开源模型,训练数据,推理管线从而加速该领域的研究与创新。
12/14/2025 8:48:00 PM
机器之心
苹果AI论文太坑了!用GPT写的GT,导致北京程序员通宵加班
衡宇 发自 凹非寺. 量子位 | 公众号 QbitAI大无语事件天天有,今天特别多——. AI大模型公司阶跃星辰的研究员,自曝被苹果挂在arXiv上的论文,狠狠坑了一把。
11/28/2025 5:07:43 PM
衡宇
WithAnyone重磅开源:这可能是你见过最自然的AI合照模型
和任何人,去任何地方! 复旦大学携手阶跃星辰打破 “复制粘贴” 魔咒,重磅推出全新 AI 合照生成模型 WithAnyone —— 只需上传照片,就能一键生成自然、真实、毫无违和感的 AI 合照! WithAnyone 是什么?
11/16/2025 6:33:00 PM
机器之心
大模型公司不搞浏览器搞Agent,实测找到原因了
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI如果Agent能操作命令行,就有了与整个计算机系统交互的能力。 也意味着一台计算机的几乎所有功能,都可以通过自然语言来驱动。
10/31/2025 4:57:59 PM
闻乐
NextStep-1:一次在图像生成上自回归范式的探索
自回归模型,是 AIGC 领域一块迷人的基石。 开发者们一直在探索它在视觉生成领域的边界,从经典的离散序列生成,到结合强大扩散模型的混合范式,每一步都凝聚了社区的智慧。 这些工作,比如 MAR、Fluid、LatentLM 等,为我们带来了巨大的启发,也让我们看到了进一步优化的空间:比如,如何避免离散化带来的信息损失?
8/18/2025 1:26:00 PM
机器之心
阶跃星辰新一代基础大模型 Step 3 正式开源:拥有强大视觉感知和复杂推理能力
AI在线 7 月 31 日消息,阶跃星辰宣布新一代基础大模型 Step 3 正式开源,Step 3 API 已上线阶跃星辰开放平台(platform.stepfun.com),用户也可以在“阶跃 AI”官网(stepfun.com)和“阶跃 AI”App 进行体验。 据介绍,Step 3 的多模态能力围绕“轻量视觉路径”与“稳定协同训练”展开,重点解决视觉引入带来的 token 负担与训练干扰问题。 为此,其采用 5B Vision Encoder,并通过双层 2D 卷积对视觉特征进行降采样,将视觉 token 数量减少到原来的 1/16,减轻上下文长度压力,提升推理效率。
7/31/2025 10:18:00 PM
远洋
千里科技联手阶跃星辰、吉利发布下一代智能座舱Agent OS
在今天开幕的2025世界人工智能大会(简称“WAIC 2025”)上,千里科技联手阶跃星辰、吉利汽车集团共同发布了面向AI Agent原生打造的下一代智能座舱Agent OS(预览版)。 基于阶跃星辰行业领先的多模态大模型、端到端语音大模型,它具备多模态融合的超自然交互、端云一体的融合记忆、基于全融合地图的人机共驾以及第三生活空间等关键能力,为用户带来更自然、更拟人和更情感化的座舱交互体验。 当前,大模型技术的持续迭代,对于智能座舱的体验革新创造了巨大的机遇。
7/26/2025 10:20:25 PM
贾浩楠
实测爆火的阶跃星辰Step 3,性能SOTA,开源多模态推理之王
天气很热,WAIC 2025 也很热,来自中国的开源模型军团更是热上加热。 就在刚刚开始的 WAIC 2025(世界人工智能大会)前一天,被誉为「多模态卷王」的阶跃星辰率先投下一枚重磅炸弹,正式推出其新一代基座模型:Step 3。 这并非又一个普通的模型迭代。
7/26/2025 6:16:00 PM
机器之心
阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载
AI在线 7 月 26 日消息,在 2025 世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰昨天在上海正式发布了新一代基础大模型 ——Step 3,将于 7 月 31 日面向全球企业和开发者开源。 据官方介绍,Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。 Step 3 采用 MoE 架构,总参数量 321B,激活参数量 38B。
7/26/2025 7:31:52 AM
浩渺
WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先
在2025世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰今天在上海正式发布了新一代基础大模型——Step 3。 作为阶跃的主力基座模型,Step 3兼顾智能与效率,旨在面向推理时代打造最适合应用的模型。 Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型。
7/25/2025 9:43:00 PM
陈彩娴
消息称阶跃星辰 C 端产品“冒泡鸭”停运,业务重心转向终端 Agent
2024 年 12 月,角色扮演类 Agent 产品“冒泡鸭”停止大范围投入,团队合并至对话产品“跃问”(现更名为“阶跃 AI”),目前仅留部分员工运维。
6/4/2025 8:05:45 AM
清源
阶跃星辰开源 3D 大模型 Step1X-3D,可生成高保真、可控的 3D 内容
上周阶跃星辰发布了音跃模型 ACE-Step,今天该公司又正式发布并开源 3D 大模型 ——Step1X-3D,这是继图像、视频、语音、音乐等模态后,阶跃星辰在多模态方向的最新成果。Step1X-3D 模型总参数量达 4.8B(几何模块 1.3B,纹理模块 3.5B),凭借坚实的数据基础与先进的 3D 原生架构,可生成高保真、可控的 3D 内容。阶跃星辰称。Step1X-3D 不止于视觉“好看”,更追求实现“好用”与“可控”,旨在为 3D 内容创作提供强大而可靠的技术引擎。
5/14/2025 4:34:52 PM
远洋
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制
该模型总参数量为 19B,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。
4/27/2025 11:39:44 AM
清源
共同阶跃星辰与原力灵机达成战略合作
阶跃星辰与原力灵机在北京签署了战略合作协议,双方将利用各自的技术优势,在多模态大模型技术、智能终端 Agent 和具身智能场景方面展开深入合作。 此次合作的目标是实现 “实现在物理世界的推理”,共同开发一种名为 “RoboAgent” 的智能机器人,推动通用人工智能(AGI)在实际应用中的落地。 签约仪式上,阶跃星辰的创始人兼 CEO 姜大昕博士和原力灵机的联合创始人范浩强共同见证了这一重要时刻。
4/24/2025 2:00:46 PM
AI在线
阶跃星辰 Step-Video-TI2V 图生视频模型开源:运动幅度和镜头运动可控
今年 2 月阶跃星辰开源了两款 Step 系列多模态大模型 ——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型,今天阶跃星辰继续开源图生视频模型 ——Step-Video-TI2V,一款基于 30B 参数 Step-Video-T2V 训练的图生视频模型,支持生成 102 帧、5 秒、540P 分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。
3/20/2025 3:19:58 PM
远洋
百万成本揭秘LLM训练黄金法则,阶跃星辰推出全领域适用的超参数优化工具
在人工智能的激烈竞争中,一场耗资百万美元的大规模实验正悄然改变着大语言模型的训练方式。 阶跃星辰研究团队日前发布重磅研究成果,他们通过耗费近100万NVIDIA H800GPU小时的算力,从零开始训练了3,700个不同规模的模型,累计训练了惊人的100万亿个token,揭示出一条被称为"Step Law"的普适性缩放规律,为大语言模型的高效训练提供了全新指南。 这项研究不仅仅是对超参数优化的探索,更是第一个全面考察模型最优超参在不同形状、稀疏度和数据分布下稳定性的工作。
3/13/2025 3:41:00 PM
AI在线
智元机器人与阶跃星辰战略合作,共探具身智能与大模型融合
3月12日,智元机器人与阶跃星辰签署战略合作协议,探索具身智能与多模态大模型融合。将聚焦新零售等场景,推进数据标准与评测体系搭建等。智元有三大机器人家族,阶跃星辰已发布大模型矩阵。#智元机器人 #阶跃星辰 #战略合作
3/13/2025 3:17:21 PM
浩渺
华为昇腾适配阶跃星辰Step-Video和Step-Audio开源大模型,上线魔乐社区
今日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。 开发者和企业用户在魔乐社区中可以直接下载并体验。 Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。
3/10/2025 3:10:00 PM
新闻助手
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉