阶跃星辰
阶跃星辰新一代基础大模型 Step 3 正式开源:拥有强大视觉感知和复杂推理能力
AI在线 7 月 31 日消息,阶跃星辰宣布新一代基础大模型 Step 3 正式开源,Step 3 API 已上线阶跃星辰开放平台(platform.stepfun.com),用户也可以在“阶跃 AI”官网(stepfun.com)和“阶跃 AI”App 进行体验。 据介绍,Step 3 的多模态能力围绕“轻量视觉路径”与“稳定协同训练”展开,重点解决视觉引入带来的 token 负担与训练干扰问题。 为此,其采用 5B Vision Encoder,并通过双层 2D 卷积对视觉特征进行降采样,将视觉 token 数量减少到原来的 1/16,减轻上下文长度压力,提升推理效率。
7/31/2025 10:18:00 PM
远洋
千里科技联手阶跃星辰、吉利发布下一代智能座舱Agent OS
在今天开幕的2025世界人工智能大会(简称“WAIC 2025”)上,千里科技联手阶跃星辰、吉利汽车集团共同发布了面向AI Agent原生打造的下一代智能座舱Agent OS(预览版)。 基于阶跃星辰行业领先的多模态大模型、端到端语音大模型,它具备多模态融合的超自然交互、端云一体的融合记忆、基于全融合地图的人机共驾以及第三生活空间等关键能力,为用户带来更自然、更拟人和更情感化的座舱交互体验。 当前,大模型技术的持续迭代,对于智能座舱的体验革新创造了巨大的机遇。
7/26/2025 10:20:25 PM
贾浩楠
实测爆火的阶跃星辰Step 3,性能SOTA,开源多模态推理之王
天气很热,WAIC 2025 也很热,来自中国的开源模型军团更是热上加热。 就在刚刚开始的 WAIC 2025(世界人工智能大会)前一天,被誉为「多模态卷王」的阶跃星辰率先投下一枚重磅炸弹,正式推出其新一代基座模型:Step 3。 这并非又一个普通的模型迭代。
7/26/2025 6:16:00 PM
机器之心
阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载
AI在线 7 月 26 日消息,在 2025 世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰昨天在上海正式发布了新一代基础大模型 ——Step 3,将于 7 月 31 日面向全球企业和开发者开源。 据官方介绍,Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。 Step 3 采用 MoE 架构,总参数量 321B,激活参数量 38B。
7/26/2025 7:31:52 AM
浩渺
WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先
在2025世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰今天在上海正式发布了新一代基础大模型——Step 3。 作为阶跃的主力基座模型,Step 3兼顾智能与效率,旨在面向推理时代打造最适合应用的模型。 Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型。
7/25/2025 9:43:00 PM
陈彩娴
消息称阶跃星辰 C 端产品“冒泡鸭”停运,业务重心转向终端 Agent
2024 年 12 月,角色扮演类 Agent 产品“冒泡鸭”停止大范围投入,团队合并至对话产品“跃问”(现更名为“阶跃 AI”),目前仅留部分员工运维。
6/4/2025 8:05:45 AM
清源
阶跃星辰开源 3D 大模型 Step1X-3D,可生成高保真、可控的 3D 内容
上周阶跃星辰发布了音跃模型 ACE-Step,今天该公司又正式发布并开源 3D 大模型 ——Step1X-3D,这是继图像、视频、语音、音乐等模态后,阶跃星辰在多模态方向的最新成果。Step1X-3D 模型总参数量达 4.8B(几何模块 1.3B,纹理模块 3.5B),凭借坚实的数据基础与先进的 3D 原生架构,可生成高保真、可控的 3D 内容。阶跃星辰称。Step1X-3D 不止于视觉“好看”,更追求实现“好用”与“可控”,旨在为 3D 内容创作提供强大而可靠的技术引擎。
5/14/2025 4:34:52 PM
远洋
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制
该模型总参数量为 19B,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。
4/27/2025 11:39:44 AM
清源
共同阶跃星辰与原力灵机达成战略合作
阶跃星辰与原力灵机在北京签署了战略合作协议,双方将利用各自的技术优势,在多模态大模型技术、智能终端 Agent 和具身智能场景方面展开深入合作。 此次合作的目标是实现 “实现在物理世界的推理”,共同开发一种名为 “RoboAgent” 的智能机器人,推动通用人工智能(AGI)在实际应用中的落地。 签约仪式上,阶跃星辰的创始人兼 CEO 姜大昕博士和原力灵机的联合创始人范浩强共同见证了这一重要时刻。
4/24/2025 2:00:46 PM
AI在线
阶跃星辰 Step-Video-TI2V 图生视频模型开源:运动幅度和镜头运动可控
今年 2 月阶跃星辰开源了两款 Step 系列多模态大模型 ——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型,今天阶跃星辰继续开源图生视频模型 ——Step-Video-TI2V,一款基于 30B 参数 Step-Video-T2V 训练的图生视频模型,支持生成 102 帧、5 秒、540P 分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。
3/20/2025 3:19:58 PM
远洋
百万成本揭秘LLM训练黄金法则,阶跃星辰推出全领域适用的超参数优化工具
在人工智能的激烈竞争中,一场耗资百万美元的大规模实验正悄然改变着大语言模型的训练方式。 阶跃星辰研究团队日前发布重磅研究成果,他们通过耗费近100万NVIDIA H800GPU小时的算力,从零开始训练了3,700个不同规模的模型,累计训练了惊人的100万亿个token,揭示出一条被称为"Step Law"的普适性缩放规律,为大语言模型的高效训练提供了全新指南。 这项研究不仅仅是对超参数优化的探索,更是第一个全面考察模型最优超参在不同形状、稀疏度和数据分布下稳定性的工作。
3/13/2025 3:41:00 PM
AI在线
智元机器人与阶跃星辰战略合作,共探具身智能与大模型融合
3月12日,智元机器人与阶跃星辰签署战略合作协议,探索具身智能与多模态大模型融合。将聚焦新零售等场景,推进数据标准与评测体系搭建等。智元有三大机器人家族,阶跃星辰已发布大模型矩阵。#智元机器人 #阶跃星辰 #战略合作
3/13/2025 3:17:21 PM
浩渺
华为昇腾适配阶跃星辰Step-Video和Step-Audio开源大模型,上线魔乐社区
今日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。 开发者和企业用户在魔乐社区中可以直接下载并体验。 Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。
3/10/2025 3:10:00 PM
新闻助手
华为昇腾适配阶跃星辰多模态开源模型
据科创板日报报道,今日魔乐社区(Modelers)上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。
3/10/2025 2:47:58 PM
远洋
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
2025 年 2 月 21 日,阶跃在上海迎来了首届 Step UP 生态开放日。 活动中,阶跃重点介绍了其在智能终端 Agent 领域的战略布局,同时汇聚了吉利汽车集团、OPPO、智元机器人等行业巨头,共同见证了大模型技术在智能终端 Agent、金融财经、内容创作、新零售和数字人等领域的强大赋能与创新实践。 此外,阶跃星辰还发布了「繁星计划」二期,旨在从模型优化、算力支持、资本投入、数据共享和企业孵化等方面为开发者提供全方位赋能,激发更多 Agent 应用创新。
2/25/2025 4:00:00 PM
郑佳美
阶跃星辰举办首届生态开放日,智能终端 Agent 成为焦点
日前,阶跃星辰在上海成功举办了首届 Step UP 生态开放日。 此次活动汇聚了来自各行各业的重量级合作伙伴,共同展示了基于大模型技术的丰富应用场景和创新体验。 阶跃星辰 CEO 姜大昕在开幕致辞中强调,智能终端 Agent 是大模型技术落地的重要突破点,未来将重点布局汽车、手机、具身智能和 IoT 等核心应用场景。
2/24/2025 11:51:00 AM
AI在线
接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型
两款 Step 系列开源多模态大模型,性能位列开源多模态全行业第一。 本周二,国内 AI 创业公司阶跃星辰和吉利汽车集团宣布联合开源两款多模态大模型。 这两款大模型分别是视频生成模型 Step-Video-T2V 和行业内首款产品级开源语音交互模型 Step-Audio。
2/18/2025 12:45:00 PM
机器之心
阶跃星辰联合吉利首次开源 Step 系列多模态大模型,包含视频、语音两款模型
今日阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款 Step 系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃 Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃 Step-Audio。
2/18/2025 10:14:49 AM
远洋
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
Meta 被指控盗用 2000 余部成人影片训练 AI,或面临 3.5 亿美元天价赔偿
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
OpenAI 董事会主席:如果你想快速烧掉百万美元,就开发自己的 AI 模型吧
AI和云基础设施初创企业E2B如何成为88%的财富100强企业的必备选择
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用