AI在线 AI在线

阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview

阶跃星辰昨日(1 月 16 日)宣布,自研推理模型 Step Reasoner mini(简称 Step R-mini )上线。
感谢阶跃星辰昨日(1 月 16 日)宣布,自研推理模型 Step Reasoner mini(简称 Step R-mini )上线。

官方表示,在 AIME 和 Math 等数学基准测试上,Step Reasoner mini 的成绩超过了 o1-preview,比肩 OpenAI o1-mini。在 LiveCodeBench 代码任务上,也比 o1-preview 效果更佳。

阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview

Step Reasoner mini 通过大规模的强化学习训练,并使用 On-Policy(同策略)强化学习算法,实现了“文理兼修”。Step Reasoner mini 除了能准确解答数学、代码、逻辑推理问题,还能富有创意地完成文学内容创作和日常聊天的任务。

阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview

AI在线附体验链接:https://yuewen.cn

阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview

相关资讯

告别微软,姜大昕带领这支精英团队攀登Scaling Law,万亿参数模型已有预览版

攀登 Scaling Law,打造万亿参数大模型,前微软 NLP 大牛姜大昕披露创业路线图。前段时间,OpenAI 科学家 Jason Wei 的一份作息时间表引发了广泛关注。表中有很多让人看了会心一笑的梗,比如「9 点 45:背诵 OpenAI 章程,向最优化的神祷告,学习《苦涩的教训》」「10 点用 Google Meet 开会,讨论怎么在更多数据上训练更大的模型」「11 点写代码,用来在更多数据上训练更大的模型」「1 点:实操,在更多数据上训练更大的模型」「4 点:对用更多数据训练的更大的模型进行提示工程」…
4/1/2024 3:05:00 PM
机器之心

揭秘:阶跃星辰万亿MoE+多模态大模型矩阵亮相

在 2024 年世界人工智能大会的现场,很多人在一个展台前排队,只为让 AI 大模型给自己在天庭「安排」一个差事。具体流程是这样的:首先, AI 会管你要一张个人照片,并参考《大闹天宫》画风生成你在仙界的形象照。接下来,它会引导你进入一个交互式的剧情选择和交谈环节(其实是 AI 大模型自己编的剧情),然后根据你的选择和回答评估出你的 MBTI 人格类型,并根据这个类型为你在天庭「安排」一个差事。 当然,除了现场排队,你还可以在线体验(扫描下方二维码即可)。这是大模型创业公司阶跃星辰与上影合作的 AI 互动体验《AI
7/4/2024 6:29:00 PM
机器之心

国行 iPhone 16 相机控制也接入视觉智能了!可一键调用阶跃星辰智能助手「跃问」

国内 iPhone 16 用户终于也能通过相机控制键调用视觉智能功能了,这意味着这一代苹果新机主打的 Apple 智能(Apple Intelligence)不再只是空话。 今年 iPhone 16 发布时,最令国内果粉遗憾的就是目前海外版 Apple 智能接入了 OpenAI 的能力,国内用户暂时无法体验和使用。 11 月 18 日消息,国内头部大模型创业公司阶跃星辰旗下产品「跃问」,已经将其智能视觉搜索功能「拍照问」接入了 iPhone 16 相机控制按钮,支持用户一键调用。
11/18/2024 6:26:00 PM
我在思考中
  • 1