AI在线 AI在线

代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

最强开源深度研究模型来了。 MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。 首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。

最强开源深度研究模型来了。

MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。

首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。

图片

其次,它是真·全开源可复现,它的核心模型、数据、训练流程、AI Infra、DR Agent框架统统开源。

图片

而据代季峰的朋友圈透露,他们将保持每月一次开源的更新速度。而这个项目是他们团队经过一个季度的努力而实现的。

从他们提供的演示来看,似乎都是在手机端上进行,因此不排除之后他们在手机端部署的可能性。

目前,他们还开放了Demo可以体验。

图片

最强开源深度研究模型

在Demo体验区有这样一句介绍,我们不提供AI(我们只是AI的搬运工),我们与您共同构建它。

图片

好好好,说回到这个项目体验,目前它还属于比较早期,仅支持单轮次、且英文的对话输入。

图片

随便选一个推荐问题上去,能够看到,它的思考过程和最终结果有很明显的分区。

思考过程左侧还有工作流的导览指引,你可以选择指定的节点进行查看。

图片

过程中能够看到它支持联网搜索的。

图片

最后的结果呈现得也比较清晰。

图片

与现有的深度研究方法相比,MiroMind ODR项目开放了深度研究的各个阶段,包括四个子项目:

MiroFlow(Agent框架)、MiroThinker(模型)、MiroVerse(数据)和MiroTrain(训练基础设施)。

图片

MiroFlow,支持多种主流工具调用,扩展大语言模型,支持工具辅助的深度研究推理。它的亮点在于可以稳定复现最强性能,也就是GAIA上82.4的成绩。

MiroThinker,原生支持工具辅助推理的大语言模型,可训练、可复现,在 GAIA 中表现最佳。

此外,它在GAIA-Text-103上取得了SOTA性能(60.2%),接近 OpenAI Deep Research。

图片

MiroVerse,147K开源训练数据支持深度研究训练。此外团队还会关注社区反馈,每月持续提供高质量、深入的研究数据集。

MiroTrain,支持深度研究模型的稳定高效训练,覆盖整个Deep Research训练流程,支持长文本训练和RL训练工具。

不过除了这个项目之外,在GitHub上还看到了他们几周之前的成果MiroMind-M1。

MiroMind-M1是一系列基于Qwen-2.5 完全开源推理语言模型,专注于提升数学推理能力。

该模型通过监督式微调(SFT)在 719K 个精心筛选的问题集上进行训练,并采用可验证奖励的强化学习(RLVR)在 62K 个具有挑战性的示例上进行优化,使用了基于上下文的多阶段策略优化方法(CAMPO)。

在AIME24、AIME25和MATH500上,在基于7B Qwen-2.5的开源模型中取得了最佳性能。

图片

代季峰加盟盛大后首秀

这个项目中的核心人物,自然是代季峰这位大牛。

个人网站上依旧显示其清华大学电子工程系副教授岗位。

图片

公开信息显示,代季峰在计算机视觉、深度学习领域发表国际期刊、会议文章80余篇,论文总引用6万余次。

图片

他是R-FCN物体检测算法和Deformable ConvNets的作者。R-FCN被评价为“三大目标检测元模型之一”;而研发的Deformable ConvNets,性能超越微软、Meta、谷歌等机构的视觉大模型

他主导开发的InternVL多模态基础模型,是最具影响力的开源多模态基础模型之一,被广泛应用于工业界和学术界,Hugging Face下载量超过1千万次。

图片

2009年和2014年于清华大学自动化系分别获得工学学士和博士学位。

随后微软亚洲研究院视觉组工作,担任首席研究员、研究经理。

2019年来到商汤的研究院工作,担任执行研究总监。直到2022年选择回归学界担任副教授。

这次选择再次出山,是为AGI而来。

据科创板日报消息,他加盟陈天桥旗下的盛大网络,正筹备一家新的AI创业公司,目标是打造第二个DeepSeek,将围绕AGI展开基础性研究。

这个公司有三个研发重点:AI商业决策智能化、突破算法茧房的内容分发,以及面向老龄化和青年发展的AI服务。

不过从MiroMind官网上也能看到出一些端倪,他们的使命是我们正在打造具备自我意识的数字生命体,与社区共同进化,以实现安全、有益的AGI惠及所有人。

图片

所以,此次MiroMind ODR既是MiroMind的正式亮相,同样也是代季峰面向AGI的技术首秀。

Blog: https://miromind.ai/blog/miromind-open-deep-research

Demo: https://dr.miromind.ai/

GitHub: https://github.com/MiroMindAI

Hugging Face: https://huggingface.co/miromind-ai

相关资讯

追平满血版o1的国产多模态模型终于来了!训练细节全部公开

春节前最后一周,能媲美 Open AI 满血版 o1(Full Version,而非 preview)的模型终于出现了! 刚刚,月之暗面公布了他们的 Kimi k 系列模型最新版本 ——k1.5 多模态思考模型。 新模型在数学、代码、多模态推理能力等方面全面对标 Open AI 满血版 o1,而且是 OpenAI 之外首个多模态 o1。
1/21/2025 8:00:00 AM
机器之心

Anthropic CEO惊人预警:27年AI超越人类!Claude今年更新全剧透

失踪人口终于回归了! 在互联网消失一段时间后,Anthropic首席执行官Dario Amodei一上来就接受了WSJ、CNBC两家采访,连曝AI大瓜。 他坚定地认为,「2027年之前,AI完全可以超越人类智能!
1/23/2025 9:00:00 AM
新智元

中国AI太强,Meta工程师吓疯?自曝疯狂熬夜复制DeepSeek,天价高管心虚了

今天,Meta员工在匿名社区TeamBlind上的一个帖子,在业内被传疯了。 DeepSeek,真实地给了美国人亿点点「震撼」。 DeepSeek R1是世界上首个与OpenAI o1比肩的AI模型,而且与o1不同, R1还是开源模型「Open Source Model」,比OpenAI还Open!更有人曝料,DeepSeek还只是个「副项目」,主业根本不是搞大模型!
1/24/2025 1:20:00 PM
新智元
  • 1