AI在线 AI在线

DeepSWE 开源 AI Agent系统强势登顶,基于 Qwen3-32B

在人工智能领域,又一重磅消息传来。 今天凌晨,知名大模型训练平台 Together.ai 与 Agentica 联合推出了开源 AI Agent框架 DeepSWE。 这一创新系统是基于阿里最新开源的 Qwen3-32B 模型,完全通过强化学习进行训练。

在人工智能领域,又一重磅消息传来。今天凌晨,知名大模型训练平台 Together.ai 与 Agentica 联合推出了开源 AI Agent框架 DeepSWE。这一创新系统是基于阿里最新开源的 Qwen3-32B 模型,完全通过强化学习进行训练。

DeepSWE 的开源信息可在 Hugging Face 上获取,除了模型权重外,训练方法、日志和数据集等所有相关内容也一并公开,旨在帮助开发者更深入地学习和改进这一代理系统。

image.png

根据 SWE-Bench-Verified 测试结果,DeepSWE 在64k 的最大上下文长度和100的最大环境步骤下评估,经过16次运行,Pass@1准确率达到了42.2%。经过混合测试后,其性能更是提升至59%,使其在所有开源代理框架中位列榜首。

DeepSWE 的训练采用了 rLLM 框架,这是一个专门用于语言智能体后期训练的系统。它在64个 H100GPU 上,对来自 R2E-Gym 训练环境的4500个真实世界软件工程任务进行了为期6天的训练。这些任务包括解决 GitHub 问题、实现新代码功能和调试等,展示了现实世界软件工程的多样性。

在训练过程中,DeepSWE 通过与环境的互动,学习如何在广泛的代码库中进行浏览、针对性编辑代码、运行构建和测试的 shell 命令,并在处理实际拉取请求时优化解决方案。数据集管理方面,使用了 R2E-Gym 子集中的4500个问题,确保了训练数据的纯净性和相关性。

训练环境围绕 R2E-Gym 构建,支持可扩展的高质量可执行软件工程环境。奖励机制则采用稀疏结果奖励模型,只有当生成的补丁通过所有测试时才给予正奖励,促进了更有效的学习。

DeepSWE 的训练还采用了改进版的 GRPO++ 算法,通过整合多项创新,实现了更稳定和高效的训练过程。此外,研究人员还发现,在针对软件工程任务时,增加输出 token 数量的效果不明显,而通过滚动数量扩展则显著提升了模型性能。

这一系列的努力,使得 DeepSWE 成为了一款极具潜力的 AI 代理系统,推动了强化学习在实际应用中的进步。

开源地址:https://huggingface.co/agentica-org/DeepSWE-Preview

划重点:

🌟 DeepSWE 是基于 Qwen3-32B 模型,完全通过强化学习训练而成,开源信息已全面发布。  

🏆 在 SWE-Bench-Verified 测试中,DeepSWE 表现出色,Pass@1准确率达到了59%,成为所有开源代理中的佼佼者。  

💡 采用了 rLLM 框架和改进的 GRPO++ 算法,DeepSWE 在实际软件工程任务中展现了其强大的学习能力和应用潜力。  

相关资讯

Qwen3正式确认本周发布,阿里云AI新篇章即将开启

阿里云Qwen团队通过社交平台正式确认,Qwen3系列模型将于本周内发布,标志着其旗舰大语言模型(LLM)与多模态能力的又一次重大升级。 据AIbase了解,Qwen3将推出包括0.6B、4B、8B、30B-A3B在内的多种模型规模,支持高达256K的上下文长度,涵盖推理与非推理任务。 社交平台上的热烈讨论凸显了其全球影响力,相关细节已通过Hugging Face与Qwen官网逐步公开。
4/28/2025 6:00:40 PM
AI在线

阿里通义千问 Qwen3 系列模型有望今日发布,支持 256K 上下文长度

阿里通义千问Qwen3系列模型今日发布,包括Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,支持高达256K的上下文长度。#AI模型##开源技术#
4/28/2025 8:18:40 PM
远洋

Qwen3正式发布,优化编码与代理能力,强化MCP支持引领AI新潮流

阿里云Qwen团队宣布Qwen3系列模型正式发布,以卓越的编码能力、增强的代理功能和对Model Context Protocol(MCP)的深度支持,掀起AI社区热潮。 据AIbase了解,Qwen3涵盖从0.6B到235B-A22B的多种模型规模,优化了数学推理、代码生成和多模态任务,性能直追GPT-4o与Gemini-2.5-Pro。 社交平台上的讨论显示,Qwen3的MCP集成与开源策略备受期待,相关细节已通过Hugging Face与Qwen官网公开。
4/29/2025 9:00:40 AM
AI在线
  • 1