AI在线 AI在线

AI编程

OpenAI最新基准测试:AI编程能力达人类四分之一,显现局限性

OpenAI近日发布了一项重要的AI编程能力评估报告,通过价值100万美元的实际开发项目揭示了AI在软件开发领域的现状。 这项名为SWE-Lancer的基准测试涵盖了1,400个来自Upwork的真实项目,全面评估AI在直接开发和项目管理两大领域的表现。 测试结果显示,表现最佳的AI模型Claude3.5Sonnet在编码任务中的成功率为26.2%,在项目管理决策方面达到44.9%。
2/20/2025 10:37:00 AM
AI在线

AI编程初创公司Codeium正进行新一轮融资 估值28.5亿美元

近期,AI 编程初创公司 Codeium 正在进行新一轮融资,估值接近28.5亿美元。 据知情人士透露,此轮融资由投资机构 Kleiner Perkins 领投,时隔六个月,Codeium 又一次吸引了投资者的关注。 值得注意的是,在刚刚过去的六个月中,Codeium 完成了一轮1.5亿美元的 C 轮融资,融资后估值为12.5亿美元。
2/20/2025 9:43:00 AM
AI在线

字节跳动 AI 中文 IDE“Trae”已支持 Windows 系统,内置 GPT-4o 免费使用

Trae 由字节跳动旗下新加坡公司 SPRING PTE 提供服务,支持 AI 问答、代码自动补全、基于 Agent 的 AI 编程等功能,可以帮助程序员自动化完成开发任务,并在一些项目中可以实现端到端开发,用户提问后能够直接生成完整的代码项目。
2/17/2025 11:05:27 AM
汪淼

微软官宣 All in 智能体、Copilot SWE Agent 首曝光,阿尔特曼预警 2025 编程巨变

2025 年,软件工程要彻底变天了。先有奥特曼预言,后有微软下场 All in 智能体。刚刚,首个自主 SWE 智能体面世,不仅会主动改 bug 修复错误,还能自主提交 PR 评论。
2/7/2025 1:47:29 PM
汪淼

OpenAI 投的代码工具 Cursor“叛变”了:默认使用 Claude,程序员叫好

我们尝试注册新账号、新安装不修改任何设置,第一次唤出代码补全,就是 Claude-3.5-Sonnet 来接待。
8/15/2024 3:09:43 PM
汪淼