AI在线 AI在线

理论

OpenAI发布代码Agent:开启自动化编程时代,超强智能体!

OpenAI在官网发布了一个全新基于云端的代码Agent——Codex。 Codex可以为开发人员自动执行多种任务,例如,编写功能代码、回答有关代码库的问题、修复错误以及提出拉取请求审查等;每个任务都在自己的云端沙盒环境中运行,同时能预加载用户的代码库。 据悉,Codex由Codex-1模型提供支持,这是OpenAI-o3的一个微调版本,专门针对软件工程进行了优化。
5/19/2025 9:10:00 AM

字节发布 Seed1.5-VL 视觉-语言多模态大模型,20B 参数狂揽 60 项公开评测基准中 38 项 SOTA!

5 月 13 日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了 5 款模型和产品,包括豆包・视频生成模型 Seedance 1.0 lite、升级后的豆包 1.5・视觉深度思考模型,以及新版豆包・音乐模型。 同时,Data Agent 和 Trae 等产品也有了新进展。 今天给大家介绍的是Seed 1.5-VL,相比于之前版本,Seed1.5-VL 具备更强的通用多模态理解和推理能力,不仅视觉定位和推理更快更准,还新增了视频理解、多模态智能体能力。
5/19/2025 9:07:00 AM

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

天下苦大模型矩阵乘法久矣。 毕竟不论是训练还是推理过程,矩阵乘法作为最主要的计算操作之一,往往都需要消耗大量的算力。 那么就没有一种更“快、好、省”的方法来搞这事儿吗?
5/19/2025 9:05:00 AM

打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙,堪比AlphaGo“神之一手”

数学能力几乎和AlphaGo的围棋水平一样? ! 这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了「通用科学人工智能」AlphaEvolve,直接打破了矩阵乘法领域56年以来的效率基准。
5/19/2025 9:02:00 AM

硅谷60万亿终极野心!AI取代所有人类工作,拿走全部工资!

硅谷的终极野心是什么? 答案是用AI和机器人取代所有人的工作。 然后,拿走所有的工资!
5/19/2025 9:00:00 AM

最新!OpenAI:GPT-5将实现大统一,Codex最佳实践是这样的

Codex发布后,OpenAI Codex在Reddit举行了AMA(Ask Me Anything)活动在这场 1 小时的 AMA 中,Codex 核心研发和研究负责人围绕 :为什么先推云端代理、CLI 为何用 TypeScript、未来多语言绑定与 IDE 插件、GPT-5 与 Operator 的整合、定价与 API 计划、安全沙箱、最佳实践 等问题给出了清晰路线图:Codex-1 目前是「云端沙箱 ChatGPT 原生入口」的研究预览,面向大仓库 测试驱动工作流效果最佳;CLI 走开源 API 计费,本体将在 Plus/Pro 长期集成并提供“弹性”付费;短期不会给代理外网,但已支持 --approval-mode full-auto;他们希望 10 年内实现“按规格即可落地可靠软件”,并把 Codex、Operator、Deep Research、Memory 等工具融合为一套完整代理体系详细 Q&ACodex产品定位与长期愿景1 .为什么先做云端本地 CLI 因单机算力与线程受限,只适合轻量任务;云端可并行跑多个容器并隔离风险,是先发形态10 年愿景:给出“合理规格说明”即可在可观时间内得到可靠软件;云端并行 沙箱是实现路径。 2 .GPT-5 与 Codex、Operator 等工具是什么关系?
5/19/2025 8:58:00 AM

Llama 4万亿巨兽延期,80%核心元老集体辞职?

Llama 4团队约80%的人集体辞职? 昨天,来自AI明星初创Prime Intellect的机器学习研究员一则惊天爆料,彻底点燃了AI圈。 就连WSJ几天前的独家报道,也被人们翻了出来。
5/19/2025 8:57:00 AM

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

大概5天前,ChatGPT「悄悄」上线了一个新功能,就是Deep Research功能可以直连Github仓库。 这个功能刚推出时,第一反应是给程序员用的,但是最近使用后才发现这个功能非常强大——应用场景远比想象的更加广阔。 不仅仅是审查代码,或者生成报告,能够连接Github的ChatGPT在重度使用后,效果还是超乎想象的——几乎可以进行任何方向的深度研究。
5/19/2025 8:55:00 AM

十张图带您极简认识 MCP「可视化指南」

图片简单来说,MCP 就像 AI 应用的 USB-C 端口。 一句话通俗解释:MCP就像是一个“超级连接器”,可以看作强大的拓展坞,能让聊天机器人和外面的各种数据(比如数据库、文件等)轻松“牵手”,让它们更好地一起工作,就像让机器人有了更多“知识库”和“工具箱”。 正如 USB-C 提供了一种将设备连接到各种配件的标准化方式一样,MCP 也标准化了AI 应用程序连接到不同数据源和工具的方式。
5/19/2025 8:50:34 AM
猫先生

通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API

强化学习(RL) 真实搜索引擎,可以有效提升大模型检索-推理能力。 但问题来了:一方面,搜索引擎返回的文档质量难以预测,给训练过程带来了噪音和不稳定性。 另一方面,RL训练需要频繁部署,会产生大量API开销,严重限制可扩展性。
5/19/2025 8:47:00 AM

大模型再现黑马!英伟达开源Llama-Nemotron系列模型,效果优于DeepSeek-R1

近日,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型构建)—— 一个面向高效推理的大模型开放家族,具备卓越的推理能力、推理效率,并采用对企业友好的开放许可方式。 该系列包括三个模型规模:Nano(8B)、Super(49B)与 Ultra(253B),另有独立变体 UltraLong(8B,支持超长上下文)。 这些模型不仅具备超强的推理能力,还为企业使用提供开放许可。
5/19/2025 8:41:00 AM

RAG架构综述:探寻最适配RAG方案

RAG技术通过整合外部知识源检索与模型生成能力,使语言模型能够基于真实世界的信息生成更准确、可靠的回答。 如今,RAG技术不断演进,衍生出了多种各具特色的架构类型,每种都针对特定场景和需求进行了优化。 深入了解这些不同类型的RAG架构,对于开发者、数据科学家以及AI爱好者而言至关重要,能够帮助他们在项目中做出更合适的技术选型,充分发挥RAG的优势。
5/19/2025 8:26:37 AM
大模型之路

玩转MCP第一弹|手把手教你将 Figma 设计稿转化为前端代码

明明听说 Trae 的 的模型上下文协议(MCP) 功能超实用,却陷入 “不知从何下手” 的迷茫? 别担心! 我们将开启 “玩转 MCP” 的系列内容,手把手教你使用 Trae IDE 借助 MCP 轻松实现多样化的开发需求!
5/19/2025 2:00:00 AM

AI遭遇生产力和营收困境,“索洛悖论”正在重演?

当全球都在热议AI时,其营收与生产力价值仍待兑现! 诺贝尔奖得主罗伯特・索洛(Robert Solow)曾提出一个计算机悖论:“你能在任何地方看到计算机的影响,唯独在生产力数据上看不到。 ”如今,这一困境正映射在AI领域——我们目睹AI技术渗透至生活各个角落,却尚未在生产力层面看到实质爆发。
5/19/2025 1:00:00 AM
小刀

Cursor 0.5 重大更新:七大新特性全面解读

近日,知名 AI 编码工具 Cursor 正式发布了 0.5 版本更新,推出了一系列值得关注的新功能。 这些改进不仅提高了开发体验,更进一步推动了 Cursor 在 AI 编码工具领域的领先地位。 接下来,将全面介绍 Cursor 0.5 版本带来的七项重要功能更新:如何更新到最新版本首先,打开 Cursor IDE 后,可在屏幕左下角看到更新提示。
5/19/2025 12:06:00 AM
前端小智

AI神论文一夜“塌房”!诺奖得主被骗,MIT紧急撤稿

没想到,AI圈的“瓜田”能精彩到这个地步。 一篇曾被寄予厚望、甚至让诺奖得主都“赞不绝口”的AI研究论文,现在被它亲妈 MIT(麻省理工学院)紧急撤稿! 图注:那篇论文的封面这事儿的主角,是一篇名为《人工智能、科学发现与产品创新》(Artificial Intelligence, Scientific Discovery, and Product Innovation)的论文,作者是MIT经济系的博士生艾丹·托纳-罗杰斯(Aidan Toner-Rodgers)。
5/19/2025 12:00:06 AM
文摘菌

编程革命彻底爆发!刚刚,OpenAI最强智能体上线ChatGPT

从今天起,AI编程正式开启新时代! 刚刚,Greg Brockman带队与OpenAI六人团队开启线上直播,震撼发布了一款云端AI编程智能体——Codex。 用奥特曼的话来说就是,一个人就能打造无数爆款应用的时代来了!
5/17/2025 8:55:41 AM
新智元

刚刚,OpenAI丢出最强编程智能体Codex!倒反天罡——新上线功能竟是微软Copilotb鼻祖?

OpenAI在本周末尾丢出重磅炸弹! 新的AI编程智能体Codex的研究预览版现身。 这是该OpenAI迄今为止最强大的AI编程代理,不夸张地说,这就是雇佣最会编程的AI来帮助我们敲代码。
5/17/2025 8:39:52 AM
伊风