AI在线 AI在线

理论

奥特曼:Codex 让我感到 AGI!最新谈话罕见透露下一代“完美模型”,大胆预测 Agent 明年突破边界!

编辑 |伊风、云昭出品 | 51CTO技术栈(微信号:blog51cto)不知道大家有没有发现:今年的奥特曼,突然安静了很多。 不像 24 年那样频繁出现在各种技术播客、大会、访谈里,甚至好多次OpenAI新发布也不见他的身影——这位 AI 圈最活跃的“CEO 网红”,仿佛一下子就开启带娃模式、退居幕后了。 可偏偏,在这个 AI产品、Agent、大模型都在飞速迭代的时间点,我们又特别想知道他最近在想什么。
6/5/2025 2:32:41 PM
伊风

1步碾压250步!何恺明新作祭出MeanFlow,一行公式让 FID 狂降近 70%

2025 年 5 月的一篇论文中,何恺明与 CMU、MIT 联合团队提出了一种全新的一步生成框架 MeanFlow。 图片论文标题是:《Mean Flows for One-step Generative Modeling》。 从论文的实验曲线来看,只跑1 步,图像质量居然能甩开跑 250 步的老牌扩散模型(2021 年前后的经典扩散模型,如 ADM)。
6/5/2025 1:35:33 PM
文摘菌

被疯传的“恶趣味”:看Copilot这款“熊孩子”把微软工程师逼疯!Agent 刚上线就翻车?网友:微软工程师成了“人肉保姆”

作者 | Dylan Cooper编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)最近,GitHub Copilot 又“整活儿”了。 Reddit 上一位网友发帖调侃:“我最近迷上了一个新爱好:看 AI 一点点把微软员工逼疯。 ”这不是段子,而是对微软 .NET 仓库里一连串尴尬 PR(Pull Request,拉取请求)的讽刺。
6/5/2025 1:16:22 PM
云昭

CVPR2025|不改U-Net也能提升生成力!MaskUNet用掩码玩转扩散模型

一眼概览MaskUNet 提出了一种基于可学习掩码的参数筛选机制,在不更新预训练U-Net参数的前提下,有效提升了扩散模型的图像生成质量和下游泛化能力。 核心问题当前扩散模型在不同时间步使用相同U-Net参数生成结构和纹理信息,限制了模型的表达灵活性。 该研究聚焦于:如何在不更改预训练U-Net的参数下,提升其对不同时间步和样本的适应性,以生成更高质量的图像?
6/5/2025 11:52:27 AM
萍哥学AI

NVIDIA 新成果:ProRL 拓展 LLM 推理边界

大家好,我是肆〇柒。 本文想和大家分享一篇来自 NVIDIA 研究团队的前沿论文——《ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models》。 这篇论文挑战了强化学习在大型语言模型(LLM)中作用的传统认知,还提出了一种创新的训练方法 ProRL,通过长时间的强化学习训练,显著提升了模型的推理能力。
6/5/2025 11:51:14 AM
肆零柒

OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算

OpenAI 发论文的频率是越来越低了。 如果你看到了一份来自 OpenAI 的新 PDF 文件,那多半也是新模型的系统卡或相关增补文件或基准测试,很少有新的研究论文。 至于原因嘛,让该公司自家的 ChatGPT 来说吧:「截至目前,OpenAI 在 2025 年在 arXiv 上公开发布的论文数量相对较少,可能反映了其对研究成果公开策略的谨慎态度,可能出于商业保密或安全考虑。
6/5/2025 11:49:59 AM

ACL 2025 | 基于Token预算感知的大模型高效推理技术

本位作者分别来自南京大学,罗格斯大学和马萨诸塞大学阿默斯特分校。 第一作者韩廷旭与共同第一作者王震霆是分别来自南京大学和罗格斯大学的博士生,研究方向聚焦于大模型推理以及安全负责任的生成式人工智能。 通讯作者为南京大学房春荣教授。
6/5/2025 11:49:21 AM

使用Claude 4提升程序员生产力的五种高级方式

译者 | 布加迪审校 | 重楼Anthropic的最新AI模型Claude 4在开发社区大行其道。 许多程序员称赞它是目前最好的编程模型,能够在短短几分钟内解决困扰一整年的编程难题,这是了不起的成就。 我们在本文中将探讨将Claude 4集成到工作流程中以提升生产力的五种有效方法。
6/5/2025 9:55:08 AM
布加迪

OpenAI深夜宣布ChatGPT支持MCP、会议记录,万物互联时代来了!

今天凌晨1点,OpenAI开始技术直播对ChatGPT进行了重大更新,包括向macOS用户推出ChatGPT会议记录模式,可以转录任何会议、头脑风暴或语音笔记,并快速提取要点然后转化为新的内容。 另外一个重要功能就是ChatGPT正式支持MCP协议,例如,直接连接Github、SharePoint、Gmail、Dropbox、Box、Outlook等常用工具,实现跨平台数据整合、搜索和推理。 简单来说,OpenAI希望把ChatGPT打造成智能协作平台,在一个地方就把所有事情都做了。
6/5/2025 9:21:10 AM

配合OpenAI搞数据垄断,排挤Anthropic?Reddit撕破脸:赔钱!网友:互联网还没死!AGI太快这官司打完早没意义了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)6月5日凌晨,就在WindSurf被Claude“断供”的消息传出来的第二天,Anthropic后院着火了。 这次的主角是大家熟悉的社交讨论平台Reddit。 Reddit在正式起诉Anthropic的文件中称,后者其在未经许可的情况下,大规模抓取Reddit公共内容,涉嫌侵犯版权。
6/5/2025 9:20:03 AM
云昭

AI+数字经济的核心三要素

前几天和一位互联网老兵聊天,他说:"现在的数字经济就像当年的工业革命,你看不见摸不着,但它正在重新定义一切。 "这话听起来有点玄乎,但仔细想想,确实如此。 你知道吗?
6/5/2025 9:19:46 AM
大数据AI智能圈

人工智能和知识图谱五:著名的开源和商业知识图谱工具

一、开源工具RDFLib:RDFLib是一个用于处理RDF的纯Python库。 它被开发人员广泛用于中小型项目或数据科学领域。 RDFLib允许您创建图表、解析RDF文件(Turtle、XML等)以及执行SPARQL查询(它有一个基于Python的SPARQL1.1引擎)。
6/5/2025 9:09:50 AM
晓晓

奥特曼:假如给我一千倍算力,我会这样做

完美的人工智能是“一个拥有超人推理能力、1万亿个上下文标记并可以使用你能想到的所有工具的微型模型”。 这是奥特曼在最新的访谈中对下一代模型的展望。 他表示,理想中的AGI不需要包含知识——只需要思考、搜索、模拟和解决任何问题的能力。
6/5/2025 9:09:00 AM

陶哲轩再爆:一个月三破18年未解难题!AlphaEvolve彻底改写数学研究规则

数学界再次见证奇迹! 一项沉睡了18年的难题,在一个月内竟被AI与人类联手三度突破! 每一次都将我们对可能性的认知推向新高。
6/5/2025 9:06:00 AM

深度研究白菜化?谷歌将Gemini级AI研究能力开源

谷歌太良心了,推出"gemini-fullstack-langgraph-quickstart"的开源项目,这个项目用Gemini 2.5模型与LangGraph框架的结合,主打快速构建一个能够本地运行的自主进行深度研究的智能代理系统目前github已经飙升到3.5k星了,地址:"研究型AI代理",能够像人类研究员一样工作:它会根据用户的问题动态生成搜索关键词,通过Google搜索获取信息,分析结果中的知识空白,然后迭代地优化搜索策略,最终提供有充分引用支持的答案技术架构:前后端分离的现代设计前端:React与现代开发体验项目采用了React配合Vite构建工具的前端架构。 Vite的选择体现了对开发效率的重视——它提供了极快的热重载功能,让开发者能够实时看到代码改动的效果。 这种即时反馈对于调试复杂的AI交互界面特别重要,因为你需要频繁测试不同的用户输入场景后端:LangGraph的强大编排能力后端使用了LangGraph框架,这是一个专门为构建复杂AI工作流而设计的工具。
6/5/2025 9:05:36 AM

10步优化超越强化学习,仅需1条未标注数据!后训练强势破局

在具备强大的通用性能之后,当下大模型的研究方向已经转向了「如何解决特定且复杂的推理任务」,比如数学问题、分析物理现象或是构建编程逻辑。 要想达到更高的性能,除了海量文本的预训练之外,往往还需要进一步的后训练。 主流后训练方法是采用强化学习(RL),特别是结合可验证奖励的强化学习(RLVR)。
6/5/2025 9:05:00 AM

Andrej Karpathy最新暴论:这类软件正走向绝境,PS首当其冲?

Andrej Karpathy最新观点,觉得很有意思,分享给大家Karpathy 认为在人机协作日益紧密的时代,那些拥有复杂用户界面(UI)、充斥着大量滑块、开关、菜单,却缺乏脚本支持,并且建立在不透明、自定义二进制格式之上的软件产品,其前景堪忧Karpathy 的核心观点是,如果大型语言模型(LLM)无法读取软件的底层数据表示,也无法通过脚本来操作相关的设置和功能,那么这款产品就很难实现与专业人士的智能协同(AI Co-pilot),更无法赋能给数量庞大十倍、富有创造力的“产消者”(prosumers),让他们通过更接近自然语言的“氛围编程”(vibe coding)方式来驾驭产品他列举了不同风险等级的软件产品:高风险区:几乎所有的 Adobe 产品、数字音频工作站(DAWs)、CAD/3D建模软件。 这些产品严重依赖不透明的二进制对象或自定义文件格式,缺乏文本化的领域特定语言(DSL)支持。 AI难以理解其内部结构,更不用说进行编程控制中高风险区:Blender、Unity。
6/5/2025 9:03:39 AM

爆火AI编程Windsurf突遭Claude全面断供,开发者大量退订!直接打脸OpenAI

即将抱上OpenAI这条大腿的Windsurf,高兴早了! 刚刚,AI编程工具Windsurf的联创兼CEO Varun Mohan发文称,Anthropic几乎没有提前通知,就大幅减少了Windsurf对Claude 3.5和3.7 Sonnet模型的服务配额。 由于事先毫无预警,Windsurf只能紧急启用第三方推理服务来维持Claude模型的使用,但短期内用户体验势必受到影响。
6/5/2025 8:58:00 AM