AI在线 AI在线

AI

OpenAI 最强模型 GPT-5 即将面世:性能跃升,对抗 Gemini 2.5 Pro 和 Claude 4 的杀手锏

在墨西哥举办的 AI Summit 峰会上,两名 OpenAI 公司代表透露,公司正在开发下一代基础模型 GPT-5,并计划通过该模型与竞争对手展开更激烈角逐。
6/4/2025 6:52:14 AM
故渊

OpenAI 向 ChatGPT 免费用户开放记忆功能

OpenAI 昨日(6 月 3 日)更新支持文档,宣布升级 ChatGPT 的记忆功能(Memory),并免费向 ChatGPT 用户开放,从而能更好地保存和引用用户过去的对话内容。
6/4/2025 6:41:11 AM
故渊

OpenAI 首席执行官奥尔特曼:AI 智能体冲击基层员工,职场变革加速

在 Snowflake Summit 2025 主题演讲中,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)表示,很多公司已将 AI 智能体(自主运行执行复杂任务的程序)当作基层员工使用。
6/4/2025 6:31:10 AM
故渊

OpenAI 更新编程工具 Codex:新增语音输入 + 联网,向 ChatGPT Plus 用户开放

OpenAI 今天(6 月 4 日)宣布升级其编程工具 Codex,在向 ChatGPT Plus 用户开放之外,还新增联网能力,让 Codex 在执行任务时访问互联网(附带安全限制)。
6/4/2025 6:18:53 AM
故渊

Karpathy教你值回ChatGPT 200刀「票价」,初创工程师揭秘ChatGPT最核心能力

ChatGPT你肯定已经用过,也用的很「爽」,但你的使用方法大概率是不对的! 别急,这是OpenAI初创大神Andrej Karpathy说的,「热衷于」科普AI的他再度出手。 这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型!
6/4/2025 4:21:00 AM
新智元

Meta科学家LeCun:当前 AI 模型缺乏四项关键人类智能特质

在巴黎举行的AI行动峰会上,Meta首席AI科学家Yann LeCun提出一个问题:“什么才是智能的基本构成? ”在与IBM AI负责人Anthony Annunziata的对话中,他提出四项标准:理解物理世界、拥有持续的记忆、具备推理能力,以及可以进行分层规划。 这四项能力在LeCun看来,是任何一种具备智能的生命体所共有的基础能力。
6/4/2025 3:22:00 AM

定义任务 + 合成数据:智能训练的高效引擎 —— Synthetic Data RL

大家好,我是肆〇柒。 在人工智能领域,基础模型的广泛应用为我们带来了前所未有的机遇,然而其在专业领域的表现往往不尽如人意。 高昂的数据标注成本和低效的标注流程,成为了阻碍模型性能提升的两大难题。
6/4/2025 3:00:00 AM
肆零柒

MCP原理与实战:下一代AI Agent的底层基建设计

MCP (Model Context Protocol) 模型上下文协议,通俗地讲就是 AI 领域的“通用接口”。 若将大模型视作计算机或智能手机,MCP 则相当于标准化的 USB 接口,不同的大模型都能通过它无缝接入实时数据、外部数据源等。 通过 MCP,开发者无须针对不同的大模型重复编写集成代码,只需遵循统一的标准即可实现兼容。
6/4/2025 2:25:00 AM
三笠

AI 时代下设计模式的逆袭:为何经典架构思想从未过时?

一、设计模式的“前世今生”:从被忽视到重新审视在软件开发的漫长历程中,设计模式曾经历过备受追捧、过度使用,乃至被部分开发者束之高阁的阶段。 20世纪90年代,《设计模式:可复用面向对象软件的基础》一书的问世,如同在软件开发领域投下一颗重磅炸弹。 抽象工厂、装饰器等模式成为开发者们热议的话题,它们为解决常见问题提供了标准化的方案,建立了一套通用的技术语言,让开发者无需每次都从零开始构思解决方案。
6/4/2025 2:00:05 AM
大模型之路

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一! 歪国网友纷纷被惊艳住了,原因在于该评测重点聚焦临床医生的日常工作场景,而非仅局限于传统医疗执照考试题。 图片要评测就要全 方 位。
6/3/2025 5:40:30 PM

推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源

DeepSeek-R1、OpenAI o1等推理模型大放异彩。 但随着能力增强,一个副作用越来越明显——它们开始想太多了。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。
6/3/2025 5:38:24 PM

训练MoE足足提速70%!华为只用了三招

Scaling Law之下,MoE(混合专家)如今已经成为各大模型厂商扩展模型能力的制胜法宝。 不过,在高效实现模型参数规模化的同时,MoE的训练难题也日益凸显:训练效率不足,甚至一半以上训练时间都浪费在“等待”上。 现在,为了突破MoE的训练瓶颈,华为出手了:构建了一套名为Adaptive Pipe & EDPB的优化方案,开启“上帝视角”,让MoE面临“交通拥堵”的训练集群,实现无等待流畅运行。
6/3/2025 5:37:49 PM

Windsurf创始人:我们对Java工程师做了很多优化和适配

自从 OpenAI 以 30 亿美元收购 Windsurf,这家公司一夜之间成了行业焦点。 我非常喜欢看 Windsurf 创始人 Varun Mohan 的访谈。 他年纪不大,但对于公司经营和产品方向,总能给出一些新鲜、实际的思考,而且讲得很坦诚,没有废话。
6/3/2025 4:36:03 PM
阿颖

提前交付超预期!美国FDA的AI助手Elsa正式上线,药品审查将提速

美国食品药品监督管理局(FDA)今日正式推出名为Elsa的生成式人工智能工具,标志着美国政府部门在AI应用领域迈出重要一步。 该工具的成功部署不仅提前于原定时间表,还实现了预算节约,为政府机构AI转型树立了新标杆。 提前交付的成功案例FDA局长Marty Makary医学博士表示,Elsa的推出比原计划提前且低于预算,这得益于与机构科学审查员此前开展的成功试点计划。
6/3/2025 3:00:54 PM
AI在线

DeepReaserch智能体突破:阿里WebDancer原生Agentic Model让AI自己「上网找答案」

一、背景在现实生活中,我们常常需要解决各种复杂的多步推理问题,这些问题往往需要从多个网页中获取信息,并进行综合分析和推理才能得出答案。 例如,当我们想要了解某个历史事件的详细经过时,可能需要查阅多个不同来源的网页,对比和分析其中的信息,才能还原事件的全貌。 这种复杂的信息检索任务,对于传统的搜索引擎来说是非常困难的,因为它们通常只能提供单步的搜索结果,而无法像人类一样进行多步的推理和决策。
6/3/2025 2:17:18 PM

李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了

李飞飞空间智能创业公司World Labs,开源一项核心技术! Forge渲染器,可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。 具体来说,Forge是一款Web端3D高斯泼溅渲染器,无缝集成three.js,实现完全动态和可编程的高斯泼溅。
6/3/2025 2:14:59 PM

大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o4做后盾,o3只当备胎用

OpenAI模型命名混乱没规律,以至于打开ChatGPT后,好多人都不知道到底该用哪个模型来完成任务。 不过别慌,现在咱们有救了! 刚刚,大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。
6/3/2025 2:13:56 PM

Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理

斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
6/3/2025 12:49:00 PM
郑佳美