AI
OpenAI 最强模型 GPT-5 即将面世:性能跃升,对抗 Gemini 2.5 Pro 和 Claude 4 的杀手锏
在墨西哥举办的 AI Summit 峰会上,两名 OpenAI 公司代表透露,公司正在开发下一代基础模型 GPT-5,并计划通过该模型与竞争对手展开更激烈角逐。
6/4/2025 6:52:14 AM
故渊
OpenAI 向 ChatGPT 免费用户开放记忆功能
OpenAI 昨日(6 月 3 日)更新支持文档,宣布升级 ChatGPT 的记忆功能(Memory),并免费向 ChatGPT 用户开放,从而能更好地保存和引用用户过去的对话内容。
6/4/2025 6:41:11 AM
故渊
OpenAI 首席执行官奥尔特曼:AI 智能体冲击基层员工,职场变革加速
在 Snowflake Summit 2025 主题演讲中,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)表示,很多公司已将 AI 智能体(自主运行执行复杂任务的程序)当作基层员工使用。
6/4/2025 6:31:10 AM
故渊
OpenAI 更新编程工具 Codex:新增语音输入 + 联网,向 ChatGPT Plus 用户开放
OpenAI 今天(6 月 4 日)宣布升级其编程工具 Codex,在向 ChatGPT Plus 用户开放之外,还新增联网能力,让 Codex 在执行任务时访问互联网(附带安全限制)。
6/4/2025 6:18:53 AM
故渊
Karpathy教你值回ChatGPT 200刀「票价」,初创工程师揭秘ChatGPT最核心能力
ChatGPT你肯定已经用过,也用的很「爽」,但你的使用方法大概率是不对的! 别急,这是OpenAI初创大神Andrej Karpathy说的,「热衷于」科普AI的他再度出手。 这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型!
6/4/2025 4:21:00 AM
新智元
Meta科学家LeCun:当前 AI 模型缺乏四项关键人类智能特质
在巴黎举行的AI行动峰会上,Meta首席AI科学家Yann LeCun提出一个问题:“什么才是智能的基本构成? ”在与IBM AI负责人Anthony Annunziata的对话中,他提出四项标准:理解物理世界、拥有持续的记忆、具备推理能力,以及可以进行分层规划。 这四项能力在LeCun看来,是任何一种具备智能的生命体所共有的基础能力。
6/4/2025 3:22:00 AM
定义任务 + 合成数据:智能训练的高效引擎 —— Synthetic Data RL
大家好,我是肆〇柒。 在人工智能领域,基础模型的广泛应用为我们带来了前所未有的机遇,然而其在专业领域的表现往往不尽如人意。 高昂的数据标注成本和低效的标注流程,成为了阻碍模型性能提升的两大难题。
6/4/2025 3:00:00 AM
肆零柒
MCP原理与实战:下一代AI Agent的底层基建设计
MCP (Model Context Protocol) 模型上下文协议,通俗地讲就是 AI 领域的“通用接口”。 若将大模型视作计算机或智能手机,MCP 则相当于标准化的 USB 接口,不同的大模型都能通过它无缝接入实时数据、外部数据源等。 通过 MCP,开发者无须针对不同的大模型重复编写集成代码,只需遵循统一的标准即可实现兼容。
6/4/2025 2:25:00 AM
三笠
AI 时代下设计模式的逆袭:为何经典架构思想从未过时?
一、设计模式的“前世今生”:从被忽视到重新审视在软件开发的漫长历程中,设计模式曾经历过备受追捧、过度使用,乃至被部分开发者束之高阁的阶段。 20世纪90年代,《设计模式:可复用面向对象软件的基础》一书的问世,如同在软件开发领域投下一颗重磅炸弹。 抽象工厂、装饰器等模式成为开发者们热议的话题,它们为解决常见问题提供了标准化的方案,建立了一套通用的技术语言,让开发者无需每次都从零开始构思解决方案。
6/4/2025 2:00:05 AM
大模型之路
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一! 歪国网友纷纷被惊艳住了,原因在于该评测重点聚焦临床医生的日常工作场景,而非仅局限于传统医疗执照考试题。 图片要评测就要全 方 位。
6/3/2025 5:40:30 PM
推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源
DeepSeek-R1、OpenAI o1等推理模型大放异彩。 但随着能力增强,一个副作用越来越明显——它们开始想太多了。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。
6/3/2025 5:38:24 PM
训练MoE足足提速70%!华为只用了三招
Scaling Law之下,MoE(混合专家)如今已经成为各大模型厂商扩展模型能力的制胜法宝。 不过,在高效实现模型参数规模化的同时,MoE的训练难题也日益凸显:训练效率不足,甚至一半以上训练时间都浪费在“等待”上。 现在,为了突破MoE的训练瓶颈,华为出手了:构建了一套名为Adaptive Pipe & EDPB的优化方案,开启“上帝视角”,让MoE面临“交通拥堵”的训练集群,实现无等待流畅运行。
6/3/2025 5:37:49 PM
Windsurf创始人:我们对Java工程师做了很多优化和适配
自从 OpenAI 以 30 亿美元收购 Windsurf,这家公司一夜之间成了行业焦点。 我非常喜欢看 Windsurf 创始人 Varun Mohan 的访谈。 他年纪不大,但对于公司经营和产品方向,总能给出一些新鲜、实际的思考,而且讲得很坦诚,没有废话。
6/3/2025 4:36:03 PM
阿颖
提前交付超预期!美国FDA的AI助手Elsa正式上线,药品审查将提速
美国食品药品监督管理局(FDA)今日正式推出名为Elsa的生成式人工智能工具,标志着美国政府部门在AI应用领域迈出重要一步。 该工具的成功部署不仅提前于原定时间表,还实现了预算节约,为政府机构AI转型树立了新标杆。 提前交付的成功案例FDA局长Marty Makary医学博士表示,Elsa的推出比原计划提前且低于预算,这得益于与机构科学审查员此前开展的成功试点计划。
6/3/2025 3:00:54 PM
AI在线
DeepReaserch智能体突破:阿里WebDancer原生Agentic Model让AI自己「上网找答案」
一、背景在现实生活中,我们常常需要解决各种复杂的多步推理问题,这些问题往往需要从多个网页中获取信息,并进行综合分析和推理才能得出答案。 例如,当我们想要了解某个历史事件的详细经过时,可能需要查阅多个不同来源的网页,对比和分析其中的信息,才能还原事件的全貌。 这种复杂的信息检索任务,对于传统的搜索引擎来说是非常困难的,因为它们通常只能提供单步的搜索结果,而无法像人类一样进行多步的推理和决策。
6/3/2025 2:17:18 PM
李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了
李飞飞空间智能创业公司World Labs,开源一项核心技术! Forge渲染器,可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。 具体来说,Forge是一款Web端3D高斯泼溅渲染器,无缝集成three.js,实现完全动态和可编程的高斯泼溅。
6/3/2025 2:14:59 PM
大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o4做后盾,o3只当备胎用
OpenAI模型命名混乱没规律,以至于打开ChatGPT后,好多人都不知道到底该用哪个模型来完成任务。 不过别慌,现在咱们有救了! 刚刚,大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。
6/3/2025 2:13:56 PM
Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理
斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
6/3/2025 12:49:00 PM
郑佳美
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
具身智能
大语言模型
百度
生成
Sora
GPU
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
深度学习
生成式AI
架构
DeepMind
亚马逊
特斯拉
编程
AI模型
视觉
Transformer
预测
MCP