模型

面试不是考试，是表演！新晋OpenAI员工：重磅揭秘顶级AI岗通关密码

「所有面试，本质上都是表演。」在历经数轮苛刻面试后，成功入职OpenAI后，Bas van Opheusden得出的终极结论。你需要准备的不仅是完美的代码，还有一个能展现领导力的「失败故事」，一套应对「非正式聊天」的标准话术，甚至是一间光线完美的房间和两个显示器。

9/16/2025 9:06:00 AM

GPT-5编程专用版发布！独立连续编程7小时，简单任务提速10倍，VS Code就能用

OpenAI Codex编程智能体大升级：推出GPT-5-Codex特化版模型，支持独立连续编程7个小时。还有IDE插件版，在VS Code、Cursor中都可以使用Codex了。新模型最牛的地方在于“真·动态思考”能力。

9/16/2025 9:05:14 AM

马斯克的最快AI模型来了

最强不敢说，但最快实锤了！刚刚，xAI发布Grok 4 Fast，生成速度高达每秒75个 token，比标准版快10倍！从下面的动图中，我们可以直观地看出差距——当左边的Grok 4还在说“让我想一下的时候”，Grok 4 Fast已经在说：“下一个问题是什么了。

9/16/2025 9:02:00 AM

15年大佬深夜痛哭半小时！氛围编程巨坑曝光，95%程序员沦为「AI保姆」

爆火的「氛围编程」，如今让无数程序员沦为了「AI保姆」。入行15年，Carla Rover用了Vibe Coding之后，不得不重启项目，爆哭半小时。或许听起来太离谱，但这是真真实实发生的故事。

9/15/2025 2:49:58 PM

GPT-5是口袋博士？诺奖得主哈萨比斯怒怼奥特曼：博士级AI纯属扯淡！

目前的博士级人工智能就是扯淡！实属没想到，诺奖得主、谷歌DeepMind CEO哈萨比斯（Demis Hassabis）竟公然怒怼奥特曼。在最近的访谈中，哈萨比斯公开表示，把如今的LLM称作「博士级智能」，纯属无稽之谈！

9/15/2025 9:13:00 AM

干货！2025年AI Agent超100页全景报告：MCP、RAG、实战案例

知名AI、数据科学家Avi Chawla最近精心整合关于AI Agent的，117页PDF的全景技术报告。这份报告的内容非常全面，无论是技术新手或老手都能深度了解关于智能体的相关内容。在基础理论部分，清晰阐述基础概念，深入剖析大模型、RAG与智能体的区别和关系，帮助开发者构建扎实认知根基。

9/15/2025 9:12:40 AM

重磅！5年破解黎曼猜想，10年接管人类认知，AI超级增长曲线揭秘

「如果未来五年内看到 AI 解出黎曼猜想，我一点也不会太惊讶。」近日，Epoch AI负责人Jaime Sevilla，与公司数据与分析负责人Yafah Edelman在一次播客节目中，为我们揭示了未来十年，AI的发展路线图。 Jaime Sevilla（左）与Yafah Edelman（右）对话谈到了以下问题：我们是否会持续每年5x的算力扩张节奏？

9/15/2025 9:11:00 AM

昔日王者TensorFlow，已死

噫吁嚱！那个昔日叱咤风云的开源框架——TensorFlow，已然是行将就木了。如此断言并非空穴来风，而是根据一份冷静的数据洞察所得出的结论。

9/15/2025 9:10:09 AM

啥？陶哲轩18个月没搞定的数学挑战，被这个“AI高斯”三周完成了

不得了，这个名叫Gauss（高斯）的新AI Agent，有点杀疯了的感觉。因为它只用了三周的时间，就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理（Prime Number Theorem，PNT）。要知道，陶哲轩和Kontorovich在2024年1月提出这个挑战后，足足花了18个月（今年7月）的时间，也才取得阶段性的进展。

9/15/2025 9:00:00 AM

突发！苹果AI大失血：Siri前掌门离职，核心团队被挖角，新功能延期到2026

高管出走、人才流失新品发布会因缺乏「AI进展」被投行降级Siri升级延期，新AI功能未就绪Apple Intelligence落地受限……从年中高调，到9月「轻AI」的产品发布，苹果AI近半年来在跌宕中失速。近日，苹果AI高层再传震荡：前Siri负责人、AI资深高管Robby Walker即将离任。 Walker是AI负责人John Giannandrea的少数直接汇报人之一。

9/15/2025 8:54:00 AM

攻克强化学习「最慢一环」！交大字节联手，让大模型RL训练速度飙升2.6倍

强化学习的训练效率，实在是太低了！随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐，大模型“深度思考”能力的背后，强化学习（RL）无疑是那把最关键的密钥。然而，这场竞赛的背后，一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理，RL训练更像一个效率低下的“手工作坊”，投入巨大但产出缓慢。

9/15/2025 8:50:00 AM

一夜刷屏！27岁姚顺雨离职OpenAI，清华姚班天才转型做产品经理？

姚顺雨昨天被传加入腾讯，今早「第37手」和腾讯旗下的「鹅厂黑板报」正式辟谣！为什么姚顺雨能引起行业如此大的关注？为什么会传出来一亿人民币的天价薪酬传闻？

9/12/2025 1:00:05 PM

刚刚，字节登顶世界最强图像AI！一手实测原生4K、10图融合，全网玩疯

谷歌Nano Banana一夜爆火之后，各种邪修玩法儿，至今让全网意犹未尽。等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开，全网玩疯。谁曾想，短短半个月后，大洋彼岸就杀出来了一个最强逆袭者！

9/12/2025 11:00:09 AM

全新MoE架构！阿里开源Qwen3-Next，训练成本直降九成

大语言模型（LLM），正在进入 Next Level。周五凌晨，阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。总参数 80B 的模型仅激活 3B ，性能就可媲美千问 3 旗舰版 235B 模型，也超越了 Gemini-2.5-Flash-Thinking，实现了模型计算效率的重大突破。

9/12/2025 10:02:21 AM

超越90%城市规划师！清华、MIT等提出人机协作新范式 | Nature子刊

面对日益复杂的城市系统和多元化的社会需求，传统城市规划方法正遭遇瓶颈。如今，人工智能（AI）正为这个古老而重要的领域带来颠覆性的革新。近日，由清华大学电子工程系城市科学与计算研究中心、建筑学院与麻省理工学院（MIT）感知城市实验室、美国东北大学等顶尖机构的学者组成的跨学科团队，在国际前沿期刊《自然·计算科学》上发表观点文章，首次系统性地提出了一个由大语言模型（LLM）驱动的智能城市规划框架。

9/12/2025 9:12:00 AM

攻克AI过度思考难题！美团新研究让通过“可验证”过程奖励激活LRM的高效推理

LRM通过简单却有效的RLVR范式，培养了强大的CoT推理能力，但伴随而来的冗长的输出内容，不仅显著增加推理开销，还会影响服务的吞吐量，这种消磨用户耐心的现象被称为“过度思考”问题。针对这一缺陷，来自美团等机构的研究团队提出可验证的过程奖励机制（VSRM），鼓励CoT中的“有效步骤”，惩戒“无效步骤”，最大限度保持性能的同时，实现高效推理。通过在数学任务上的实验显示，在多个常用benchmark上，VSRM加持的后训练使得不同尺度的模型实现了输出长度的大幅缩减，甚至在部分情况下提升了模型表现。

9/12/2025 9:05:00 AM

国产类脑大模型适配国产沐曦GPU！长序列推理提速超百倍，仅用2%数据匹敌主流模型

超长序列推理时的巨大开销如何降低？中国科学院自动化所李国齐、徐波团队发布的类脑脉冲大模型SpikingBrain (瞬悉)-1.0提出了新思路。 SpikingBrain借鉴大脑信息处理机制，具有线性/近线性复杂度，在超长序列上具有显著速度优势。

9/12/2025 9:03:00 AM

成立7个月首发声！百亿美金独角兽万字雄文：攻克LLM推理非确定性难题

Thinking Machines Lab终于放大招了！刚刚，联合创始人、OpenAI前副总裁Lilian Weng透露：Thinking Machines的第一代旗舰产品名为「Connection Machine」（联结机）。事情是这样的：今天，Thinking Machines开辟了研究博客专栏「Connectionism」（联结主义），发表了第一篇博客文章「Defeating Nondeterminism in LLM Inference」（击败LLM推理中的非确定性）。

9/11/2025 1:31:41 PM 新智元

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画 AI新词大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果腾讯算法 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算 AI设计生成式AI 大型语言模型搜索视频生成亚马逊特斯拉 AI模型 DeepMind 场景深度学习 Copilot Transformer 架构 MCP 编程视觉