模型
GPT-5编程专用版发布!独立连续编程7小时,简单任务提速10倍,VS Code就能用
OpenAI Codex编程智能体大升级:推出GPT-5-Codex特化版模型,支持独立连续编程7个小时。 还有IDE插件版,在VS Code、Cursor中都可以使用Codex了。 新模型最牛的地方在于“真·动态思考”能力。
9/16/2025 9:05:14 AM
马斯克的最快AI模型来了
最强不敢说,但最快实锤了! 刚刚,xAI发布Grok 4 Fast,生成速度高达每秒75个 token,比标准版快10倍! 从下面的动图中,我们可以直观地看出差距——当左边的Grok 4还在说“让我想一下的时候”,Grok 4 Fast已经在说:“下一个问题是什么了。
9/16/2025 9:02:00 AM
15年大佬深夜痛哭半小时!氛围编程巨坑曝光,95%程序员沦为「AI保姆」
爆火的「氛围编程」,如今让无数程序员沦为了「AI保姆」。 入行15年,Carla Rover用了Vibe Coding之后,不得不重启项目,爆哭半小时。 或许听起来太离谱,但这是真真实实发生的故事。
9/15/2025 2:49:58 PM
GPT-5是口袋博士?诺奖得主哈萨比斯怒怼奥特曼:博士级AI纯属扯淡!
目前的博士级人工智能就是扯淡! 实属没想到,诺奖得主、谷歌DeepMind CEO哈萨比斯(Demis Hassabis)竟公然怒怼奥特曼。 在最近的访谈中,哈萨比斯公开表示,把如今的LLM称作「博士级智能」,纯属无稽之谈!
9/15/2025 9:13:00 AM
干货!2025年AI Agent超100页全景报告:MCP、RAG、实战案例
知名AI、数据科学家Avi Chawla最近精心整合关于AI Agent的,117页PDF的全景技术报告。 这份报告的内容非常全面,无论是技术新手或老手都能深度了解关于智能体的相关内容。 在基础理论部分,清晰阐述基础概念,深入剖析大模型、RAG与智能体的区别和关系,帮助开发者构建扎实认知根基。
9/15/2025 9:12:40 AM
重磅!5年破解黎曼猜想,10年接管人类认知,AI超级增长曲线揭秘
「如果未来五年内看到 AI 解出黎曼猜想,我一点也不会太惊讶。 」近日,Epoch AI负责人Jaime Sevilla,与公司数据与分析负责人Yafah Edelman在一次播客节目中,为我们揭示了未来十年,AI的发展路线图。 Jaime Sevilla(左)与Yafah Edelman(右)对话谈到了以下问题:我们是否会持续每年5x的算力扩张节奏?
9/15/2025 9:11:00 AM
昔日王者TensorFlow,已死
噫吁嚱! 那个昔日叱咤风云的开源框架——TensorFlow,已然是行将就木了。 如此断言并非空穴来风,而是根据一份冷静的数据洞察所得出的结论。
9/15/2025 9:10:09 AM
啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。 因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理(Prime Number Theorem,PNT)。 要知道,陶哲轩和Kontorovich在2024年1月提出这个挑战后,足足花了18个月(今年7月)的时间,也才取得阶段性的进展。
9/15/2025 9:00:00 AM
突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026
高管出走、人才流失新品发布会因缺乏「AI进展」被投行降级Siri升级延期,新AI功能未就绪Apple Intelligence落地受限……从年中高调,到9月「轻AI」的产品发布,苹果AI近半年来在跌宕中失速。 近日,苹果AI高层再传震荡:前Siri负责人、AI资深高管Robby Walker即将离任。 Walker是AI负责人John Giannandrea的少数直接汇报人之一。
9/15/2025 8:54:00 AM
攻克强化学习「最慢一环」!交大字节联手,让大模型RL训练速度飙升2.6倍
强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/15/2025 8:50:00 AM
一夜刷屏!27岁姚顺雨离职OpenAI,清华姚班天才转型做产品经理?
姚顺雨昨天被传加入腾讯,今早「第37手」和腾讯旗下的「鹅厂黑板报」正式辟谣! 为什么姚顺雨能引起行业如此大的关注? 为什么会传出来一亿人民币的天价薪酬传闻?
9/12/2025 1:00:05 PM
刚刚,字节登顶世界最强图像AI!一手实测原生4K、10图融合,全网玩疯
谷歌Nano Banana一夜爆火之后,各种邪修玩法儿,至今让全网意犹未尽。 等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开,全网玩疯。 谁曾想,短短半个月后,大洋彼岸就杀出来了一个最强逆袭者!
9/12/2025 11:00:09 AM
全新MoE架构!阿里开源Qwen3-Next,训练成本直降九成
大语言模型(LLM),正在进入 Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。 总参数 80B 的模型仅激活 3B ,性能就可媲美千问 3 旗舰版 235B 模型,也超越了 Gemini-2.5-Flash-Thinking,实现了模型计算效率的重大突破。
9/12/2025 10:02:21 AM
超越90%城市规划师!清华、MIT等提出人机协作新范式 | Nature子刊
面对日益复杂的城市系统和多元化的社会需求,传统城市规划方法正遭遇瓶颈。 如今,人工智能(AI)正为这个古老而重要的领域带来颠覆性的革新。 近日,由清华大学电子工程系城市科学与计算研究中心、建筑学院与麻省理工学院(MIT)感知城市实验室、美国东北大学等顶尖机构的学者组成的跨学科团队,在国际前沿期刊《自然·计算科学》上发表观点文章,首次系统性地提出了一个由大语言模型(LLM)驱动的智能城市规划框架。
9/12/2025 9:12:00 AM
攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理
LRM通过简单却有效的RLVR范式,培养了强大的CoT推理能力,但伴随而来的冗长的输出内容,不仅显著增加推理开销,还会影响服务的吞吐量,这种消磨用户耐心的现象被称为“过度思考”问题。 针对这一缺陷,来自美团等机构的研究团队提出可验证的过程奖励机制(VSRM),鼓励CoT中的“有效步骤”,惩戒“无效步骤”,最大限度保持性能的同时,实现高效推理。 通过在数学任务上的实验显示,在多个常用benchmark上,VSRM加持的后训练使得不同尺度的模型实现了输出长度的大幅缩减,甚至在部分情况下提升了模型表现。
9/12/2025 9:05:00 AM
国产类脑大模型适配国产沐曦GPU!长序列推理提速超百倍,仅用2%数据匹敌主流模型
超长序列推理时的巨大开销如何降低? 中国科学院自动化所李国齐、徐波团队发布的类脑脉冲大模型SpikingBrain (瞬悉)-1.0提出了新思路。 SpikingBrain借鉴大脑信息处理机制,具有线性/近线性复杂度,在超长序列上具有显著速度优势。
9/12/2025 9:03:00 AM
成立7个月首发声!百亿美金独角兽万字雄文:攻克LLM推理非确定性难题
Thinking Machines Lab终于放大招了! 刚刚,联合创始人、OpenAI前副总裁Lilian Weng透露:Thinking Machines的第一代旗舰产品名为「Connection Machine」(联结机)。 事情是这样的:今天,Thinking Machines开辟了研究博客专栏「Connectionism」(联结主义),发表了第一篇博客文章「Defeating Nondeterminism in LLM Inference」(击败LLM推理中的非确定性)。
9/11/2025 1:31:41 PM
新智元
李飞飞一年前究竟说了啥?怎么又火了
大语言模型的局限在哪里? AI教母李飞飞这样说:大自然中是没有语言存在的,你不会从天空中直接看到文字。 语言是一种纯粹的生成的信号。
9/11/2025 10:02:33 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉