理论

GPT-5数字母依然翻车！马库斯：泛化问题仍未解决，Scaling无法实现AGI

大模型好不容易学会数r，结果换个字母就翻车了？而且还是最新的GPT-5。杜克大学教授Kieran Healy表示，自己让GPT-5数了数blueberry里有几个b，结果GPT-5斩钉截铁地回答3个。

8/12/2025 9:06:00 AM

2025 年多款 Deep Research 智能体框架全面对比

作者：fangzlong随着模型的范式和工程方式发展，网络上涌现出了一大批模仿人类研究者对问题进行深入研究的智能体应用。本文将从 OpenAI 关于 DeepResearch 的指南开始，通过几个开源框架的架构解构与功能映射，揭示不同框架在研究自动化领域的差异。为各位使用者、开发者选择合适工具和框架提供系统化参考。

8/12/2025 8:58:03 AM

腾讯技术工程

Attention Sink产生的起点？清华&美团首次揭秘MoE LLM中的超级专家机制

稀疏激活的混合专家模型（MoE）通过动态路由和稀疏激活机制，极大提升了大语言模型（LLM）的学习能力，展现出显著的潜力。基于这一架构，涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。然而，随着模型参数的迅速膨胀，如何高效部署和推理成了新的挑战。

8/12/2025 8:55:00 AM

提示工程入门—从定义到核心配置

一、什么是提示工程？ • 本质：用文本（或文本其他模态）引导大型语言模型（LLM）输出正确 token 序列的系统方法。 • 关键洞察：LLM 是“概率预测机”，给定上文，逐 token 预测下文；提示工程就是设计并调试上文，使下文落在期望分布内。

8/12/2025 8:45:11 AM

Hark

机器人上下文协议首次开源：阿里达摩院一口气放出具身智能「三大件」

8 月 11 日，在世界机器人大会上，阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ，推动数据、模型和机器人的兼容适配，打通具身智能开发全流程。开源链接：机器人上下文协议 RynnRCP - 语言 - 动作模型 RynnVLA-001 RynnEC ，但仍面临开发流程碎片化，数据、模型与机器人本体适配难等重大挑战。达摩院将 MCP（Model Context Protocol）理念引入具身智能，首次提出并开源了 RCP（Robotics Context Protocol）协议以推动不同的数据、模型与本体之间的对接适配。

8/11/2025 6:09:37 PM

谷歌发布BlenderFusion，基于3D的视觉编辑与生成式合成框架

近年来，生成对抗网络和扩散模型等创新技术在图像生成领域取得了巨大突破，能够生成逼真的图像和视频内容。但这些技术通常侧重于整体图像的生成，对于需要精确控制多个视觉元素如物体、相机视角和背景的复杂合成场景支持有限。例如，在一个包含多个物体的场景中，若要将某个物体进行替换、改变其位置或调整其外观，同时保持整个场景的自然过渡和真实感，现有技术往往难以达到理想效果。

8/11/2025 6:04:10 PM

美国程序员失业率创纪录：17万本科生难就业，AI抢饭碗！

《纽约时报》发布深度文章“再见了，年薪16.5万美元的科技工作，学编程的学生们开始求职快餐连锁店Chipotle”。根据美国纽约联邦储备银行2025年5月最新调查报告显示，在22—27岁的大学毕业生中，计算机科学和计算机工程专业毕业生的失业率很高，分别为6.1% 和 7.5%。这一比例是生物和艺术史专业应届毕业生失业率的2倍多。

8/11/2025 6:03:52 PM

OpenAI开放AI模型库但CIO们需警惕潜在风险

开源模型为企业IT提供了一种方法，可基于企业内容构建定制化的大语言模型，目前，OpenAI正推出两款开源模型。 ChatGPT的开发者OpenAI已根据Apache 2.0开源许可证发布了两款大语言模型，这两款模型gpt-oss-120b和gpt-oss-20b均为开放权重语言模型，OpenAI称其能以低成本提供强大的现实性能。据OpenAI介绍，新模型在推理任务上的表现优于同类规模的开源模型，且针对在消费级硬件上的高效部署进行了优化。

8/11/2025 6:01:57 PM

Cliff Saran

让OpenAI只领先5天，百川发布推理新模型，掀翻医疗垂域开源天花板

刚刚，全球最强开源医疗模型发布，来自中国。百川开源最新医疗推理大模型Baichuan-M2-32B，在OpenAI发布的Healthbench评测集上，超越其刚刚发布5天的开源模型gpt-oss-120b。不仅以小博大，而且领先除GPT5以外所有的开源闭源前沿模型。

8/11/2025 6:01:12 PM

推理成本骤降75%！gpt-oss用新数据类型实现4倍推理速度，80GB显卡能跑1200亿参数大模型

OpenAI在最新的开源模型gpt-oss上采用的MXFP4数据类型，直接让推理成本暴降75%！更惊人的是，MXFP4在把内存占用降为同规模BF16模型的四分之一的同时，还把生成token的速度提升了整整4倍。换句话说，这一操作直接把1200亿参数的大模型塞进80GB显存的显卡，哪怕是只有16GB显存的显卡也能跑200亿参数的版本。

8/11/2025 6:00:38 PM

错信AI幻觉，一男子用溴化钠替代食用盐，真给自己吃出幻觉了

美国一位60岁男性就错信了ChatGPT的建议，把家中的食用盐全替换成了用于泳池清理的溴化钠。这一做法让他体内的溴含量达到了惊人的1700 mg/L（正常范围为0.9-7.3 mg/L），属于严重的溴中毒，并导致了严重的妄想症。好家伙，真正诱发了字面意义上的幻觉。

8/11/2025 6:00:11 PM

量子位

智谱终于发布GLM-4.5技术报告，从预训练到后训练，细节大公开

就在上个月底，智谱放出重磅炸弹 —— 开源新一代旗舰模型 GLM-4.5 以及轻量版 GLM-4.5-Air。其不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合，还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。这个成绩在所有国产模型和开源模型中均排名第一！

8/11/2025 5:58:44 PM

从捍卫者到引路人，上交&上海AI Lab提出LEGION：不仅是AI图像伪造克星，还能反哺生成模型进化？

本文由上海交通大学，上海人工智能实验室、北京航空航天大学、中山大学和商汤科技联合完成。主要作者包括上海交通大学与上海人工智能实验室联培博士生康恒锐、温子辰，上海人工智能实验室实习生文思为等。通讯作者为中山大学副教授李唯嘉和上海人工智能实验室青年科学家何聪辉。

8/11/2025 5:58:00 PM

舞界AI正式发布，“三端协同”赋能重塑艺术教育生态链

2025年8月6日，创新科技企业“身体认知”在北京隆重举办了主题为“智舞破界”的舞界AI产品发布会。发布会现场，来自教育行业的专家、投资机构、教育机构等代表共同见证了“身体认知”公司所推出的全球首款舞蹈AI肢体比对引擎，同时也是人体关键点比对教育行业首个AI大模型应用——舞界AI的正式发布。该产品旨在为4-16岁青少年提供随时随地、个性化的智能伴学服务。

8/11/2025 4:31:22 PM