理论

Claude开大！百万 Token 上线，Sonnet 4 将上下文扩至 1M

Anthropic宣布，Claude Sonnet 4的上下文长度，现在达到了史无前例的100万个token。图片这项功能已经正式上线Anthropic API，并同步登陆Amazon Bedrock，Google Cloud的Vertex AI也即将支持。相比之前的20万个token，这次扩展是5倍的飞跃。

8/14/2025 2:45:15 PM

PartCrafter：首个结构化3D多部件生成模型

本篇文章是北京大学、字节跳动和卡耐基梅隆大学的联合工作。我们提出了 PartCrafter，一种新颖的结构化 3D 生成模型，为 3D 对象创建引入了一种变革性的方法。 PartCrafter 不仅能生成可分解的 3D 网格，还支持灵活的部件编辑，为创作者提供了更高的自由度。

8/14/2025 1:37:36 PM

潘攀望

拥有20多年丰富经验的资深营销高管佩吉·斯图德分享了她的见解，阐述了自疫情以来，以及在当前持续的经济变动中，营销策略是如何演变的。斯图德探讨了长期品牌建设的重要性、营销预算合理化的挑战、AI的兴起，以及营销人员如何成功平衡品牌资产与需求创造，她还就带领团队应对不确定性，以及首席营销官在当今瞬息万变的环境中取得成功所需的技能给出了建议。无论你是在应对预算削减，还是试图吸引年轻受众，这一期节目都提供了实用且可操作的策略。

8/14/2025 1:08:32 PM

Michelle

AI图像水印失守！开源工具5分钟内抹除所有水印

AI图像的水印技术要变天了！一款全新的去水印技术——UnMarker，能在5分钟内去除市面上几乎所有的AI图像水印。其中，谷歌水印工具HiDDeN已被完全破解，SynthID也已被攻破79%！

8/14/2025 12:37:03 PM

越可靠的AI就越人机，牛津大学：高情商模型错误率显著增加

情绪价值这块儿，GPT-5让很多网友大呼失望。免费用户想念GPT-4o，也只能默默调理了。但为什么升级后的GPT-5，反而变得“不近人情”了呢？

8/14/2025 12:03:50 PM

GNN+KAN，把三角函数当「激活」选项，山大、南洋理工让分子图更会读化学子结构

编辑丨&分子性质预测，通常关系到药物与材料研发中的核心要素。现代的科研流程里，图神经网络（GNN）的介入让传统方法更进一步。与此同时，柯尔莫哥洛夫-阿诺德网络（KAN）提供了更高的表达性、参数效率和可解释性，已经成为多层感知器的强大替代品。

8/14/2025 11:57:00 AM

ScienceAI

未来5年，AI 发展为 Web 带来的机会

国内很多程序员（包括我自己）都是移动互联网大周期（2010～2020年）内入的行。周期内智能手机用户快速增长，其中包括大量不拥有PC的用户。随着手机入网超越PC，App逐渐取代搜索引擎成为新的流量入口。

8/14/2025 11:17:28 AM

卡颂

Agent 产品如何定价？我们花的钱，究竟值不值？

一方面，我们对Agent的期望是成为一个可靠、高效、且不知疲倦的伙伴；另一方面，现实体验却常常被一些“意外”打断：资源瓶颈的窘境：在执行关键任务的冲刺阶段，系统突然弹出“积分/点数已耗尽”的提示，如同汽车在距离目的地一公里处耗尽燃油，进程戛然而止。性能波动的无奈：用户时常面临算力“堵车”的困境，Agent的响应速度时快时慢，尤其在服务高峰期，其表现更像一个“兼职员工”，而非全天候的专业助理。 DeepSeek等前沿应用在发布初期因用户激增而导致的服务器高负载现象，便是这一挑战的缩影。

8/14/2025 11:13:59 AM

DataFun

智能体“模态之战”：谁将主宰云基础设施管理“AIOps”的未来？

大家好，我是肆〇柒。云基础设施日益复杂，智能体能否真正成为DevOps工程师的得力助手？ AI 应用于生产系统运维是行业在持续探索的领域，我看到一篇由密歇根大学、UC Berkeley、安德森·霍洛维茨等机构的联合研究《Cloud Infrastructure Management in the Age of AI Agents》，其中深入分析了智能体在SDK、CLI、IaC和ClickOps四种云管理模态中的实际表现。

8/14/2025 9:38:16 AM

肆零柒

GPT-5终于没有幻觉了？

为什么一个被誉为"最聪明"的AI，到现在还会一本正经地告诉你"拿破仑是用iPhone指挥滑铁卢战役的"？这个问题困扰了AI圈好几年。但现在，答案终于来了。

8/14/2025 9:31:24 AM

阿丸笔记

马斯克痛失xAI大将！Grok 4缔造者突然离职，长文曝最燃创业内幕

刚刚，xAI联创Igor Babuschkin官宣离职创业！在xAI的最后一天，他用一篇长文回顾了2023年初见到埃隆的那天——我们畅谈数小时，探讨AI的未来与无限可能。我们都认为，世界需要一家肩负着不同使命的新型AI公司。

8/14/2025 9:27:03 AM

新智元

微软发布五大AI Agent模式：一键解锁AI员工，打造智能体工厂

今天凌晨，微软在官网发布了Agent常见的设计模式和用例，以帮助用户快速开发出功能强大的自动化AI员工。与传统的RPA、自动化脚本相比，智能体除了提供自动化之外，还能根据实际业务场景进行推理、协作、弥合知识与成果之间的差距，挖掘出全新的见解，提供更高的商业价值。以下是微软根据实际业务场景总结出的5种常用的Agent模式：1、工具使用模式如今的智能体能直接与企业系统交互，能检索数据、调用应用程序编程接口（API）、触发工作流和执行交易。

8/14/2025 9:15:00 AM

美国宣战，AI行动计划打响第一枪！「AI+材料」成最新核武器

近日，美国白宫发布《美国AI行动计划》，该计划勾勒了美国国家层面的人工智能发展蓝图，其中也明确提出多项AI与产业深度融合的战略部署。从材料科学的角度出发，可以看到美国正在以空前的战略高度，将材料科学与人工智能的深度融合置于国家核心竞争力的位置。这其中传递出清晰的信号：谁掌握了「AI 材料」的核心能力，谁就扼住了下一代产业革命和科技创新的咽喉。

8/14/2025 9:12:00 AM

Figure人形机器人首秀灵巧手叠衣服！神经网络架构不变，只增加数据集就搞定

Figure人形机器人首秀，靠神经网络叠衣服！在没有任何架构改变、仅增加了数据的情况下，就让原本在物流场景干活的它，轻松习得了新技能。能够看到，在人类拿给他衣服时，不仅有眼神交流，拿完后它点了点头，比了个「点赞」的手势。

8/14/2025 9:09:00 AM

AI Coding大佬聊透了：产品智能重要还是用户体验重要？答案让人意外

AI Coding背后的争议，正在升级。有人说它是写代码的“自动驾驶”，有人说只是个“聪明的实习生”；有人觉得它能让0基础小白一键出成果，有人则坚持它应该精准到不改一行多余的代码。人主导还是AI主导？

8/14/2025 9:07:00 AM

大模型训练新突破！“不对称”训练让AI学会自我反思，推理零开销

首次实现“训练-推理不对称”，字节团队提出全新的语言模型训练方法：Post-Completion Learning (PCL)。在训练时让模型对自己的输出结果进行反思和评估，推理时却仅输出答案，将反思能力完全内化。与目前主流的训练方式相比，这一创新方法不仅实现了模型能力的显著提升，更重要的是推理时完全零额外开销。

8/14/2025 9:00:00 AM

AI 智能体的三大支柱：上下文、认知与行动

当我们向AI助手下达“分析客户流失情况并向销售团队发送警报”的指令时，多数聊天机器人只会解释客户流失的定义，或建议联系数据团队；而真正的AI智能体却能主动访问客户数据库、开展分析、识别高风险账户，并自动通知相关销售人员——全程无需人工干预。这种差距不仅是能力的差异，更源于架构的本质区别。语言模型擅长文本理解与生成，但智能体的核心优势在于三大支柱的协同运作：理解场景的“上下文层”、做出明智决策的“认知层”，以及将决策付诸实践的“行动层”。

8/14/2025 8:20:38 AM

大模型之路

ColPali联手DocLayNet：打造能“看懂”文档布局的视觉问答神器！

译者 | 朱先忠审校 | 重楼本文介绍ColPali与DocLayNet结合的多模态RAG系统，通过视觉语言建模理解文档中的表格、图表等布局信息，显著提升复杂文档问答的准确性和上下文感知能力。简介检索增强生成（RAG）已成为构建开放领域和特定领域问答系统的标准范例。传统意义上，RAG流程严重依赖于基于文本的检索器，这些检索器使用密集或稀疏嵌入来索引和检索段落。

8/14/2025 8:00:51 AM

朱先忠

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

理论