理论

GPT-5又帮陶哲轩解决了一个难题

GPT-5又帮陶哲轩解决了一个难题！消息来自陶本人最新动态，他衷心提醒大家：AI能够大显身手的场景再 1——半自动化文献检索。简单来说，陶正在做的事情，其实就是用AI 数据库比对来帮忙解决数学里的难题。

9/4/2025 9:04:13 AM

构建切实有用的机器学习模型的七个提示

译者 | 布加迪审校 | 重楼这篇实用指南帮助你从概念验证迈入到生产就绪的机器学习。构建能够切实解决实际问题的机器学习模型不仅仅需要在测试时取得高准确率得分，更需要构建能够在生产环境中持续运行的系统。本文介绍了七个实用技巧，帮助你专注于构建能够提供可靠业务价值而非仅仅追求出色指标的模型。

9/4/2025 8:06:34 AM

布加迪

当RAG遇上MCP...

随着基础模型能力的不断增强，现实世界中的应用场景对人工智能提出了更高的要求，推动其向更具上下文感知能力、依赖外部信息检索以及由智能智能体驱动的方向发展。为了满足这些需求，诸如检索增强生成（RAG）和MCP等关键技术正逐步成为构建现代AI系统的核心组成部分。简要回顾检索增强生成（RAG）是一种结合语言模型与外部知识库的方法，使模型能够在生成回答之前，先通过向量搜索或语义搜索技术检索相关的文档内容。

9/4/2025 7:52:16 AM

曹洪伟

大语言模型为何难以突破科学瓶颈——每位快消行业的高管必须了解的真相

我们正处在一个时代，GenAI能够在几分钟内起草复杂的法律协议，在几秒钟内设计出合理的营销活动，并可按需在数十种语言之间自由切换。从早期的机器学习模型到如今的GPT-4、Claude、Gemini等大型语言模型(LLM)，能力的跃升堪称惊人。因此，企业高管提出一个合理的疑问：如果AI能写出一篇令人信服的研究论文，或者模拟一场技术对话，为什么不能开展科学实验?在某些圈子里，甚至流传着一种说法：科学家可能很快会像旅行社代理人或电影放映员一样，被“颠覆”到无关紧要。

9/4/2025 7:00:00 AM

Kumar

AI能否像人类一样“按步骤”推理？一项数学证明的答案

在过去几年里，大语言模型（LLM）与深度学习的浪潮席卷了几乎所有计算领域。从医学诊断到金融建模，从化学分子设计到物理模拟，这些模型在推理任务上的表现一次次刷新了人们的认知。它们不仅能处理复杂的自然语言，还能跨越模态边界，将图像、语音、代码等信息融会贯通，展现出惊人的“多才多艺”。

9/4/2025 1:45:00 AM

FleakenS

一步步教你用 Streamlit + Pydantic AI 搭建深度研究智能体应用

如果你曾经好奇如何通过结合智能的后端 Agent 和流畅的交互式前端来释放人工智能的真正力量，那你来对地方了！今天，我们将把你的知识提升到一个新高度，通过将强大的 Pydantic AI 研究 Agent 作为后端，与动态的 Streamlit 界面作为前端进行整合。 AI 的世界发展得快如闪电。

9/4/2025 1:44:00 AM

AI研究生

构建AI工作流与智能体的信任：持续评估与优化指南

在人工智能技术飞速发展的当下，开发并部署一款AI驱动的应用已不再是遥不可及的目标。开发者们耗费数小时打造智能体或复杂工作流，经过有限的手动测试后，便满怀信心地认为其概念可行。然而，初始测试结束后，故事往往并未迎来圆满结局——许多AI应用被直接部署，随后便陷入“自生自灭”的境地，性能无声且往往灾难性的衰退也自此开始。

9/4/2025 1:35:00 AM

大模型之路

Hinton最新警告：杀手机器人或将带来更多战争，最大担忧是AI接管人类

Couric：如果你能把奥特曼和马斯克请到同一张桌子上，你会对他们说什么？ Hinton：我会说：你们很清楚，你们正在开发的东西，很可能把人类毁灭掉。近期，「AI教父」Geoffrey Hinton，在与《Next Question》主持人Katie Couric对话时，直言不讳地说出了内心对AI安全的忧虑。

9/4/2025 1:25:11 AM

新智元

推理大模型机制解析！为什么Qwen3要把脑子一分为二？

近期，Qwen3模型的一个重大转变，让整个行业都在重新思考一个根本问题：推理大模型到底应该什么时候思考，什么时候直接给答案？这已不再是技术问题，也是关乎AI产品体验的核心议题...Qwen3的"分家"背后：理想很丰满，现实很骨感回到今年4月，Qwen3刚发布时，阿里团队雄心勃勃地推出了"混合思考模式"。听起来很美好：一个模型既能快速响应简单问题，又能深度思考复杂任务。

9/4/2025 1:00:00 AM

大数据AI智能圈

ICLR 2025｜KGExplainer：让新知识的发现“有理可循”

你是否想过，基于知识图谱的知识发现模型不仅能告诉你“答案”，还能解释“为什么”？设想一下，当 AI 系统预测“某种药物可能治疗某种疾病”时，它不仅给出结果，还能同时展示背后的逻辑路径——涉及的分子、关系和机制。这听起来像是科研人员梦寐以求的“透明 AI”，但在实际中，却是一道长期悬而未解的难题。

9/3/2025 2:36:00 PM

新闻资讯

用“因果规划”解决多智能体协作中的任务依赖难题｜港科广&腾讯

在长周期、多步骤的协作任务中，传统单智能体往往面临着任务成功率随步骤长度快速衰减，错误级联导致容错率极低等问题。为了应对这些问题，就需要构建具备全局规划与因果依赖管理能力的分布式智能体框架，并在真实游戏中验证效能。基于此，来自港科广和腾讯的研究团队提出了CausalMACE方法，通过将因果推理机制系统性地引入开放世界多智能体系统，为复杂任务协同提供了可扩展的工程化解决方案。

9/3/2025 2:05:11 PM

UCSD首个智能体浏览器发布！多页面设计，颠覆传统交互

我们早已习惯那排拥挤的标签页，这种线性堆叠在信息发现与跨页整合时不仅加重负担，也制造了高昂的管理成本。预订旅行酒店便是例子：用户需在多个选项间权衡比较、了解均价，并结合机票与活动随时调整计划，而单页式浏览器迫使用户反复切换界面，频频丢失上下文。即便是基于传统范式的AI浏览器，如Arc的Dia或Perplexity的Comet，也只是在单页框架下加入了智能体功能。

9/3/2025 2:05:11 PM