理论

从“知识断片”到“零样本推理”：AutoBnB-RAG如何赋能多智能体AI安全协作

大家好，我是肆〇柒。今天要和大家分享的这项研究来自佐治亚理工学院（Georgia Institute of Technology）的工作，AutoBnB-RAG非常巧妙，为解决大型语言模型在网络安全决策中的“知识断片”问题，提供了一个既符合人类专家直觉又极具工程智慧的方案——让AI团队在“卡壳”时才去“查资料”。这个研究为我们在多智能体中应用 agentic RAG 带来一些启发。

9/2/2025 2:00:00 AM 肆零柒

Swagger架构深度解析：从OpenAPI规范到企业级API治理的全链路设计

本文深入剖析Swagger的核心架构设计，揭示如何通过OpenAPI规范构建完整的API生命周期管理体系。从契约驱动的设计理念出发，详解Swagger UI、Codegen、Editor三大核心组件的协同工作原理，呈现设计优先与代码优先两种架构模式的优劣对比。通过微服务聚合、安全网关集成、CI/CD流水线等企业级场景，展示Swagger如何实现API文档自动化、客户端SDK生成、契约测试等关键能力，为构建可维护、可扩展的API生态系统提供完整架构蓝图。

9/2/2025 1:33:00 AM 肖哥谈架构

LangGraph结构化输出详解：让智能体返回格式化数据

引言在使用大语言模型进行开发时，我们经常需要模型返回特定格式的数据，而不是纯文本。比如在构建AI应用时，我们可能需要模型返回JSON格式的数据用于后续处理，或者返回符合特定数据结构的对象。这就是结构化输出的价值所在。

9/2/2025 1:25:00 AM ChallengeHub

一个Bug改通宵！用AI写超50%代码，只有32%资深开发者敢这么干

AI写代码，真的能提升10倍生产力吗？上手飞快，看起来似乎很爽。但速度与激情背后，AI也会为你挖坑。

9/2/2025 12:20:00 AM 新智元

炸了！Google新发图片大模型简直逆天！

如果说 ChatGPT 真正的开创了聊天时代的智能对话，那么这次 Google 发布的 Nano Gemini 2.5 Flash Image（Nano Banana）将真正开启了图片智能生成的时代。先来看看他的生成效果吧。 1.生成3D手办2.旧照片修复3.换装不需要手工 PS 了。

9/1/2025 5:18:55 PM 磊哥

Meta和Scale AI闹翻！砸143亿买的高管跑路，业务也合作不下去

两个多月前，Meta豪掷143亿美元收购Scale AI 49%的股份。这才过去多久，两家不和的消息就被摆上了明面？据TechCrunch报道，双方目前正在团队融合、业务合作方面产生一系列纠葛：跟随Alexandr Wang（Scale AI前CEO）一起去Meta的重要高管已经火速跑路了；Meta老员工和从Scale AI过来的人摩擦不断；Meta内部研究人员抱怨Scale AI数据质量太低，并采用了Scale AI对家数据；……u1s1，虽然这些摩擦的出现并不意外，但对比之前的“风光”，落差还是有点明显了。

9/1/2025 5:17:42 PM

NeurIPS近3万投稿爆仓，强拒400篇论文！博士疯狂内卷，AI顶会噩梦来袭

AI顶会，一场「爆仓危机」正在上演。由于会议场地限制，NeurIPS 2025正通知「高级领域主席」（SAC），拒收已被录用的论文。一位SAC爆料，大约400篇论文直接被砍掉，即便是三位审稿人和AC已通过初审。

9/1/2025 5:09:21 PM

OpenAI大神：人工智能导论课程停在15年前，本科首选该是机器学习导论

如今，人工智能已经成为科技发展的主流，尤其是 ChatGPT 问世以来，大语言模型（LLM）正在深刻影响社会、企业和个人的方方面面。对于想要投身人工智能领域的初学者来说，选对一门课程显得尤为重要。很多大学往往会设置人工智能导论（Intro to AI）课程，并成为很多学生的首选。

9/1/2025 4:55:00 PM 机器之心

王兴一鸣惊人！美团首个开源大模型追平DeepSeek-V3.1

9/1/2025 2:22:03 PM

英伟达显卡用油散热，性能提升16%！DIY大神爆改版跑分登顶榜首

歪果仁也有自己的“手工耿”……一老哥用变速箱油和汽车变速箱冷却器DIY了一套显卡油冷散热。在这套油冷散热的加持下，GTX 1080 Ti和1060的性能分别提升了7%到16%。而在显卡性能测试基准3DMark Firestrike上，更是干到了全球第一——直接惊呆一众网友！

9/1/2025 2:18:44 PM

把实验与计算「缝」到一张「地图」上：AI让材料发现路线更直观、可解释

编辑丨&不知道诸位读者都是否知道黑箱？这是指对特定的系统开展研究时，仅从其输入输出的特点了解该系统规律，而并不会涉及到其中系统内部的结构和相互关系。在材料科学里，很多研究者都困在「黑箱」里：实验结果零散，模拟结果庞杂，数据孤岛四处林立，导致新材料发现依然缓慢。

9/1/2025 2:00:00 PM ScienceAI

科普向：一文解构大模型后训练，GRPO和它的继任者们的前世今生

GRPO 就像一个树节点，从这里开始开枝散叶。大语言模型的发展真是日新月异。从 DeepSeek 横空出世以来，其在大模型后训练的创新 GRPO 一跃成为强化学习黄金范式。

9/1/2025 11:33:00 AM 机器之心

对话顺丰科技网络安全总监梁博：大模型浪潮下物流网络安全的守与破

网络安全中的攻防一直是矛与盾的关系，它们是相互对立且不断发展的。当大模型重塑产业形态时，网络安全的“攻防边界”正在被悄然改写，开始上演一场在用魔法打败魔法的战争，但最终谁会胜利，不得而知。作为承载亿量级用户隐私数据、依托自动化场景运转的物流行业来说，既面临传统网络攻击的持续侵扰，又需应对大模型衍生的新型安全风险。

9/1/2025 9:26:54 AM

143亿美金买来一场空！小扎向谷歌OpenAI低头，史上最大AI赌注失速

自从Llama 4发布后，Meta深陷「性能评测造假」丑闻，声誉跌落神坛。之后，小扎坐不住了，斥143亿美元（约1000亿元）收购Scale AI，同时大举用九位数年薪挖角AI顶尖人才。然而，近日Meta爆出离职潮，大批人才甚至还未入职便决定告别Meta。

9/1/2025 9:15:00 AM

解码50%失败率：自主智能体的三大“死穴”与破局之道

大家好，我是肆〇柒。最近，来自香港中文大学和新加坡管理大学的研究团队在一项关于自主智能体的实证研究中发现：当前主流智能体系统的任务完成率竟然只有约50%。他们不仅构建了一个包含34个可编程任务的基准测试，还对104次失败案例进行了系统性归因，首次提出了“三层失败分类法”。

9/1/2025 9:13:54 AM 肆零柒

Hinton神预言！斯坦福惊人实锤：00后20%初级IT岗蒸发，AI失业潮来了

9/1/2025 9:13:00 AM

R-Zero 深度解析：无需人类数据，AI 如何实现自我进化？

本文第一作者黄呈松 (Chengsong Huang) 是圣路易斯华盛顿大学的博士生，Google scholar citation 五百多次，目前的研究的兴趣是强化学习和大语言模型。机器之心曾经报道过其之前工作 Lorahub 已经被引超过 250 次。大型语言模型（LLM）的发展长期以来受限于对大规模、高质量人工标注数据的依赖，这不仅成本高昂，也从根本上限制了 AI 超越人类知识边界的潜力。

9/1/2025 9:09:00 AM

谷歌"香蕉"模型震撼发布！图像编辑能力一骑绝尘

最近有个感觉特别强烈：AI图像生成领域正在迎来一个全新的时代。谷歌悄悄发布了代号为"Nano Banana"的Gemini 2.5 Flash Image模型，这个有着可爱名字的模型，可能要彻底改写图像编辑的游戏规则。说实话，刚看到"香蕉"这个名字时，我还以为谷歌是在开玩笑。

9/1/2025 9:08:41 AM 阿丸笔记

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉