理论
从“知识断片”到“零样本推理”:AutoBnB-RAG如何赋能多智能体AI安全协作
大家好,我是肆〇柒。 今天要和大家分享的这项研究来自佐治亚理工学院(Georgia Institute of Technology)的工作,AutoBnB-RAG非常巧妙,为解决大型语言模型在网络安全决策中的“知识断片”问题,提供了一个既符合人类专家直觉又极具工程智慧的方案——让AI团队在“卡壳”时才去“查资料”。 这个研究为我们在多智能体中应用 agentic RAG 带来一些启发。
Swagger架构深度解析:从OpenAPI规范到企业级API治理的全链路设计
本文深入剖析Swagger的核心架构设计,揭示如何通过OpenAPI规范构建完整的API生命周期管理体系。 从契约驱动的设计理念出发,详解Swagger UI、Codegen、Editor三大核心组件的协同工作原理,呈现设计优先与代码优先两种架构模式的优劣对比。 通过微服务聚合、安全网关集成、CI/CD流水线等企业级场景,展示Swagger如何实现API文档自动化、客户端SDK生成、契约测试等关键能力,为构建可维护、可扩展的API生态系统提供完整架构蓝图。
LangGraph结构化输出详解:让智能体返回格式化数据
引言在使用大语言模型进行开发时,我们经常需要模型返回特定格式的数据,而不是纯文本。 比如在构建AI应用时,我们可能需要模型返回JSON格式的数据用于后续处理,或者返回符合特定数据结构的对象。 这就是结构化输出的价值所在。
一个Bug改通宵!用AI写超50%代码,只有32%资深开发者敢这么干
AI写代码,真的能提升10倍生产力吗? 上手飞快,看起来似乎很爽。 但速度与激情背后,AI也会为你挖坑。
炸了!Google新发图片大模型简直逆天!
如果说 ChatGPT 真正的开创了聊天时代的智能对话,那么这次 Google 发布的 Nano Gemini 2.5 Flash Image(Nano Banana)将真正开启了图片智能生成的时代。 先来看看他的生成效果吧。 1.生成3D手办2.旧照片修复3.换装不需要手工 PS 了。
Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去
两个多月前,Meta豪掷143亿美元收购Scale AI 49%的股份。 这才过去多久,两家不和的消息就被摆上了明面? 据TechCrunch报道,双方目前正在团队融合、业务合作方面产生一系列纠葛:跟随Alexandr Wang(Scale AI前CEO)一起去Meta的重要高管已经火速跑路了;Meta老员工和从Scale AI过来的人摩擦不断;Meta内部研究人员抱怨Scale AI数据质量太低,并采用了Scale AI对家数据;……u1s1,虽然这些摩擦的出现并不意外,但对比之前的“风光”,落差还是有点明显了。
NeurIPS近3万投稿爆仓,强拒400篇论文!博士疯狂内卷,AI顶会噩梦来袭
AI顶会,一场「爆仓危机」正在上演。 由于会议场地限制,NeurIPS 2025正通知「高级领域主席」(SAC),拒收已被录用的论文。 一位SAC爆料,大约400篇论文直接被砍掉,即便是三位审稿人和AC已通过初审。
OpenAI大神:人工智能导论课程停在15年前,本科首选该是机器学习导论
如今,人工智能已经成为科技发展的主流,尤其是 ChatGPT 问世以来,大语言模型(LLM)正在深刻影响社会、企业和个人的方方面面。 对于想要投身人工智能领域的初学者来说,选对一门课程显得尤为重要。 很多大学往往会设置人工智能导论(Intro to AI)课程,并成为很多学生的首选。
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
没想到啊,最新SOTA的开源大模型……来自一个送外卖(Waimai)的——有两个AI,确实不一样。 这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。 一方面是因为成绩亮眼:它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。
英伟达显卡用油散热,性能提升16%!DIY大神爆改版跑分登顶榜首
歪果仁也有自己的“手工耿”……一老哥用变速箱油和汽车变速箱冷却器DIY了一套显卡油冷散热。 在这套油冷散热的加持下,GTX 1080 Ti和1060的性能分别提升了7%到16%。 而在显卡性能测试基准3DMark Firestrike上,更是干到了全球第一——直接惊呆一众网友!
把实验与计算「缝」到一张「地图」上:AI让材料发现路线更直观、可解释
编辑丨&不知道诸位读者都是否知道黑箱? 这是指对特定的系统开展研究时,仅从其输入输出的特点了解该系统规律,而并不会涉及到其中系统内部的结构和相互关系。 在材料科学里,很多研究者都困在「黑箱」里:实验结果零散,模拟结果庞杂,数据孤岛四处林立,导致新材料发现依然缓慢。
科普向:一文解构大模型后训练,GRPO和它的继任者们的前世今生
GRPO 就像一个树节点,从这里开始开枝散叶。 大语言模型的发展真是日新月异。 从 DeepSeek 横空出世以来,其在大模型后训练的创新 GRPO 一跃成为强化学习黄金范式。
对话顺丰科技网络安全总监梁博:大模型浪潮下物流网络安全的守与破
网络安全中的攻防一直是矛与盾的关系,它们是相互对立且不断发展的。 当大模型重塑产业形态时,网络安全的“攻防边界”正在被悄然改写,开始上演一场在用魔法打败魔法的战争,但最终谁会胜利,不得而知。 作为承载亿量级用户隐私数据、依托自动化场景运转的物流行业来说,既面临传统网络攻击的持续侵扰,又需应对大模型衍生的新型安全风险。
143亿美金买来一场空!小扎向谷歌OpenAI低头,史上最大AI赌注失速
自从Llama 4发布后,Meta深陷「性能评测造假」丑闻,声誉跌落神坛。 之后,小扎坐不住了,斥143亿美元(约1000亿元)收购Scale AI,同时大举用九位数年薪挖角AI顶尖人才。 然而,近日Meta爆出离职潮,大批人才甚至还未入职便决定告别Meta。
解码50%失败率:自主智能体的三大“死穴”与破局之道
大家好,我是肆〇柒。 最近,来自香港中文大学和新加坡管理大学的研究团队在一项关于自主智能体的实证研究中发现:当前主流智能体系统的任务完成率竟然只有约50%。 他们不仅构建了一个包含34个可编程任务的基准测试,还对104次失败案例进行了系统性归因,首次提出了“三层失败分类法”。
Hinton神预言!斯坦福惊人实锤:00后20%初级IT岗蒸发,AI失业潮来了
AI无声掀起就业地震! 斯坦福大学最新研究显示:AI正无情吞噬美国年轻人的「饭碗」。 过去三年,最容易被AI取代的岗位里,22-25岁新人就业率猛降13%!
R-Zero 深度解析:无需人类数据,AI 如何实现自我进化?
本文第一作者黄呈松 (Chengsong Huang) 是圣路易斯华盛顿大学的博士生,Google scholar citation 五百多次,目前的研究的兴趣是强化学习和大语言模型。 机器之心曾经报道过其之前工作 Lorahub 已经被引超过 250 次。 大型语言模型(LLM)的发展长期以来受限于对大规模、高质量人工标注数据的依赖,这不仅成本高昂,也从根本上限制了 AI 超越人类知识边界的潜力 。
谷歌"香蕉"模型震撼发布!图像编辑能力一骑绝尘
最近有个感觉特别强烈:AI图像生成领域正在迎来一个全新的时代。 谷歌悄悄发布了代号为"Nano Banana"的Gemini 2.5 Flash Image模型,这个有着可爱名字的模型,可能要彻底改写图像编辑的游戏规则。 说实话,刚看到"香蕉"这个名字时,我还以为谷歌是在开玩笑。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉