AI在线 AI在线

理论

AI Agent系统的安全能力及可信治理的“三道防线”

在AI技术加速演进与广泛落地的当下,Agent系统作为具备自主感知、推理与执行能力的智能体,正日益成为企业智能化转型的核心驱动。 然而,随之而来的系统复杂性、任务自治性以及跨域协同能力,也引发了前所未有的安全挑战与治理难题。 为了构建一个既高效运行又可控可信的Agent系统,亟需在架构层面引入系统性的安全防护与治理机制。
8/8/2025 2:10:00 AM

AI应用开发的三个挑战

虽然AI技术已经广泛应用到许多业务场景,但真正成熟且有价值的AI应用还是凤毛麟角,常见的应用主要集中在AI助手和知识库之类,虽然企业管理者也希望将AI真正嵌入到管理流程和业务流程中,但效果还有待验证。 之所以如此,一方面,LLM与AI技术还有待进一步完善和提高,另一方面,大多数企业缺乏合格的AI开发人员。 除去这两方面的原因,我认为主要受制于AI应用开发面临的三个挑战。
8/8/2025 2:00:00 AM
张逸少

告别适配器:通用工具调用协议(UTCP)如何简化 AI 工具通信

UTCP 让任何 AI 代理都能直接跟任何工具对话——不管是 HTTP、gRPC、WebSocket,还是你的本地 CLI——无需包装器、无延迟、无锁定。 什么是 UTCP? UTCP 是一个全新标准,专为帮助 AI 代理与各种外部工具沟通而设计,不论这些工具用的是什么语言、风格或接口。
8/8/2025 1:45:00 AM
AI研究生

借助上下文工程优化任何AI代理框架

在人工智能代理技术飞速发展的当下,许多开发团队都深陷一系列棘手问题:代理时常出现幻觉输出、工作链中途断裂、提示词臃肿不堪,而团队往往将这些问题归咎于模型参数不足,一心寄望于更强大的模型能带来转机。 然而,事实却并非如此。 相关实践数据清晰地表明,73%的生产环境故障根源在于糟糕的上下文工程,而非模型本身的局限性。
8/8/2025 1:45:00 AM
大模型之路

炸裂!Apipost离线可用+AI全栈覆盖,2s开启速度无敌了!

Apipost是一款面向开发人员,包括前端、后端、测试人员以及团队协作的API开发管理工具,它集API文档开发、设计、调试、Mock、自动化测试及管理于一体,已形成从API设计、调试、文档生成、自动化测试到性能测试和管理的完整闭环,尤其在AI大模型集成、文档智能化生成领域持续突破,成为国内数百万开发者和测试人员构建高效研发链路的核心工具。 与其他传统工具相比,Apipost最大的优势在于无需登录即可使用,支持离线调试,同时保持了对复杂测试场景的支持;笔者近期在使用Apipost最新V8.1.20版本时还发现,其开启速度只需2s。 一、Apipost核心优势Apipost非常适合需要团队协作、注重文档管理和轻量体验的API开发团队。
8/8/2025 12:00:00 AM

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。 当然,细节上仍有不少演进。
8/7/2025 9:40:00 PM
机器之心

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。 当然,细节上仍有不少演进。
8/7/2025 9:40:00 PM
机器之心

AI生死局仅存6位玩家!Claude之父:大模型天生就有“搞钱”冲动!做了CC才能懂模型如何进化!即使AI停滞,产品还要再做十年

出品 | 51CTO技术栈(微信号:blog51cto)说起来,今天已经立秋了,但 AI 圈的这个“盛夏”显然还没结束。 这几天,几大巨头接连出招,行业硝烟味渐浓。 明天大概率还有GPT-5要出来炸场。
8/7/2025 5:01:36 PM
伊风

Grok 辣味模式失控!输入“庆祝”输出“脱衣”

马斯克旗下AI工具Grok又因为负面新闻上热搜了。 这一次,它在毫无明确指令的情况下,自动生成了歌手泰勒·斯威夫特的裸照。 事件发生在Grok最新的功能“Grok Imagine”刚刚上线之后。
8/7/2025 4:27:28 PM

24 帧·720p·无限交互!谷歌 Genie 3 开启“造梦引擎 2.0”

昨天,Google Deepmind推出新一代AI系统Genie 3,能够根据简单文本生成实时互动的3D虚拟世界。 这一模型不仅能构建世界,还能让用户以每秒24帧、720p分辨率的画质在其中自由探索。 与传统视频生成不同,Genie 3采用自回归方式逐帧生成画面,每一帧都会参考多达一分钟内的环境细节。
8/7/2025 4:25:28 PM

刚刚,小红书开源了多模态大模型dots.vlm1,性能直追SOTA!

最近的AI圈只能说是神仙打架,太卷了。 OpenAI终于发了开源模型,Claude从Opus 4升级到4.1,谷歌推出生成游戏世界的Genie 3引发社区热议。 国产模型这边,就在前几天,HuggingFace上排在最前面的10个开源模型还都来自国内。
8/7/2025 4:24:19 PM
新智元

刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才

就在明天,GPT-5总算要靴子落地了。 周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。 全网用户都可以立即通过API和ChatGPT访问这三个模型。
8/7/2025 4:21:27 PM

一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈

单块H200,5秒即生一个5秒视频。 最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。 论文地址:「稀疏蒸馏」全新的训练方案,实现了高效生成,让视频去噪速度实现70倍飙升。
8/7/2025 4:18:35 PM

谷歌开源DeepPolisher,基因组组装错误率减半,Jeff Dean:令人振奋!

编辑丨coisini精确的基因组组装(Genome assembly)是生物学研究的基石,但即便是最高质量的组装仍会残留构建技术导致的错误。 人类基因组包含 30 亿个核苷酸,即使微小的错误率也会导致错误总量惊人,进而削弱基因组数据的应用价值。 碱基层面的错误通常需要通过额外的抛光(polishing)步骤来修正 —— 该步骤利用与初版组装比对后的测序读段来识别必要的编辑。
8/7/2025 3:17:00 PM
ScienceAI

OpenAI重磅发布gpt-oss系列开源大模型:媲美 GPT-4o

不论你是独立开发者、企业还是研究机构,现在都可以免费拥有一款与 GPT-4o 接近实力的语言模型。 开源但不“阉割”:媲美 GPT-4o,运行成本极低OpenAI 在这次发布中非常有诚意:gpt-oss-120b:在核心推理任务上已接近 GPT-4o-mini,支持 128k 上下文,单卡 80GB GPU 可跑。 gpt-oss-20b:性能对标 GPT-3.5(o3-mini),仅需 16GB 显存,可部署于消费级设备、本地推理、离线使用等场景。
8/7/2025 2:05:40 PM
AI大模型应用开发

GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强

疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。 这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。
8/7/2025 1:57:38 PM

GPT-5 的可读性革命,从博弈到智能体的跃迁

GPT-5 发布在即,根据奥特曼在内部演示中首次披露的 GPT-5 实测数据,这一代模型不仅具备高达 256K 的上下文窗口,还展现出惊人的数学与编程能力。 更令人瞩目的是其“智能模式切换”能力——在深度推理与快速响应之间自由切换,仿佛具备了某种“元认知”能力。 这种表现并非偶然,而是源于其底层架构中引入了新的验证机制,被称为“Universal Verifier”,其灵感正是来自一项前沿研究:Prover-Verifier Game(PVG)。
8/7/2025 2:55:00 AM
波动智能

AI Agent原生企业有哪些发展趋势与机遇

随着技术成熟与应用场景拓展,以智能Agent为核心构建业务流程、组织架构与产品服务的原生企业将会迎来一个高速增长期——这些企业将崛起于各行各业,并展现出高度的敏捷性、自适应性与创新能力,成为引领产业变革的新兴主体。 未来,Agent原生企业将会有哪些发展趋势与机遇呢? AI Agent原生企业的趋势和机遇发展趋势展望未来,AI Agent原生企业将会有以下几个发展趋势:(一)“Agent-first”业务逻辑成为主流设计范式。
8/7/2025 12:00:01 AM