资讯列表

分类

标签

借助上下文工程优化任何AI代理框架

借助上下文工程优化任何AI代理框架

在人工智能代理技术飞速发展的当下，许多开发团队都深陷一系列棘手问题：代理时常出现幻觉输出、工作链中途断裂、提示词臃肿不堪，而团队往往将这些问题归咎于模型参数不足，一心寄望于更强大的模型能带来转机。然而，事实却并非如此。相关实践数据清晰地表明，73%的生产环境故障根源在于糟糕的上下文工程，而非模型本身的局限性。

8/8/2025 1:45:00 AM 大模型之路

炸裂！Apipost离线可用+AI全栈覆盖，2s开启速度无敌了！

炸裂！Apipost离线可用+AI全栈覆盖，2s开启速度无敌了！

Apipost是一款面向开发人员，包括前端、后端、测试人员以及团队协作的API开发管理工具，它集API文档开发、设计、调试、Mock、自动化测试及管理于一体，已形成从API设计、调试、文档生成、自动化测试到性能测试和管理的完整闭环，尤其在AI大模型集成、文档智能化生成领域持续突破，成为国内数百万开发者和测试人员构建高效研发链路的核心工具。与其他传统工具相比，Apipost最大的优势在于无需登录即可使用，支持离线调试，同时保持了对复杂测试场景的支持；笔者近期在使用Apipost最新V8.1.20版本时还发现，其开启速度只需2s。一、Apipost核心优势Apipost非常适合需要团队协作、注重文档管理和轻量体验的API开发团队。

8/8/2025 12:00:00 AM

云计算一哥首度牵手OpenAI，大模型「选择」自由，才是终极胜利

云计算一哥首度牵手OpenAI，大模型「选择」自由，才是终极胜利

昨天是个热闹的日子，OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型：前者是自 GPT-2 以来重新开源的两款模型 gpt-oss（120b 和 20b），后者是 Claude 系列最强的 Opus 4.1。模型刚发布没多久，当大家还没从 OpenAI 和 Anthropic 两家的新模型遭遇战中缓过劲来的时候，云计算一哥大手一挥：「我全都要！」亚马逊云科技重磅宣布，首次通过 Amazon Bedrock 和 Amazon SageMaker AI 两大平台实现对 OpenAI 新开源模型的支持。

8/7/2025 10:03:00 PM 机器之心

颠覆互联网的下一波浪潮：Agentic Web来了！

颠覆互联网的下一波浪潮：Agentic Web来了！

你不会再「上网」，而是说出一个目标，然后由一群 AI 自动完成。 ——未来互联网使用场景设想过去三十年，互联网经历了从静态网页到智能推荐的深刻演变。如今，我们正站在互联网的另一个重大转折点上。

8/7/2025 9:59:00 PM 机器之心

三重激励+全周期扶持，即梦升级这个计划，让AI创作者的成长有迹可循

三重激励+全周期扶持，即梦升级这个计划，让AI创作者的成长有迹可循

即梦AI创作者成长计划全面升级了。自从有了 AI，全球网友的精神状态是愈发美丽了。现在只要打开手机，社交平台总能蹦出几个抽象的 AI 视频。

8/7/2025 9:53:00 PM 机器之心

DeepSeek的GRPO会导致模型崩溃？看下Qwen3新范式GSPO

DeepSeek的GRPO会导致模型崩溃？看下Qwen3新范式GSPO

众所周知，大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」，开发者利用大规模文本数据集训练模型，让它学会预测句子中的下一个词。第二阶段是「后训练」，旨在教会模型如何更好地理解和执行人类指令。

8/7/2025 9:46:00 PM 机器之心

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

自首次提出 GPT 架构以来，转眼已经过去了七年。如果从 2019 年的 GPT-2 出发，回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4，不难发现一个有趣的现象：尽管模型能力不断提升，但其整体架构在这七年中保持了高度一致。当然，细节上仍有不少演进。

8/7/2025 9:40:00 PM 机器之心

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

自首次提出 GPT 架构以来，转眼已经过去了七年。如果从 2019 年的 GPT-2 出发，回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4，不难发现一个有趣的现象：尽管模型能力不断提升，但其整体架构在这七年中保持了高度一致。当然，细节上仍有不少演进。

8/7/2025 9:40:00 PM 机器之心

让AI读懂「言外之意」：AI4SG团队发布首个心理健康污名语料库，破解隐性偏见识别难题

让AI读懂「言外之意」：AI4SG团队发布首个心理健康污名语料库，破解隐性偏见识别难题

论文第一作者 Han Meng 是新加坡国立大学博士生，从事心理学构建的计算方法研究。通讯作者 Yi-Chieh Lee 是新加坡国立大学助理教授，在对话式人工智能、人机交互和心理健康技术领域开展研究工作。共同作者 Renwen Zhang 是南洋理工大学助理教授，专注于计算传播学研究，为本研究提供了传播学视角。

8/7/2025 9:27:00 PM 机器之心

宝马大牛跳槽小米，前电车设计负责人，将向原下属汇报

宝马大牛跳槽小米，前电车设计负责人，将向原下属汇报

小米又从宝马招来一员大将。宝马电车设计负责人凯兰格(Kai Langer)近日官宣，自己已加盟小米汽车。这是半年时间里，小米从宝马招募的第六员大将，凯兰格和此前的老同事们一样，在官宣消息中对小米一顿猛夸，称其是具有颠覆性的科技巨头。

8/7/2025 8:07:39 PM 一凡

全球最大AI模型聚合平台诞生！不争冠军只做擂台

全球最大AI模型聚合平台诞生！不争冠军只做擂台

2023年，当整个AI行业都在为“最强大模型”争得头破血流时，亚马逊云科技却洞察到一个关键事实：. AI的价值不在于谁的模型最强大，而在于能否为不同场景选择最适合的模型。在2023年亚马逊云科技（AWS）正式提出“Choice Matters”（选择大于一切）战略，认为AI的未来不是某个单一模型的胜利，而是多个模型根据各自优势协同工作。

8/7/2025 5:53:15 PM 梦晨

AI生死局仅存6位玩家！Claude之父：大模型天生就有“搞钱”冲动！做了CC才能懂模型如何进化！即使AI停滞，产品还要再做十年

AI生死局仅存6位玩家！Claude之父：大模型天生就有“搞钱”冲动！做了CC才能懂模型如何进化！即使AI停滞，产品还要再做十年

出品 | 51CTO技术栈（微信号：blog51cto）说起来，今天已经立秋了，但 AI 圈的这个“盛夏”显然还没结束。这几天，几大巨头接连出招，行业硝烟味渐浓。明天大概率还有GPT-5要出来炸场。

8/7/2025 5:01:36 PM 伊风

沃尔沃也卖不动了：销量连续5个月下滑，全球裁员7%没止住亏损

沃尔沃也卖不动了：销量连续5个月下滑，全球裁员7%没止住亏损

曾经躺赚到手软的豪华品牌，如今也得勒紧裤腰过日子。沃尔沃公布最新一个月的销售数据，依然没能挽回今年以来的颓势。销量一跌再跌，7月全球交付4.93万辆，同比减少14%，已经连续5个月下滑，跌到今年冰点。

8/7/2025 4:44:20 PM 杰西卡

Grok 辣味模式失控！输入“庆祝”输出“脱衣”

Grok 辣味模式失控！输入“庆祝”输出“脱衣”

马斯克旗下AI工具Grok又因为负面新闻上热搜了。这一次，它在毫无明确指令的情况下，自动生成了歌手泰勒·斯威夫特的裸照。事件发生在Grok最新的功能“Grok Imagine”刚刚上线之后。

8/7/2025 4:27:28 PM

24 帧·720p·无限交互！谷歌 Genie 3 开启“造梦引擎 2.0”

24 帧·720p·无限交互！谷歌 Genie 3 开启“造梦引擎 2.0”

昨天，Google Deepmind推出新一代AI系统Genie 3，能够根据简单文本生成实时互动的3D虚拟世界。这一模型不仅能构建世界，还能让用户以每秒24帧、720p分辨率的画质在其中自由探索。与传统视频生成不同，Genie 3采用自回归方式逐帧生成画面，每一帧都会参考多达一分钟内的环境细节。

8/7/2025 4:25:28 PM

刚刚，小红书开源了多模态大模型dots.vlm1，性能直追SOTA！

刚刚，小红书开源了多模态大模型dots.vlm1，性能直追SOTA！

最近的AI圈只能说是神仙打架，太卷了。 OpenAI终于发了开源模型，Claude从Opus 4升级到4.1，谷歌推出生成游戏世界的Genie 3引发社区热议。国产模型这边，就在前几天，HuggingFace上排在最前面的10个开源模型还都来自国内。

8/7/2025 4:24:19 PM 新智元

刚刚，GPT-5内测抢先泄露！推理强到离谱，智商被曝140超越人类天才

刚刚，GPT-5内测抢先泄露！推理强到离谱，智商被曝140超越人类天才

就在明天，GPT-5总算要靴子落地了。周五凌晨，GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。全网用户都可以立即通过API和ChatGPT访问这三个模型。

8/7/2025 4:21:27 PM

一夜颠覆Sora神话，H200单卡5秒出片！全华人团队开源AI引爆视频圈

一夜颠覆Sora神话，H200单卡5秒出片！全华人团队开源AI引爆视频圈

单块H200，5秒即生一个5秒视频。最近，UCSD、UC伯克利、MBZUAI三大机构联手，祭出FastWan系视频生成模型。论文地址：「稀疏蒸馏」全新的训练方案，实现了高效生成，让视频去噪速度实现70倍飙升。

8/7/2025 4:18:35 PM

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 GGUF 是什么？一文看懂大模型里最火的模型格式后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉