资讯列表
借助上下文工程优化任何AI代理框架
在人工智能代理技术飞速发展的当下,许多开发团队都深陷一系列棘手问题:代理时常出现幻觉输出、工作链中途断裂、提示词臃肿不堪,而团队往往将这些问题归咎于模型参数不足,一心寄望于更强大的模型能带来转机。 然而,事实却并非如此。 相关实践数据清晰地表明,73%的生产环境故障根源在于糟糕的上下文工程,而非模型本身的局限性。
炸裂!Apipost离线可用+AI全栈覆盖,2s开启速度无敌了!
Apipost是一款面向开发人员,包括前端、后端、测试人员以及团队协作的API开发管理工具,它集API文档开发、设计、调试、Mock、自动化测试及管理于一体,已形成从API设计、调试、文档生成、自动化测试到性能测试和管理的完整闭环,尤其在AI大模型集成、文档智能化生成领域持续突破,成为国内数百万开发者和测试人员构建高效研发链路的核心工具。 与其他传统工具相比,Apipost最大的优势在于无需登录即可使用,支持离线调试,同时保持了对复杂测试场景的支持;笔者近期在使用Apipost最新V8.1.20版本时还发现,其开启速度只需2s。 一、Apipost核心优势Apipost非常适合需要团队协作、注重文档管理和轻量体验的API开发团队。
云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利
昨天是个热闹的日子,OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型:前者是自 GPT-2 以来重新开源的两款模型 gpt-oss(120b 和 20b),后者是 Claude 系列最强的 Opus 4.1。 模型刚发布没多久,当大家还没从 OpenAI 和 Anthropic 两家的新模型遭遇战中缓过劲来的时候,云计算一哥大手一挥:「我全都要! 」亚马逊云科技重磅宣布,首次通过 Amazon Bedrock 和 Amazon SageMaker AI 两大平台实现对 OpenAI 新开源模型的支持。
颠覆互联网的下一波浪潮:Agentic Web来了!
你不会再「上网」,而是说出一个目标,然后由一群 AI 自动完成。 ——未来互联网使用场景设想过去三十年,互联网经历了从静态网页到智能推荐的深刻演变。 如今,我们正站在互联网的另一个重大转折点上。
三重激励+全周期扶持,即梦升级这个计划,让AI创作者的成长有迹可循
即梦AI创作者成长计划全面升级了。 自从有了 AI,全球网友的精神状态是愈发美丽了。 现在只要打开手机,社交平台总能蹦出几个抽象的 AI 视频。
DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO
众所周知,大型语言模型的训练通常分为两个阶段。 第一阶段是「预训练」,开发者利用大规模文本数据集训练模型,让它学会预测句子中的下一个词。 第二阶段是「后训练」,旨在教会模型如何更好地理解和执行人类指令。
硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构
自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。 当然,细节上仍有不少演进。
硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构
自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。 当然,细节上仍有不少演进。
让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题
论文第一作者 Han Meng 是新加坡国立大学博士生,从事心理学构建的计算方法研究。 通讯作者 Yi-Chieh Lee 是新加坡国立大学助理教授,在对话式人工智能、人机交互和心理健康技术领域开展研究工作。 共同作者 Renwen Zhang 是南洋理工大学助理教授,专注于计算传播学研究,为本研究提供了传播学视角。
宝马大牛跳槽小米,前电车设计负责人,将向原下属汇报
小米又从宝马招来一员大将。 宝马电车设计负责人凯兰格(Kai Langer)近日官宣,自己已加盟小米汽车。 这是半年时间里,小米从宝马招募的第六员大将,凯兰格和此前的老同事们一样,在官宣消息中对小米一顿猛夸,称其是具有颠覆性的科技巨头。
全球最大AI模型聚合平台诞生!不争冠军只做擂台
2023年,当整个AI行业都在为“最强大模型”争得头破血流时,亚马逊云科技却洞察到一个关键事实:. AI的价值不在于谁的模型最强大,而在于能否为不同场景选择最适合的模型。 在2023年亚马逊云科技(AWS)正式提出“Choice Matters”(选择大于一切)战略,认为AI的未来不是某个单一模型的胜利,而是多个模型根据各自优势协同工作。
AI生死局仅存6位玩家!Claude之父:大模型天生就有“搞钱”冲动!做了CC才能懂模型如何进化!即使AI停滞,产品还要再做十年
出品 | 51CTO技术栈(微信号:blog51cto)说起来,今天已经立秋了,但 AI 圈的这个“盛夏”显然还没结束。 这几天,几大巨头接连出招,行业硝烟味渐浓。 明天大概率还有GPT-5要出来炸场。
沃尔沃也卖不动了:销量连续5个月下滑,全球裁员7%没止住亏损
曾经躺赚到手软的豪华品牌,如今也得勒紧裤腰过日子。 沃尔沃公布最新一个月的销售数据,依然没能挽回今年以来的颓势。 销量一跌再跌,7月全球交付4.93万辆,同比减少14%,已经连续5个月下滑,跌到今年冰点。
Grok 辣味模式失控!输入“庆祝”输出“脱衣”
马斯克旗下AI工具Grok又因为负面新闻上热搜了。 这一次,它在毫无明确指令的情况下,自动生成了歌手泰勒·斯威夫特的裸照。 事件发生在Grok最新的功能“Grok Imagine”刚刚上线之后。
24 帧·720p·无限交互!谷歌 Genie 3 开启“造梦引擎 2.0”
昨天,Google Deepmind推出新一代AI系统Genie 3,能够根据简单文本生成实时互动的3D虚拟世界。 这一模型不仅能构建世界,还能让用户以每秒24帧、720p分辨率的画质在其中自由探索。 与传统视频生成不同,Genie 3采用自回归方式逐帧生成画面,每一帧都会参考多达一分钟内的环境细节。
刚刚,小红书开源了多模态大模型dots.vlm1,性能直追SOTA!
最近的AI圈只能说是神仙打架,太卷了。 OpenAI终于发了开源模型,Claude从Opus 4升级到4.1,谷歌推出生成游戏世界的Genie 3引发社区热议。 国产模型这边,就在前几天,HuggingFace上排在最前面的10个开源模型还都来自国内。
刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才
就在明天,GPT-5总算要靴子落地了。 周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。 全网用户都可以立即通过API和ChatGPT访问这三个模型。
一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈
单块H200,5秒即生一个5秒视频。 最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。 论文地址:「稀疏蒸馏」全新的训练方案,实现了高效生成,让视频去噪速度实现70倍飙升。