理论

Dify 1.7.0重磅更新：基于支持OAuth认证功能的插件开发GitHub智能体

前言Dify是一款开源的大语言模型应用开发平台，旨在降低AI应用的开发门槛，帮助开发者和企业快速构建、部署及管理生成式AI应用。通过接入Dify的RESTful API，可以将Dify智能体集成到你的业务系统。全新版本Dify v1.7.0 已正式发布，为插件系统带来了两个关键更新: OAuth认证支持与插件自动升级策略增强，进一步释放Dify的灵活性与稳定性。

7/25/2025 1:46:47 PM AI大模型应用开发

“流量波动”下的DeepSeek：东南亚机遇显现，但观望心态未解

几个月前，当DeepSeek横空出世、席卷全球时，曾引发行业欢呼雀跃。但数月过去，“DeepSeek热潮已过”的声音在国内外蔓延。关注其近期表现，或许能让我们深入理解中国大语言模型（LLM）存在的机遇和挑战。

7/25/2025 11:44:34 AM 小刀

为什么日本代码‘稳如狗’？走访丰田等多家日本团队：写代码像做寿司，每天进步1%「侘寂」美学让系统跑几十年，网友：任天堂都30年了

编译 | 云昭这周一，小编偶然看到了一篇角度很奇特的、有关日本代码风格的文章。虽说现在 Vibe Coding 盛行，很多老铁们都不那么关注代码本身了，但若要真的让 AI 工具编写含金量组足够的代码，反而对于开发者的“代码审美”提出了更高的要求。这篇文章的作者是一位老鸟后端工程师 Sohail Saifi，也在用各种 AI Coding 工具。

7/25/2025 10:51:38 AM 云昭

智能体协作的力量：Anthropic 的「Research」多智能体实践

大家好，我是肆〇柒。在 AI 领域，多智能体系统正逐渐成为解决复杂任务的关键技术之一。昨天，我看到一篇出自 Anthropic 官网 Engineering 板块的博文，主要分享了Anthropic 在 Research 这个功能对于多智能体的工程实践。

7/25/2025 10:31:52 AM 肆零柒

DeepMind掌门自曝AGI倒计时5年！算力需求暴增10倍，推理计算吞噬一切

Hassabis绝对是当今世界上最聪明、最有趣的大脑之一。在最新播客中，他表示「自然界里任何能被发现的规律，都能被机器学习算法高效地学会和模仿。」AlphaGo和AlphaFold在给可能性多到无法想象的复杂问题建立一个模型。

7/25/2025 10:29:23 AM

北大-灵初重磅发布具身VLA全面综述！一文看清VLA技术路线与未来趋势

如今，GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间，以实现具身智能。这其中最受关注的前沿方向之一，便是视觉 - 语言 - 动作模型（Vision-Language-Action Models，简称 VLA）。

7/25/2025 10:19:44 AM

老黄自曝皮衣口袋藏“秘密期权池”！随时准备奖励员工，团队亿万富翁数量世界第一

黄仁勋亲口承认：他随身带着“秘密期权池”，随时奖励表现出色的员工。在最新采访的结尾，主持人问起这个传闻，老黄开玩笑式的回答“现在就装在我的口袋里”。这位掌管着全球市值最高科技公司之一的CEO，把奖励员工这件事做得如此随性又直接。

7/25/2025 10:11:10 AM

Resume Builder报告：多数经理使用AI来决定，晋升或解雇员工

根据Resume Builder最近的一项调查，人工智能在人事决策中的作用日益凸显。这项调查涵盖了1,342名美国有直接下属的管理者，结果显示，许多管理者正在依赖人工智能来做出一些关键的人事决策，包括晋升、加薪、裁员甚至解雇。调查发现，大约65%的管理者表示他们在工作中使用人工智能工具，而在这些管理者中，有94%的人利用这些工具来对他们的直接下属进行决策。

7/25/2025 10:09:25 AM

AgentRM 奖励建模：智能体泛化能力的“导航仪”与“加速器”

大家好，我是肆〇柒。在 AI 领域，大型语言模型（LLM）基础智能体正逐渐成为解决复杂交互任务的关键力量。然而，一个不容忽视的问题是：尽管它们在训练中见过的任务上表现出色，但面对未见过的新任务时，泛化能力却往往不尽人意。

7/25/2025 10:06:41 AM 肆零柒

媲美Claude 4，支持100万上下文！阿里开源超强代码AI Agent模型

阿里巴巴开源了超强AI Agent模型Qwen3-Coder-480B-A35B-Instruct。根据阿里公布的测试数据显示，Qwen3-Coder在OpenAI发布的Agent测试基准SWE-bench Verified中，500轮交互的测试分数达到了69.6%，常规分数为67%，可媲美最强闭源代码模型之一Claude Sonnet 4的70.4%和68%。同时Qwen3-Coder也大幅度超越了DeepSeek R1-0528版本的41.4%和V3-0324版本的38.8%。

7/25/2025 10:06:05 AM

vivo自研蓝河操作系统内核开源！Rust开发新机遇来了

芜湖~在AI重塑智能终端这个关键时刻，首个适用于嵌入式和移动设备的开源Rust内核，来了！ vivo最新宣布，开源自研蓝河操作系统内核。它完全由Rust语言编写，从根本上解决了传统C语言在内存安全、维护成本上的长期难点。

7/25/2025 9:35:47 AM

亿级短视频数据突破具身智能Scaling Law！Being-H0提出VLA训练新范式

如何让机器人从看懂世界，到理解意图，再到做出动作，是具身智能领域当下最受关注的技术重点。但真机数据的匮乏，正在使对应的视觉-语言-动作（VLA）模型面临发展瓶颈。尽管业界已投入大量资源构建数据平台（如马斯克主导的“数据工厂”项目），现有真机数据规模仍较模型规模定律所需的上亿级训练样本相差三个数量级。

7/25/2025 9:31:49 AM

Routine：把 GPT-4o 准确率从 41% 拉到 96% 的企业级 Agent 稳定器

大家好，我是肆〇柒。在企业落地 AI 的进程中，自主智能体凭借其强大的自主决策与任务执行能力，可以成为企业提升效率、优化流程的关键力量。然而，当我们将视角聚焦于企业级应用场景时，不难发现，部署智能体系统并非易事。

7/25/2025 9:31:34 AM 肆零柒

马斯克23万GPU训练Grok-这规模让OpenAI都要颤抖

马斯克昨天在X上发了一条消息："xAI的目标是在5年内部署相当于5000万个H100的AI算力。 "5000万个H100，这什么概念？我算了一下，这相当于35个核电站的发电量才能供得起。

7/25/2025 9:25:05 AM 阿丸笔记

突破单token预测局限！南洋理工首次将多token预测引入微调，编程任务准确率提升11.67%

告别Next-token，现在模型微调阶段就能直接多token预测！从GPT到Claude，当前主流LLM都依赖next-token prediction（下一token预测）进行训练，但它却让AI很难真正理解跨越多token的完整概念。于是南洋理工大学最近提出了一项新技术——概念感知微调（CAFT），首次实现将multi-token prediction（多token预测）引入微调阶段，让模型能够像人类一样理解和学习完整概念。

7/25/2025 9:24:43 AM

IEEE ICDCS’ 25 | 提速79%！上交大新方法优化企业级AI流程调度

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。⽬前，服务这些应⽤任务需要⾯对运⾏时⻓不确定、⼯作流结构不确定等问题，这对现有集群任务调度算法提出了极大挑战，并严重影响任务运⾏效率。为了解决上述问题，上海交通大学朱怡飞教授团队联合江行智能提出调度框架LLMSched，通过引入三类新节点来扩展传统任务表征方法实现复合LLM应用任务的有效表征，借助贝叶斯网络识别可降低不确定性的关键节点，并以信息熵衡量节点的熵减程度。

7/25/2025 9:22:13 AM

AREAL 开源：解耦架构与创新算法驱动的强化学习系统

大家好，我是肆〇柒。推理能力在当下 AI 领域，尤其自然语言处理、智能决策系统、科学研究辅助等众多关键领域，已然成为推动技术革新的关键要素。然而，目前大型语言模型虽已取得瞩目成果，但在处理复杂逻辑时，常受困于逻辑连贯性把控，长链推理面临信息丢失、逻辑断裂问题，长序列输出任务下推理耗时久、资源消耗大，这些痛点严重制约模型应用场景拓展与性能深化。

7/25/2025 9:03:24 AM 肆零柒

因为不用AI写代码，我在终面挂了 | 一个程序员的奇葩面试经历

“因为不是AI First，我在终面挂了。 ”最近，一外国小哥的经历意外火了！他表示自己几个月前被解雇，终于来到了一家自己本来很看好的初创公司，并且走到了终面，与CEO面对面。

7/25/2025 8:45:00 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉