理论

AI Agent、传统聊天机器人有何区别？如何评测？这篇30页综述讲明白了

论文作者包括来自上海交通大学的朱家琛、芮仁婷、单榕、郑琮珉、西云佳、林江浩、刘卫文、俞勇、张伟楠，以及华为诺亚研究所的朱梦辉、陈渤、唐睿明。本文第一作者是朱家琛，上海交通大学博士生，主要研究兴趣集中在大模型推理，个性化 Agent。本文通讯作者是张伟楠，上海交通大学教授，研究方向包含强化学习、数据科学、机器人控制、推荐搜索等。

7/3/2025 9:38:48 AM

ElementPlusX + RuoyiAI：Vue3 首个 AI 开发模板开源了！

在 AI 技术飞速发展的今天，开发一款自己的 AI 应用成为了许多开发者的追求。然而，从零开始搭建一个完整的 AI 开发环境，往往需要耗费大量的时间和精力。为了帮助开发者快速进入 AI 开发领域，一个基于 Vue3.5 的全新 AI 开发模板——ruoyi-element-ai 正式开源了！

7/3/2025 9:36:35 AM

小4子

刚刚，神秘模型火了！网友：是OpenAI要开源？

刚刚，OpenRouter 上出现了一个神秘模型，该模型被命名为「Cypher Alpha」。其可以免费使用，100 万 token 上下文，还具有推理能力。注：OpenRouter 是一个大模型 API 路由器，旨在将各种 AI 模型和服务集成到一个统一的接口中。

7/3/2025 9:31:52 AM

让GUI智能体不再「过度执行」，上海交大、Meta联合发布OS-Kairos系统

本文第一作者是上海交通大学计算机学院三年级博士生程彭洲，研究方向为多模态大模型推理、AI Agent、Agent 安全等。通讯作者为张倬胜助理教授和刘功申教授。一、论文概述1.1 研究背景随着多模态大语言模型（Multimodal Large Language Models, MLLMs）的快速发展，越来越多的研究聚焦于构建能够在图形用户界面（GUI）中执行复杂任务的智能体。

7/3/2025 9:27:57 AM

前不久，苹果差点犯下最愚蠢的错误

8年资深研究员离职，整个核心团队威胁集体跳槽，数百万美元的挖角邮包 —— 这不是什么好莱坞大片的剧情，而是最近一周苹果AI部门正在经历的真实危机。 6月30日，Bloomberg爆出一个让整个科技圈都震惊的消息：苹果最核心的AI团队MLX，差点就这么没了。具体发生了什么？

7/3/2025 9:19:28 AM

阿丸笔记

IEEE TPAMI 2025 | 北京大学提出LSTKC++，长短期知识解耦与巩固驱动的终身行人重识别

本文的第一作者为北京大学博士二年级学生徐昆仑，通讯作者为北京大学王选计算机研究所研究员、助理教授周嘉欢。近日，北京大学王选计算机研究所周嘉欢团队在人工智能重要国际期刊 IEEE TPAMI 发布了一项最新的研究成果：LSTKC 。该框架引入了长短期知识解耦与动态纠正及融合机制，有效保障了模型在终身学习过程中对新知识的学习和对历史知识的记忆。

7/3/2025 9:16:41 AM

字节图像生成新模型：主打多主体一致性，新基准数据集同时亮相

设定角色，让AI照“本”生成主角不变的不同图像，对于各路AIGC工具来说一直是不小的挑战。而现在，字节再进一步，最新发布多主体控制生成模型Xverse——既可以对设定好的每个主体进行精确控制，也不会破坏图像的生成质量。多主体？

7/3/2025 9:09:51 AM

混合专家网络模型架构（MoE）已经成为当前大模型的一个主流架构选择，以最近开源的盘古Pro MoE为例，其基于MoGE架构构建的混合专家架构，总参数量达720亿，激活参数量为160亿，专门针对昇腾硬件优化，在性能与效率上表现突出。盘古还实现了在推理时做到又快又稳。在技术特性上，盘古模型引入 “快思考” 和 “慢思考” 双系统，可根据问题复杂度自动切换响应模式，并在推理性能上实现突破——在昇腾800I A2上单卡推理吞吐性能达1148 tokens/s，经投机加速技术可提升至1528 tokens/s，显著优于同等规模稠密模型。

7/3/2025 9:05:40 AM

ChatGPT诞生内幕大曝光！发布前一晚还在纠结

ChatGPT诞生内幕最新大曝光：纳尼？？原来“ChatGPT”这个名字，直到发布前一晚才确定下来。

7/3/2025 9:01:49 AM

Grok 4意外提前曝光，xAI巨额融资700亿，马斯克宣布“重写人类知识库”

马斯克旗下xAI的重磅炸弹Grok 4提前泄露了！有开发者在xAI控制台的源代码中意外发现了两个全新模型Grok 4和Grok 4 Code。图片与此同时，xAI刚刚完成了一轮100亿美元（约716亿人民币）的巨额融资。

7/3/2025 8:50:20 AM

同时监督和强化的单阶段大模型微调，告别“先背书再刷题”，推理泛化双提升｜中科院&美团等

通过单阶段监督微调与强化微调结合，让大模型在训练时能同时利用专家演示和自我探索试错，有效提升大模型推理性能。中国科学院自动化研究所深度强化学习团队联合美团，提出一种单阶段监督-强化微调方法——SRFT (Supervised Reinforcement Fine-Tuning)。该方法通过基于熵的动态加权机制，将两种训练范式结合。

7/3/2025 8:33:00 AM

一文详解Character AI：实用指南+ ChatGPT、Gemini对比分析

译者 | 晶颜审校 | 重楼本指南将深入剖析Character AI的运行机制、功能特性及其存在的局限性。近年来，生成式人工智能领域发展态势迅猛，其应用范畴已远超单纯的文本生成领域。在众多备受瞩目的新兴平台中，Character AI是一款支持用户以对话形式与人工智能生成角色进行交互的工具。

7/3/2025 8:03:54 AM

晶颜

OpenAI播客再谈AI编程大战！开发者是最有福的人：特定需求的代码模型将涌现！主持人说漏嘴：我最喜欢Claude！

编译、整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）OpenAI第二期播客来了！阵容也是相当重磅！嘉宾是OpenAI 首席研究官马克·陈（Mark Chen）和ChatGPT 负责人尼克·特利（Nick Turley）。

7/3/2025 7:55:29 AM

伊风

AI能经营实体店吗？Anthropic的Claude尝试后，结果糟糕得既离谱又滑稽

想象一下这样的场景：你让AI完全掌控一家小店，不仅负责收银机，而且负责整个店铺的运营，包括定价、库存管理、客户服务、与供应商的谈判，那么，可能会出什么错呢?新的研究给出了明确的答案：一切皆有可能出错。 Anthropic公司的AI助手Claude在旧金山办公室管理了一家小店约一个月，结果读起来就像是一个从未真正经营过业务的人写的商学院案例研究——而事实证明，确实如此。这项名为“Project Vend”的实验，是与AI安全评估公司Andon Labs合作进行的，是对具有显著经济自主权的AI系统进行的首次现实世界测试之一。

7/3/2025 7:07:00 AM

Michael

AI在不安全代码上训练后变得邪恶

研究揭示，用不安全代码微调 LLM 会导致“突发不一致”，模型可能产生有害建议。 GPT-4o 等模型在编码无关查询中表现出反人类、赞扬纳粹等行为。需警惕数据投毒和后门攻击，加强 AI 对齐，防范 ASI 风险。

7/3/2025 4:00:00 AM

岱军

爆改RAG！让你的AI检索“见人说人话，见鬼说鬼话”——自适应检索的魔法揭秘

一、RAG的“尴尬”与“觉醒”1.1 传统RAG的“直男式”检索RAG系统的基本套路大家都懂：用户提问，系统先去知识库里“搜一搜”，然后把搜到的内容丢给大模型“写一写”，最后输出一段看似高大上的答案。但问题来了：用户问“XAI是什么？ ”——你给我一堆论文段落，啰嗦半天没说重点。

7/3/2025 4:00:00 AM

许泽宇

深入浅出RAG详解：语言模型的“开卷考试”——让模型答案锚定现实的外部“记忆”

引言大型语言模型（LLMs）彻底革新了自然语言处理领域，但其对静态内部知识的依赖，在事实准确性和时效性方面暴露出根本性局限。检索增强生成（RAG）作为一种强大的范式应运而生，它构建了一种混合架构，将模型输出动态锚定于外部可验证信息。本文将深入探讨RAG框架的核心机制——从检索器与生成器组件到参数化记忆与非参数化记忆的关键区别，揭示其在知识密集型应用中实现前沿性能的奥秘。

7/3/2025 2:12:00 AM

柏企阅文

机器学习实战：糖尿病预测及可视化分析

你一生中可能已经多次听说过糖尿病。它如此普遍地流行。根据国际糖尿病联合会的数据，2024年有超过340万人死于糖尿病。

7/3/2025 1:45:00 AM

云朵君

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程 Copilot 视觉

理论