模型

RL缩放王炸！DeepSWE开源AI Agent登顶榜首，训练方法、权重大公开

今天凌晨，著名大模型训练平台Together.ai联合Agentica开源了创新AI Agent框架DeepSWE。 DeepSWE是基于阿里最新开源的Qwen3-32B模型之上，完全使用强化学习训练而成。除了权重之外，训练方法、日志、数据集等所有内容也全部开源，以帮助开发人员深度学习和改进Agent。

7/3/2025 2:58:16 PM

DeepSeek-R2！？神秘模型惊现竞技场，真实身份引网友猜测

DeepSeek-R2，终于要来了？大模型竞技场秘密上线了一个叫steve的神秘模型，在对话中透露自己来自DeepSeek。不过，网友们并不满足于知道steve的厂商，开始讨论起了steve的具体身份。

7/3/2025 2:57:51 PM

一份假简历领5份硅谷AI工资，印度老哥真是不得了

离谱！一群AI初创公司竟然集体控诉：我们被一个印度老哥骗了。这个名叫Soham Parekh的人，在隐瞒真实情况下进行远程兼职，最多一次打了五份工。

7/3/2025 2:56:12 PM

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

多模态对齐模型近年来凭借对比学习范式在图像检索、文生图等任务中表现出色。然而，主流框架（如 CLIP）需要从零训练文本和图像编码器，导致计算成本高昂，尤其在处理长文本或大规模数据时更加明显。近期，相关工作尝试将预训练的大语言模型（LLM）作为文本编码器融入多模态对齐框架，并在分类和检索任务上观察到性能提升。

7/3/2025 9:49:43 AM

ChatGPT惨败Llama！MIT官宣AI开飞船0%失败率，马斯克火星殖民不再是梦

刚刚，一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了！在由Kerbal Space Program衍生的航天挑战赛中，MIT等研究团队让ChatGPT作为「主控」智能体，竟然一举夺得第二名。这项比赛被视为太空探索自主化的重要实验场，而AI的表现，也预示着「AI开飞船」或许比我们想象的更近！

7/3/2025 9:46:37 AM

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

将大语言模型（LLMs）与复杂的人类价值观对齐，仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习（RLHF）。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分，最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

7/3/2025 9:41:27 AM

AI Agent、传统聊天机器人有何区别？如何评测？这篇30页综述讲明白了

论文作者包括来自上海交通大学的朱家琛、芮仁婷、单榕、郑琮珉、西云佳、林江浩、刘卫文、俞勇、张伟楠，以及华为诺亚研究所的朱梦辉、陈渤、唐睿明。本文第一作者是朱家琛，上海交通大学博士生，主要研究兴趣集中在大模型推理，个性化 Agent。本文通讯作者是张伟楠，上海交通大学教授，研究方向包含强化学习、数据科学、机器人控制、推荐搜索等。

7/3/2025 9:38:48 AM

刚刚，神秘模型火了！网友：是OpenAI要开源？

刚刚，OpenRouter 上出现了一个神秘模型，该模型被命名为「Cypher Alpha」。其可以免费使用，100 万 token 上下文，还具有推理能力。注：OpenRouter 是一个大模型 API 路由器，旨在将各种 AI 模型和服务集成到一个统一的接口中。

7/3/2025 9:31:52 AM

让GUI智能体不再「过度执行」，上海交大、Meta联合发布OS-Kairos系统

本文第一作者是上海交通大学计算机学院三年级博士生程彭洲，研究方向为多模态大模型推理、AI Agent、Agent 安全等。通讯作者为张倬胜助理教授和刘功申教授。一、论文概述1.1 研究背景随着多模态大语言模型（Multimodal Large Language Models, MLLMs）的快速发展，越来越多的研究聚焦于构建能够在图形用户界面（GUI）中执行复杂任务的智能体。

7/3/2025 9:27:57 AM

IEEE TPAMI 2025 | 北京大学提出LSTKC++，长短期知识解耦与巩固驱动的终身行人重识别

本文的第一作者为北京大学博士二年级学生徐昆仑，通讯作者为北京大学王选计算机研究所研究员、助理教授周嘉欢。近日，北京大学王选计算机研究所周嘉欢团队在人工智能重要国际期刊 IEEE TPAMI 发布了一项最新的研究成果：LSTKC 。该框架引入了长短期知识解耦与动态纠正及融合机制，有效保障了模型在终身学习过程中对新知识的学习和对历史知识的记忆。

7/3/2025 9:16:41 AM

字节图像生成新模型：主打多主体一致性，新基准数据集同时亮相

设定角色，让AI照“本”生成主角不变的不同图像，对于各路AIGC工具来说一直是不小的挑战。而现在，字节再进一步，最新发布多主体控制生成模型Xverse——既可以对设定好的每个主体进行精确控制，也不会破坏图像的生成质量。多主体？

7/3/2025 9:09:51 AM

混合专家网络模型架构（MoE）已经成为当前大模型的一个主流架构选择，以最近开源的盘古Pro MoE为例，其基于MoGE架构构建的混合专家架构，总参数量达720亿，激活参数量为160亿，专门针对昇腾硬件优化，在性能与效率上表现突出。盘古还实现了在推理时做到又快又稳。在技术特性上，盘古模型引入 “快思考” 和 “慢思考” 双系统，可根据问题复杂度自动切换响应模式，并在推理性能上实现突破——在昇腾800I A2上单卡推理吞吐性能达1148 tokens/s，经投机加速技术可提升至1528 tokens/s，显著优于同等规模稠密模型。

7/3/2025 9:05:40 AM

ChatGPT诞生内幕大曝光！发布前一晚还在纠结

ChatGPT诞生内幕最新大曝光：纳尼？？原来“ChatGPT”这个名字，直到发布前一晚才确定下来。

7/3/2025 9:01:49 AM

AI在不安全代码上训练后变得邪恶

研究揭示，用不安全代码微调 LLM 会导致“突发不一致”，模型可能产生有害建议。 GPT-4o 等模型在编码无关查询中表现出反人类、赞扬纳粹等行为。需警惕数据投毒和后门攻击，加强 AI 对齐，防范 ASI 风险。

7/3/2025 4:00:00 AM

岱军

Grok 4源代码刚刚泄露！上线倒计时，马斯克xAI估值破1130亿，大模型要变天

突发消息：Grok 4即将上线！与此同时，xAI再度获得百亿美元融资，估值已经直冲1130亿。马斯克的AI帝国，再度以可怕的规模扩张。

7/2/2025 2:42:03 PM

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

如果一个视觉语言模型（VLM）只会“看”，那真的是已经不够看的了。因为现在真实世界的任务简直不要太复杂，要想让AI干点实事儿，光有多模态还不够，必须还得有深度思考的强推理能力。而就在刚刚，智谱发布并开源了一个仅9B大小的模型——GLM-4.1V-9B-Thinking，在28项评测中一举拿下23个SOTA！

7/2/2025 2:39:29 PM

ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO：扩散/自回归模型训练新范式，刷新图像生成SOTA

文章一作郑凯文为清华大学三年级博士生，研究方向为深度生成模型，曾提出流式扩散模型最大似然估计改进技术 i-DODE，扩散模型高效采样器 DPM-Solver-v3，扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化（DDO）。该方法将基于似然的生成模型（如扩散模型、自回归模型）隐式参数化为 GAN，从而设计出一种无需额外网络、训练高效的微调方法，并大幅突破传统最大似然训练的性能瓶颈。

7/2/2025 9:21:30 AM

Meta“1亿美元年薪”震荡硅谷！奥特曼回应：总有人唯利是图，而且都算不上TOP

疯狂，太疯狂。这两天，硅谷乃至全球AI领域的注意力都被Meta老板扎克伯克带走了，毕竟也不是谁都能boss直聘，一举挖走8名OpenAI核心员工。更何况其中大部分，还是以聪明能干吃苦耐劳著称的华人研究员。

7/2/2025 9:13:56 AM

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月单张4090跑到30fps，范浩强团队让VLA实时跑起来了一张合影就能泄露全家信息？央视紧急预警：“读心AI”正让社交晒图变成隐私炸弹可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 Sora、可灵、即梦哪家强？AI视频软件深度测评！免费！让图片放大不失真的位图转矢量图神器 Tmttool 阿里云通义模型首次大规模赋能双11，单日翻译调用量突破14亿次

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 AI新词 Meta 微软智能用户 GPT 学习技术智能体马斯克 Gemini Anthropic 图像英伟达 AI创作训练 LLM 论文代码算法 AI for Science Agent 苹果 Claude 芯片腾讯 Stable Diffusion 蛋白质开发者 xAI 生成式神经网络机器学习 3D RAG 具身智能 AI视频人形机器人研究大语言模型百度生成 GPU Sora 工具华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景生成式AI 深度学习 DeepMind 架构 AI模型亚马逊特斯拉 Transformer 编程视觉 MCP 预测

模型