资讯列表

分类

标签

开启 AI 自主进化时代，普林斯顿Alita颠覆传统通用智能体，GAIA榜单引来终章

智能体技术日益发展，但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流，这极大限制了其创造力、可扩展性与泛化能力。近期，普林斯顿大学 AI Lab 推出了 Alita——一个秉持「极简即是极致复杂」哲学的通用智能体，通过「最小化预定义」与「最大化自我进化」的设计范式，让智能体可以自主思考、搜索和创造其所需要的 MCP 工具。论文标题：ALITA: GENERALIST AGENT ENABLING SCALABLE AGENTIC REASONING WITH MINIMAL PREDEFINITION AND MAXIMAL SELF-EVOLUTION论文链接：：：目前已在 GAIA validation 基准测试中取得 75.15% pass@1 和 87.27% pass@3 的成绩，一举超越 OpenAI Deep Research 和 Manus 等知名智能体，成为通用智能体新标杆。

6/5/2025 8:46:00 AM

重磅开源！首个全异步强化学习训练系统来了，SOTA推理大模型RL训练提速2.77倍

来自清华大学交叉信息院和蚂蚁技术研究院的联合团队，正式开源全异步强化学习训练系统 —— AReaL-boba² (AReaL v0.3)。作为 AReaL 里程碑版本 AReaL-boba 的重磅升级，AReaL-boba² (正式全名：A-ReaL-double-boba) 坚持 boba 系列 “全面开源、极速训练、深度可定制” 的开发理念，再次加量：除了更全的功能和更详细的文档说明，更以全异步 RL 为核心，发布 SOTA 代码模型，全面奔向 Agentic RL：🚀 效率再突破：全面实现异步 RL 训练，完全解耦模型生成与训练，效果不变的前提下训练速度对比上一版本最高提升 2.77 倍，GPU 资源利用率大幅优化。 📚 上手零门槛：新增详细教程 (Step-by-Step Tutorials) 和深度文档 (Comprehensive Documentation)，覆盖安装、核心概念、算法 / 模型定制化到问题排查，新手友好，老手高效。

6/5/2025 8:40:00 AM

英伟达发布 Llama Nemotron Nano VL AI：高效精准，攻克复杂文档解析难题

Llama Nemotron Nano VL 融合了 CRadioV2-H 视觉编码器和 Llama 3.1 8B 指令微调语言模型，能同时处理多页文档中的视觉和文本元素，支持最长 16K 的上下文长度，覆盖图像和文本序列。

6/5/2025 8:01:43 AM

故渊

4 个月内增加 100 万，OpenAI 宣布付费 ChatGPT AI 商业订阅用户突破 300 万

在昨日（6 月 3 日）举办的在线直播活动中，OpenAI 公司宣布在全球范围内，其付费商业订阅用户数量超过 300 万。

6/5/2025 7:52:36 AM

故渊

Reddit 起诉 AI 初创公司 Anthropic：去年 7 月以来发起超 10 万次违规访问

在诉状中，Reddit称Anthropic是一家“姗姗来迟却自诩为AI行业白衣骑士”的AI公司，但批评其“实则完全背道而驰”。

6/5/2025 7:45:30 AM

清源

Hugging Face 称其开源机器人模型 SmolVLA 效率极高，能在苹果 MacBook 上运行

Hugging Face发布开源机器人AI模型SmolVLA，该模型轻量级但性能强大，可在消费级GPU上运行，支持异步推理堆栈，提升机器人响应速度。#AI技术# #机器人#

6/5/2025 7:40:33 AM

远洋

Mac 版 ChatGPT 变身生产力神器：AI 录音 + 云文件洞察，打造团队协作最佳助手

科技媒体 9to5Mac 昨日（6 月 4 日）发布博文，报道称 OpenAI 公司重点服务于团队和小型企业，全力推动 ChatGPT 转型为真正的生产力助手。

6/5/2025 7:38:24 AM

故渊

第一波！2025年6月精选实用设计干货合集

大家好，这是 2025 年 6 月第一波干货合集！这一期干货合集相当直接，其中绝大多数都是在线的资源和网站，其中有帮助设计师了解全球设计工作室和设计师的涉及项目的资讯和设计案例网站，有汲取设计灵感的设计截图网站，还有将截图做好看的在线工具，有基于 AI 的好用的在线配色工具，还有在线的 LOGO 设计画布工具，以及将你的 Notion 页面直接变成 PPT 的好东西。当然，在继续阅读下去之前，记得看看往期干货中有没有你感兴趣的素材：.

6/5/2025 7:26:14 AM

陈子木

构建生产级LLM应用完整指南：从原型到落地的全流程实践

一、LLM应用落地的真实挑战当Jasper AI的写作助手因意外流量在数小时内崩溃时，人们意识到：让LLM应用从实验室走向真实用户，绝非简单的代码迁移。根据Anthropic 2024年开发者调查，73%的LLM应用在触达用户前折戟沉沙，问题并非出在AI模型本身，而是支撑系统无法应对真实世界的复杂性——用户的不可预测输入、API的偶发故障、成本的突然飙升，这些都是原型阶段未曾遭遇的“暗礁”。本文将以实战为导向，结合代码示例与架构设计，详解如何将一个基于OpenAI API的简单聊天机器人，升级为具备容错能力、成本可控且可弹性扩展的生产级系统。

6/5/2025 2:45:00 AM

大模型之路

十步优化超越强化学习，仅需1条未标注数据！后训练强势破局

在具备强大的通用性能之后，当下大模型的研究方向已经转向了「如何解决特定且复杂的推理任务」，比如数学问题、分析物理现象或是构建编程逻辑。要想达到更高的性能，除了海量文本的预训练之外，往往还需要进一步的后训练。主流后训练方法是采用强化学习（RL），特别是结合可验证奖励的强化学习（RLVR）。

6/5/2025 2:33:00 AM

新智元

2025年，Mamba“联姻”Transformer，打造史上最强视觉骨干网络！

一眼概览MambaVision 提出一种混合 Mamba-Transformer 视觉骨干网络，首次将状态空间模型（SSM）与自注意力机制融合，显著提升图像分类、检测和分割任务的准确率与效率，达到新一代性能-速度最优前沿。核心问题虽然 Mamba 模型在语言任务中展现了优秀的长序列建模能力，但其自回归结构难以高效捕捉图像中的全局空间依赖，限制了在计算机视觉中的表现。如何在保持高吞吐和低复杂度的前提下建模图像中的长程依赖，是本研究要解决的核心问题。

6/5/2025 2:15:00 AM

萍哥学AI

人工智能和知识图谱四：知识图谱的超大规模产品

一、亚马逊网络服务 (AWS) — Amazon NeptuneAWS 的主要图形数据库服务是Amazon Neptune，这是一款完全托管的图形数据库引擎。 Neptune 功能多样，既支持使用 SPARQL 查询的RDF 模型，也支持使用 Apache TinkerPop Gremlin 查询的属性图模型。这种双重支持使 Neptune 适用于各种 KG 实现——您可以使用 RDF/OWL 存储语义知识图并通过 SPARQL 进行查询，或者将属性图方法与 Gremlin 结合使用。

6/5/2025 2:00:00 AM

晓晓

AI Agent的新技术栈：Kafka、A2A、MCP 和 Flink

在网络拥有 HyperText Transfer Protocol (HTTP) 之前，在电子邮件拥有 Simple Mail Transfer Protocol (SMTP) 之前，我们受困于定制化集成、碎片化系统和脆弱的工作流程。直到开放协议和共享基础设施出现，互联网才真正实现规模化，解锁了现代网络、全球通信和整个经济体系。如今，AI 代理正处于类似的预标准化阶段。

6/5/2025 2:00:00 AM

AI研究生

AI Agent落地面临的三大挑战

前面为大家介绍过AI Agent的发展史和工程结构模型，并对Agent的典型代表——Manus的技术架构进行了详细解析。不少同学看完后纷纷留言说，他们在工作中也尝试在推动落地Agent，但结果总是不尽如意，希望我能给出一些建议。我自己目前对AI Agent也处在探索实践阶段，并无法给出很好的建议。

6/5/2025 1:55:00 AM

写文章老张

美团找黄龄，饿了么请蓝盈莹，京东要不用AI找个代言人？

自从京东进军外卖行业，无论是骑手福利、广告舆论还是红包减免，都与美团外卖展开了全面竞争。就在这红黄两家打得不可开交之际，市场占有率持续下滑的饿了么虽想加入战局却有心无力，只得发条微博调侃自己不参与口水战，顺便搞些活动发放红包来维持活跃度。看上去这些广告卡通配图还是用 AI 生成的。

6/5/2025 12:34:00 AM

龙爪槐守望者

游戏 AI 加速竞赛，消息称腾讯游戏打造游戏创作 AI 全链路解决方案业务“VISVISE”

腾讯游戏打造了一个名为“VISVISE”的游戏创作 AI 全链路解决方案业务，其中包括由旗下产品效能部 GoSkinning 团队打造的 Auto LUV 和裙摆 AI 等开发工具，并且各类 AI 游戏工具正在紧锣密鼓地开发中。（Tech 星球）

6/4/2025 6:47:14 PM

汪淼

Manus推出文生视频功能，力图与OpenAI的Sora一较高下

AI 初创公司 Manus 近日宣布推出其全新的 “文生视频” 功能，旨在为用户提供通过简单文本指令生成视频的便捷体验。该功能目前已经面向 Basic、Plus 和 Pro 会员用户开放抢先体验。 Manus 在社交媒体平台 X 上表示，用户只需输入文本命令，其智能系统便能在几分钟内将这些指令转换成结构清晰、故事连贯的视频，展示了其在 AI 视频生成领域的强大能力。

6/4/2025 6:01:04 PM

AI在线

AI 逐渐取代基层员工，科技公司初级招聘大幅下降

在最近的 Snowflake Summit2025主题演讲中，OpenAI 首席执行官山姆・奥尔特曼（Sam Altman）指出，越来越多的企业开始将 AI 智能体视为基层员工。奥尔特曼表示，许多公司的员工如今的工作重心已经转向为 AI 智能体分配任务、评估其结果的质量、整合工作内容并提供反馈。这一工作模式与管理基层员工的方式非常相似。

6/4/2025 6:01:04 PM

AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science 腾讯 Agent Claude 芯片 Stable Diffusion 具身智能蛋白质 xAI 开发者生成式人形机器人神经网络机器学习 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 字节跳动工具华为 AGI 计算大型语言模型 AI设计搜索生成式AI 视频生成亚马逊 DeepMind AI模型特斯拉场景深度学习 Transformer 架构 MCP Copilot 编程视觉