理论

谷歌发布本地具身智能模型！全程无联网执行精细操作，从人形机器人到工业机器人全覆盖

机器人终于有了自己的“离线大脑”。 Google DeepMind团队首个可以完全在机器人本地运行的视觉-语言-动作（VLA）模型Gemini Robotics On-Device发布。这个模型不仅能离线运行，还保持了相当强悍的操作能力，能遵循指令完成各种需要精细操作的任务。

6/25/2025 9:04:59 AM

机器人视觉语言导航进入R1时代！港大联合上海AI Lab提出全新具身智能框架

你对着家里的机器人说：“去厨房，看看冰箱里还有没有牛奶。 ”它不仅准确走到了厨房，还在移动过程中避开了椅子，转身打开冰箱，并回答你：“还有半瓶。 ”这不是遥远的科幻，而是视觉语言导航技术的下一站。

6/25/2025 9:02:05 AM

ICML 2025 | 生成式视角重塑监督学习！标签不只是答案，更是学习指南

生成式视角可以对监督学习重新思考乃至重新定义！想象你在教一个学生解数学题——你会直接让他交卷对答案，还是会让他参考完整答案来理解解题思路？如今，一种全新的监督学习范式正受到关注：标签不应只是用于对照回答的标准答案，更可能成为学习过程中的辅助参考。

6/25/2025 8:59:49 AM

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM | Transformer作者团队

Thinking模式当道，教师模型也该学会“启发式”教学了——由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI，带着他们的新方法来了！这个方法要求教师模型像优秀的人类教师一样，根据已知解决方案输出清晰的逐步解释，而不再是从头开始自己解决。用Sanaka AI的新方法训练出的7B小模型，在传授推理技能方面，比671B的DeepSeek-R1还要有效。

6/25/2025 8:54:03 AM

合成数据>人工数据，绝对性能暴涨超10个点！仅需任务定义，高效微调大模型

尽管如GPT-4和Gemini等基础模型已在通用语言理解方面设立了新的行业标杆，但它们在需要深度领域知识的专业领域中，其表现常常不尽如人意。当面临数学、医学、法律及金融等专门任务时，这些模型时常表现不佳，因为这些领域高度依赖特定的专业知识。传统上，为了让这些模型适应特定领域，最直接的方法是使用大规模的人类标注数据进行微调。

6/25/2025 8:53:00 AM

为什么你的 AI 数据战略应该包含 MCP

随着代理系统变得越来越复杂，企业能力在这些系统中作为工具出现，建立明确且一致的规则对于自主工作流程的成功至关重要。模型上下文协议 (MCP) 为代理、LLM 和企业系统提供通用语言。将 MCP 纳入 AI 数据战略的企业将能够构建新功能，确保信任和可审计性，并适应快速发展的创新。

6/25/2025 2:30:00 AM

晓晓

你的 Cursor 用对了吗：SWE agent 智能协作之道

大家好，我是肆〇柒。做过程序猿的朋友，或者与程序猿群体走的近的朋友，应该了解程序猿这个群体，每天都在正面临着日益增长的系统复杂性和高效交付的巨大压力。为了提升生产力并应对这些挑战，Gen AI 工具，尤其是软件工程智能体（SWE agent，比如 cursor 等），逐渐成为了开发者的得力助手。

6/25/2025 2:00:00 AM

肆零柒

无训练智能体蒸馏：AgentDistill 低成本高能效的智能进化方案

大家好，我是肆〇柒。在 AI 领域，大型语言模型（LLM）的蒸馏技术正以前所未有的速度发展，成为压缩模型规模、降低推理成本的关键手段。然而，现有的 LLM 智能体蒸馏方法却面临着高计算成本、泛化能力不足等诸多挑战。

6/25/2025 1:00:00 AM

肆零柒

史上最高种子轮花落AI：20亿美元断档领先，苹果Meta抢着都投不进，扎克伯格转头挖联创也遭拒

AI圈融资收购挖人大战，乱成一锅粥了！最新消息，OpenAI前CTO创办的Thinking Machines完成20亿美元种子轮融资，不仅刷新了AI领域的融资纪录，也成为有史以来规模最大的种子轮融资。最初，市场传闻该公司的融资目标约为10亿美元，在短短数月内目标金额翻倍。

6/24/2025 3:17:02 PM

任务太难，连ChatGPT都弃了！最强AI神器一键拆解，首测来袭

想转型AI做产品经理，却不知如何入手？想搞副业月入一万，但脑子里只有零散想法？想知道AI时代该学什么专业最有前景？

6/24/2025 1:54:22 PM

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

现在的大模型基本都具备零样本泛化能力，但要在真实场景中做特定的适配，还是得花好几个小时来对模型进行微调。即便是像LoRA这样的参数高效方法，也只能缓解而不能消除每个任务所需的微调成本。刚刚，包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员，提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs！

6/24/2025 1:52:38 PM

别做 ChatGPT 竞品！Sam Altman 给 AI 企业划“禁区”：这块我们有“护城河”

在Y Combinator 最近在旧金山举办的 AI Startup School 活动中，OpenAI CEO Sam Altman 接受了Garry Tan的采访。他在台上说：“别去做我们要做的那个 ChatGPT。 ”图片Altman 没有拐弯抹角，清楚说出：“我们要做的事情，就是把 ChatGPT 打造成最好的超级助理。

6/24/2025 1:50:20 PM

文摘菌

3D VLA新范式！中科院&字节Seed提出BridgeVLA，斩获CVPR 2025 workshop冠军！

只需要三条轨迹，就能取得 96.8% 的成功率？视觉干扰、任务组合等泛化场景都能轻松拿捏？或许，3D VLA 操作新范式已经到来。

6/24/2025 11:50:37 AM

OpenAI硬件陷“抄袭门”，商标/设计极其相似，官方火速删帖

才官宣1个月，奥特曼未出世的AI硬件，已陷入“抄袭门”。最新消息，OpenAI斥64亿美金收购的AI硬件公司IO，因商标、产品设计侵权等问题，被告上法庭。原告是IYO，2021年从Google X孵化成立，主营下一代“无屏幕语音计算设备”。

6/24/2025 11:49:20 AM

携程机票前端Web流式通信SSE全链路应用实践

作者简介Chris Xia，携程前端开发专家，关注新技术革新和研发效率提升。本文介绍了携程机票前端基于Server-Sent Events（SSE）实现服务端推送的企业级全链路通用技术解决方案。深入探讨 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节，为类似使用场景提供普适性参考和借鉴。

6/24/2025 9:51:47 AM

Chris Xia

引言传统的文档切分方法通常采用基于特定字符和固定长度的切分策略，这种方法虽然实现简单，但在实际应用中容易割裂完整的语义单元，导致后续的信息检索与理解受到影响。相比之下，一种更智能的切分方法是基于句子余弦距离的语义切分。它不再依据特定字符和固定长度进行机械切分，而是对每个句子进行 embedding，以此来计算相邻句子的余弦距离，再通过算法算出一个相对合理的切分点（某个距离值），最后将不大于该阈值的相邻句子聚合在一起作为一个文档块，从而实现文档语义切分。

6/24/2025 9:51:10 AM

燃哥讲AI

特斯拉Robotaxi终于来了，但这11个误区你得先搞清楚

6月22日，特斯拉在奥斯汀正式启动了Robotaxi服务。我在推特上看到那些邀请函截图时，说实话有点震惊——这个被马斯克承诺了无数次的服务，居然真的开始了。不过，网上关于特斯拉Robotaxi的讨论，很多都是错误的。

6/24/2025 9:16:48 AM

阿丸笔记

微软刚发布Mu模型：支持Windows智能体，小参数跑出10倍性能

今天凌晨，微软在官网发布了创新小参数模型Mu。 Mu仅有3.3亿参数，但其性能可以比肩微软之前发布的小参数模型Phi-3.5-mini，体量却比它小10倍左右，并且在离线NPU的笔记本设备上，可以跑出每秒超过100 tokens的响应，这在小参数模型领域非常罕见。此外，Mu支持在Windows中设置智能体，可将自然语言指令实时转化为系统操作，例如，只需对着电脑说一句 “把鼠标指针调大一些，调整屏幕亮度”，智能体就能精准定位到相关设置项一键完成调整。

6/24/2025 9:08:31 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind AI模型特斯拉场景深度学习亚马逊架构 Transformer MCP Copilot 编程视觉

理论