资讯列表

分类

标签

Meta出走华人创业团队，种子轮800万美元，要打造视觉AI记忆大脑

大家都在关注硅谷 AI 领头羊们的抢人大戏，尤其是 Meta 近期又挖去了三位来自谷歌的 IMO 金牌研究者。虽然说小扎（扎克伯格）铆足了劲儿要重振 Llama 雄风，正如火如荼的进行人才大引进。但是吧，挖进去的人在 Meta 显山露水还需要一段时间，而从 Meta 离开的人的创业成果已经崭露头角了。

7/25/2025 10:25:00 AM

机器之心

北大-灵初重磅发布具身VLA全面综述！一文看清VLA技术路线与未来趋势

如今，GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间，以实现具身智能。这其中最受关注的前沿方向之一，便是视觉 - 语言 - 动作模型（Vision-Language-Action Models，简称 VLA）。

7/25/2025 10:19:44 AM

老黄自曝皮衣口袋藏“秘密期权池”！随时准备奖励员工，团队亿万富翁数量世界第一

黄仁勋亲口承认：他随身带着“秘密期权池”，随时奖励表现出色的员工。在最新采访的结尾，主持人问起这个传闻，老黄开玩笑式的回答“现在就装在我的口袋里”。这位掌管着全球市值最高科技公司之一的CEO，把奖励员工这件事做得如此随性又直接。

7/25/2025 10:11:10 AM

Resume Builder报告：多数经理使用AI来决定，晋升或解雇员工

根据Resume Builder最近的一项调查，人工智能在人事决策中的作用日益凸显。这项调查涵盖了1,342名美国有直接下属的管理者，结果显示，许多管理者正在依赖人工智能来做出一些关键的人事决策，包括晋升、加薪、裁员甚至解雇。调查发现，大约65%的管理者表示他们在工作中使用人工智能工具，而在这些管理者中，有94%的人利用这些工具来对他们的直接下属进行决策。

7/25/2025 10:09:25 AM

AgentRM 奖励建模：智能体泛化能力的“导航仪”与“加速器”

大家好，我是肆〇柒。在 AI 领域，大型语言模型（LLM）基础智能体正逐渐成为解决复杂交互任务的关键力量。然而，一个不容忽视的问题是：尽管它们在训练中见过的任务上表现出色，但面对未见过的新任务时，泛化能力却往往不尽人意。

7/25/2025 10:06:41 AM

肆零柒

媲美Claude 4，支持100万上下文！阿里开源超强代码AI Agent模型

阿里巴巴开源了超强AI Agent模型Qwen3-Coder-480B-A35B-Instruct。根据阿里公布的测试数据显示，Qwen3-Coder在OpenAI发布的Agent测试基准SWE-bench Verified中，500轮交互的测试分数达到了69.6%，常规分数为67%，可媲美最强闭源代码模型之一Claude Sonnet 4的70.4%和68%。同时Qwen3-Coder也大幅度超越了DeepSeek R1-0528版本的41.4%和V3-0324版本的38.8%。

7/25/2025 10:06:05 AM

vivo自研蓝河操作系统内核开源！Rust开发新机遇来了

芜湖~在AI重塑智能终端这个关键时刻，首个适用于嵌入式和移动设备的开源Rust内核，来了！ vivo最新宣布，开源自研蓝河操作系统内核。它完全由Rust语言编写，从根本上解决了传统C语言在内存安全、维护成本上的长期难点。

7/25/2025 9:35:47 AM

亿级短视频数据突破具身智能Scaling Law！Being-H0提出VLA训练新范式

如何让机器人从看懂世界，到理解意图，再到做出动作，是具身智能领域当下最受关注的技术重点。但真机数据的匮乏，正在使对应的视觉-语言-动作（VLA）模型面临发展瓶颈。尽管业界已投入大量资源构建数据平台（如马斯克主导的“数据工厂”项目），现有真机数据规模仍较模型规模定律所需的上亿级训练样本相差三个数量级。

7/25/2025 9:31:49 AM

Routine：把 GPT-4o 准确率从 41% 拉到 96% 的企业级 Agent 稳定器

大家好，我是肆〇柒。在企业落地 AI 的进程中，自主智能体凭借其强大的自主决策与任务执行能力，可以成为企业提升效率、优化流程的关键力量。然而，当我们将视角聚焦于企业级应用场景时，不难发现，部署智能体系统并非易事。

7/25/2025 9:31:34 AM

肆零柒

AI视频记忆革命来了！Memories.ai获800万美元融资，挑战千万小时视频分析极限

人工智能正在突破视频理解的最后边界。当前市面上的AI工具虽然能够分析单个视频并生成摘要，但面对数千小时的多视频内容时却显得力不从心。这个技术瓶颈正困扰着安防公司和营销企业，前者需要AI筛查海量监控录像，后者则希望分析不同的视频营销活动和产品拍摄素材。

7/25/2025 9:31:02 AM

AI在线

马斯克23万GPU训练Grok-这规模让OpenAI都要颤抖

马斯克昨天在X上发了一条消息："xAI的目标是在5年内部署相当于5000万个H100的AI算力。 "5000万个H100，这什么概念？我算了一下，这相当于35个核电站的发电量才能供得起。

7/25/2025 9:25:05 AM

阿丸笔记

突破单token预测局限！南洋理工首次将多token预测引入微调，编程任务准确率提升11.67%

告别Next-token，现在模型微调阶段就能直接多token预测！从GPT到Claude，当前主流LLM都依赖next-token prediction（下一token预测）进行训练，但它却让AI很难真正理解跨越多token的完整概念。于是南洋理工大学最近提出了一项新技术——概念感知微调（CAFT），首次实现将multi-token prediction（多token预测）引入微调阶段，让模型能够像人类一样理解和学习完整概念。

7/25/2025 9:24:43 AM

IEEE ICDCS’ 25 | 提速79%！上交大新方法优化企业级AI流程调度

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。⽬前，服务这些应⽤任务需要⾯对运⾏时⻓不确定、⼯作流结构不确定等问题，这对现有集群任务调度算法提出了极大挑战，并严重影响任务运⾏效率。为了解决上述问题，上海交通大学朱怡飞教授团队联合江行智能提出调度框架LLMSched，通过引入三类新节点来扩展传统任务表征方法实现复合LLM应用任务的有效表征，借助贝叶斯网络识别可降低不确定性的关键节点，并以信息熵衡量节点的熵减程度。

7/25/2025 9:22:13 AM

阿里云通义千问宣布 Qwen-MT 机器翻译模型：支持 92 种语言互译，每百万输出 token 低至 2 元

AI在线 7 月 25 日消息，阿里云通义千问 Qwen 团队昨晚发文，向大家介绍了其机器翻译模型 Qwen-MT（开发者现可通过 Qwen API 直接体验），核心亮点包括：92 种语言互译：支持超过 92 种主流官方语言及重要方言之间的高质量互译，覆盖全球 95% 以上的人口，满足广泛的语言交流需求。高度可控性：提供术语干预、领域提示、记忆库等专业翻译功能，并支持用户自定义提示，有效提升模型在复杂、专业或特定应用场景下的翻译表现。低延迟、低成本：采用轻量级 MoE（Mixture of Experts）架构，在保证卓越性能的同时实现更快的响应速度和更低的 API 调用价格（每百万输出 token 低至 2 元），更适合高并发、实时性要求高的应用场景。

7/25/2025 9:17:44 AM

问舟

AREAL 开源：解耦架构与创新算法驱动的强化学习系统

大家好，我是肆〇柒。推理能力在当下 AI 领域，尤其自然语言处理、智能决策系统、科学研究辅助等众多关键领域，已然成为推动技术革新的关键要素。然而，目前大型语言模型虽已取得瞩目成果，但在处理复杂逻辑时，常受困于逻辑连贯性把控，长链推理面临信息丢失、逻辑断裂问题，长序列输出任务下推理耗时久、资源消耗大，这些痛点严重制约模型应用场景拓展与性能深化。

7/25/2025 9:03:24 AM

肆零柒

因为不用AI写代码，我在终面挂了 | 一个程序员的奇葩面试经历

“因为不是AI First，我在终面挂了。 ”最近，一外国小哥的经历意外火了！他表示自己几个月前被解雇，终于来到了一家自己本来很看好的初创公司，并且走到了终面，与CEO面对面。

7/25/2025 8:45:00 AM

消息称 OpenAI 准备在 8 月初发布新一代 GPT-5 模型

AI在线 7 月 25 日消息，The Verge 今日报道称，OpenAI 将在 8 月初发布新一代 GPT-5 模型。 OpenAI CEO 萨姆・奥尔特曼（Sam Altman）还在 X 上透露，GPT-5 将推出 mini 和 nano 等不同版本，并通过 API 向外部开放。 AI在线注意到，奥尔特曼本周已经在《This Past Weekend》播客节目中展示了 GPT-5 的部分能力，并表示该模型能够迅速解答他不理解的问题，让他感受到 AI 的强大。

7/25/2025 8:39:37 AM

问舟

AI的过度应用是否让你的企业深陷洞察泥潭？

如今，决策者能获取的信息比以往任何时候都多，但数字化领导者必须对利用不同数据源以取得成功的合理节奏和切入点设定预期。 AI为数据分析带来了福音，专业人员可以将数据处理和异常检测等常规任务自动化，同时，复杂的数学方程几乎可以实时运算，因此，他们能以前所未有的速度获取信息。借助AI的洞察力，传统的决策周期已从数周缩短至数秒，这促使Gartner预测，到2027年，50%的商业决策将由智能体增强或自动化完成。

7/25/2025 7:00:00 AM

Mark Samuels

资讯热榜

李沐B站更新了！教你手搓语音大模型，代码全开源还能在线试玩 DeepRare 重磅发布：全球首个可循证智能体诊断系统，直击医学Last Exam难题考试提分新工具：网页版 ChatGPT 测试“学习和掌握”功能，AI 助你成学霸我测试了100+案例，教你零基础复刻外网刷屏的 AI 视频（附提示词模板） AI时代设计师如何突围？D20峰会揭示未来设计师生存法则一盘大棋！OpenAI「截胡」IMO金牌，奥特曼为GPT-5献上「核弹级」预热终结Coding？ShellAgent三句话造出马斯克同款「AI女友」！阿里云通义千问 Qwen3-Coder 宣布开源：480B 参数、原生支持 256K 上下文，可与 Claude Sonnet4 媲美

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini AI创作马斯克论文英伟达 Anthropic 智能体代码算法 Stable Diffusion 训练芯片开发者蛋白质腾讯生成式苹果 LLM 神经网络 AI新词 Claude 3D 研究生成机器学习 AI for Science xAI 计算人形机器人 Sora Agent AI视频 GPU AI设计百度华为搜索大语言模型工具场景字节跳动 RAG 大型语言模型预测具身智能深度学习伟达视觉 Transformer 神器推荐 AGI 亚马逊视频生成 Copilot DeepMind 模态架构 LLaMA