扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源
挑战自回归的扩散语言模型刚刚迎来了一个新里程碑:蚂蚁集团和人大联合团队用 20T 数据,从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。 该模型虽然激活参数仅 1.4B,但性能可以比肩参数更多的自回归稠密模型 Qwen2.5-3B,而且推理速度更快。 这为扩散语言模型的技术可行性提供了关键验证。
9/12/2025 9:34:00 PM
机器之心
如何为LLM智能体编写工具?Anthropic官方教程来了
好工具,才有好智能体。 智能体(Agent)时代,工具已不再只是传统 API 或函数接口的简单封装,而是决定智能体能否高效完成任务的关键。 为了让智能体真正释放潜力,我们需要重新思考工具开发的方式。
9/12/2025 9:26:00 PM
机器之心
腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破
图检索增强生成(GraphRAG)已成为大模型解决复杂领域知识问答的重要解决方案之一。 然而,当前学界和开源界的方案都面临着三大关键痛点:开销巨大:通过 LLM 构建图谱及社区,Token 消耗大,耗时长,经济与时间成本高昂。 效果瓶颈:对复杂问答的解析精度有限,面临显著的效果瓶颈。
9/12/2025 9:21:00 PM
机器之心
高德AI出行智能体“小高老师”月活突破4亿
在近日召开“高德扫街榜”产品发布会上,高德地图对外宣布,其面向出行生活打造的智能体(Agent)“小高老师”单日调用量已达12亿次。 最新数据显示,上线不到一个月,“小高老师”的月活跃用户数已突破4亿,同时它也成为高德连接用户与生活服务的重要载体。 目前,高德地图上每天有1.2亿次生活服务AI搜索,而“小高老师”日均推荐的生活服务类点位超6300万个。
9/12/2025 8:49:01 PM
量子位的朋友们
云原生边缘与AI训练场景:两类高频隐蔽Bug的深度排查与架构修复
在云原生技术向边缘计算与AI训练场景的过程中,基础设施层的问题往往会被场景特性放大——边缘环境的弱网络、异构硬件,AI训练的高资源依赖、分布式协作,都可能让原本隐藏的Bug以“业务故障”的形式爆发。 这些问题大多不具备直观的报错信息,而是表现为任务崩溃、数据断连等表层现象,若仅从业务层排查,很容易陷入“调参无效、重启治标”的循环。 本文结合两个真实生产场景的高频Bug,从技术环境还原到根因拆解,再到架构级修复方案,完整呈现问题解决的全链路,为云原生运维与AI研发团队提供可复用的实践经验,避开那些文档未提及、经验难复制的隐性陷阱。
9/12/2025 6:17:31 PM
许辉
Science Advances | AI for Earth:聆听海洋的「脉搏」,新一代AI大模型精准预测十年气候脉动
作者 | 论文团队编辑 | ScienceAI地球的未来,写在海洋的每一寸波澜里。 近日,一篇发表于《Science Advances》的重磅研究,为我们破译海洋这部「天书」提供了一种全新的视角。 由上海人工智能实验室、复旦大学、南京信息工程大学等多家国际顶尖机构联合攻关,该研究构建了一个名为 ORCA-DL 的数据驱动全球海洋模型。
9/12/2025 5:57:00 PM
ScienceAI
支付宝推出 AI 智能皮肤检测:轻松拍脸获取肤质报告与护理建议
在2025Inclusion 外滩大会上,支付宝的蚂蚁 AI 健康管家 AQ 发布了多项新功能。 其中最引人注目的便是全新上线的 “AI 智能皮肤检测” 功能。 用户只需拍摄自己的脸部照片,便能迅速获得一份详细的肤质检测报告和个性化的护理建议。
9/12/2025 5:36:07 PM
AI在线
医学教育革命来袭!复旦中山医院推出AI教学大模型,培养有温度的未来医生
医学这门古老而神圣的学科,正在经历一场前所未有的教育变革。 知识爆炸式增长,临床实践日益复杂,传统的医学教育模式已经难以跟上时代的步伐。 面对这些挑战,复旦大学附属中山医院在9月12日交出了一份令人瞩目的答卷。
9/12/2025 5:36:07 PM
AI在线
实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+,性价比提升10倍
Qwen下一代模型架构,抢先来袭! Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。 基于Qwen3-Next,团队先开源了Qwen3-Next-80B-A3B-Base。
9/12/2025 5:19:38 PM
外滩大会嘉宾锐评AGI即将“撞墙”,正在向数字与物理世界进化
9月11日,2025 Inclusion·外滩大会“AGI:数字与物理世界的共同进化”见解论坛成功举办。 本次论坛由蚂蚁集团主办,中国信通院华东分院承办,智源社区与智东西支持,汇聚了来自学术界、产业界的十余位顶尖专家,共同探讨人工智能技术的最新进展和实际应用。 大模型参数破万亿后,Scaling Law边际收益递减,“单点暴力”已难撬动通用智能。
9/12/2025 5:17:00 PM
新闻助手
清华首次提出数据驱动控制新形式,算法效率直翻三倍
当大数据席卷各行各业,控制理论也迎来新的拐点:从依赖模型到依赖数据。 但是,在数据驱动控制领域,却缺乏一种标准化的数据表示形式。 针对这一问题,清华大学李升波教授课题组(iDLab)首次将现代控制理论中的标准型概念引入数据驱动控制(datatic control)范式,提出了一种基于数据的系统描述新形式。
9/12/2025 5:03:51 PM
时令
倒计时1天 | 来服贸会参加一场贯穿AI与算力全景生态的活动
2025年,AI技术演进正呈指数级加速,当我们惊叹于AIGC的创造力时,你是否想过,我们日常接触的AI应用,或许只是整个庞大技术体系中的冰山一角? 应用之下,是由算力、数据、模型和基础设施共同构筑的庞大基石。 吴恩达教授在最近的公开发言中也指出,AI技术栈从底层的半导体,到云平台,再到基础模型,环环相扣,最大的机会存在于应用层。
9/12/2025 5:00:17 PM
量子位的朋友们
高德一夜刷榜:十亿用户用脚投票,美食到店榜单乱象被AI横扫
阿里藏了3个月,亮相即提4个热搜。 万众瞩目的神秘项目,「高德扫街榜」终于揭开了庐山真面目……热议中有夸赞和激动,终于有人出来整顿到店和评价的乱象了。 讨论里也有质疑:已经固化了十多年的格局,阿里和高德,凭什么一夜打破?
9/12/2025 4:55:31 PM
港科大 X MiniMax:高质量数据、小模型挑战复杂网络搜索难题
当AI遇上复杂网络搜索随着大型语言模型(LLM)的快速发展,AI Agent的能力边界不断扩展。 网络搜索Agent作为这一发展的重要组成部分,能够自主地从广泛的在线资源中检索信息。 然而,现有的开源网络Agent在处理复杂搜索任务时表现有限,而更强大的商业模型又缺乏透明的训练细节。
9/12/2025 4:54:00 PM
特邀精选
火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播
近日,火山引擎多媒体实验室的最新研究成果 LiveGS: Live Free-Viewpoint Video via High-Performance Gaussian Splatting for Mobile Devices 成功入选计算机图形学顶会 SIGGRAPH Emerging Technologies,并于2025年8月10日至8月14日在加拿大温哥华对外展出。 这一技术突破首次实现了移动端实时自由视角视频(FVV)直播的完整链路落地,在视觉保真度、计算效率和传输成本之间达成了前所未有的平衡,为互动直播、沉浸式娱乐等场景开辟了技术新范式。 图1 论文主页打破技术瓶颈:从实验室走向移动端的实时自由视角革命自由视角视频(FVV)允许用户从任意角度探索场景,是元宇宙、沉浸式直播等前沿领域的核心技术。
9/12/2025 4:51:20 PM
多媒体实验室
实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+性价比提升10倍
时令 发自 凹非寺. 量子位 | 公众号 QbitAIQwen下一代模型架构,抢先来袭! Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。
9/12/2025 4:51:17 PM
时令
一文带你了解 TiDB MCP Server
前言TiDB 已经支持 MCP 功能了,一直想看看怎么玩的,本篇是一篇实践篇,带着大家一起搭建 TiDB MCP Server,以及如何添加 TiDB MCP,如何使用 TiDB 的 MCP。 TiDB 的 AI SDK——PyTiDB,现已原生支持 MCP 协议。 这意味着开发者可以直接使用 PyTiDB 提供的 MCP Server 模块,将 TiDB 数据库接入支持 MCP 的 AI 工具(如 Claude Desktop、Cursor 等),实现自然语言驱动的数据查询与分析。
9/12/2025 4:31:04 PM
悟空聊架构
迎战软件3.0时代:新范式、新挑战、新工程
我们正处在一个技术范式剧烈变革的黎明。 从企业信息化的流程固化,到互联网时代的数据驱动,软件的形态和价值在不断演进。 如今,以大语言模型(LLM)为代表的生成式人工智能技术,正以前所未有的力量,将我们推向一个全新的纪元——Software 3.0(软件3.0),一个由“意图”驱动的智能化时代。
9/12/2025 4:23:12 PM
肖然
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
AI新词
图像
Gemini
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
AI for Science
Claude
开发者
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
GPU
华为
大语言模型
Sora
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
DeepMind
编程
神器推荐
特斯拉
亚马逊
AI模型