应用
全景呈现大模型开源技术路线和生态,蚂蚁开源在2025外滩大会发布全新报告
9 月 13 日,在 2025 Inclusion·外滩大会AI开源见解论坛上,蚂蚁开源联合Inclusion AI 发布了全新的《全球大模型开源开发生态全景与趋势告》。 这是报告5月首次发布后的2.0版本,不仅全面揭示了人工智能开源领域的发展现状和未来趋势,还纳入了百余天内开源社区的新动向,为行业发展提供重要参考。 蚂蚁开源技术委员会副主席王旭介绍全球大模型开源开发生态全景与趋势告蚂蚁开源技术委员会副主席王旭表示:“我们通过数据驱动的方式,客观呈现全球 AI 开源生态的真实状况。
9/14/2025 5:52:00 PM
新闻助手
科研学术,现在可以百度AI一下了
让人熬到头秃的毕业论文有救了! 刚刚,在第12届AI Day开放日上,百度学术官宣全面“AI重构”——. 它将从我们熟悉的查文献、找引用格式的资料库,升级为覆盖论文全生命周期的“搜、读、创、编”的Research平台。
9/14/2025 5:41:55 PM
henry
AlphaGo作者领衔,DeepMind新作登Science子刊
一群机械臂手忙脚乱地自己干活,彼此配合、互不碰撞。 科幻大片场景真的走入现实了。 优雅,实在是优雅。
9/14/2025 2:33:31 PM
henry
OpenAI新幻觉论文惹争议!GPT-5拉胯是测试基准有问题??
henry 发自 凹非寺. 量子位 | 公众号 QbitAIOpenAI好不容易发了篇新论文,还是给GPT-5挽尊? 最近,《语言模型为何会产生幻觉?
9/14/2025 2:26:12 PM
henry
姚顺雨离职OpenAI,开启下半场
henry 发自 凹非寺. 量子位 | 公众号 QbitAI为大模型开启“下半场”的姚顺雨,也开启了个人AI的下半场。 就在最近,这位明星OpenAI华人研究员的动态,开始被火热关注。
9/14/2025 2:06:13 PM
henry
抢先实测美团首个AI Agent,让我体验一把「懒人点餐」的快乐
AI点餐时代来了? 这一年,AI Agent 的热度一路走高。 从大洋彼岸的 OpenAI、谷歌等 AI 巨头,到国内的各类创业公司,大家都在摸索如何让 AI 真正帮人干活。
9/14/2025 1:52:00 PM
机器之心
兼得快与好!训练新范式TiM,原生支持FSDP+Flash Attention
TiM团队 投稿. 量子位 | 公众号 QbitAI生成式AI的快与好,终于能兼得了? 从Stable Diffusion到DiT、FLUX系列,社区探索了很多技术方法用于加速生成速度和提高生成质量,但是始终围绕扩散模型和Few-step模型两条路线进行开发,不得不向一些固有的缺陷妥协。
9/14/2025 1:45:56 PM
henry
AI解数学题只靠最后一个token
henry 发自 凹非寺. 量子位 | 公众号 QbitAI大语言模型在解心算题时,只依赖最后一个token? 最近,来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现:在心算任务中,几乎所有实际的数学计算都集中在序列的最后一个token上完成,而不是分散在所有token中。
9/14/2025 1:37:10 PM
henry
为这一个Tab键,我愿意单独付费:Cursor用在线强化学习优化代码建议,护城河有了?
Cursor Tab 是 Cursor 的核心功能之一,它通过分析开发者的编码行为,智能预测并推荐后续代码,开发者仅需按下 Tab 键即可采纳。 然而,它也面临着一个 AI 普遍存在的难题:「过度热情」。 有时,它提出的建议不仅毫无用处,甚至会打断开发者的思路。
9/14/2025 1:32:00 PM
机器之心
用同一组提示词,横向测评30+热门AI绘画平台(中)
前言. 常见的 AI 生图模型大概有以下这些:黑森林的 flux kontext、flux krea、flux dev、flux pro、flux krea、flux1.1,谷歌的 imagen-4、nano-banana,OpenAI 的 Gpt-4o,以及国内的 Dreamina3.1、Qwen3、Wan2.2、星流,还有就是老牌的 Midjourney、Ideogram、即梦、豆包、可灵、海螺等其他平台。 当有设计需求,无论是要出主图还是找创意灵感时,我习惯根据具体使用场景,把提示词放到对应的平台上尝试。
9/14/2025 1:06:09 AM
AI设计师Lena
2025北京文化论坛AI沙龙重磅举办!海淀率先破「百模」规模,105款大模型占全国五分之一
人工智能正在深刻改写文化生产方式,而数字艺术正成为最鲜活的见证。 9月13日,2025北京文化论坛平行论坛首场沙龙在海淀成功举办,聚焦“AI重塑数字内容生产”主题。 本次活动由北京市委网信办承办,海淀区委网信办、东升镇人民政府、快手联合协办。
9/13/2025 9:56:59 PM
思邈
Arm拥抱AI:五倍性能,三倍能效
构建芯片架构的 Arm,也全面拥抱 AI 了。 9 月 10 日,在上海举行的活动上,Arm 全新 Arm Lumex 计算子系统(Compute Subsystem,CSS)平台正式全球发布。 作为每年全球新款手机 SoC 的核心,今年的 Arm 解决方案重磅更新,让人们不得不关注。
9/13/2025 8:31:00 PM
李泽南
Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3
与其他全开源模型相比,性能提升2-5倍。 小参数模型也进入了 R1 时代,这次开源出新技术的是 Meta。 本周五,Meta AI 团队正式发布了 MobileLLM-R1。
9/13/2025 6:23:00 PM
机器之心
数据与AI双引擎驱动智能未来,2025外滩大会论数据进化之道
可供大模型训练的人类数据越来越少,Scaling Law正在缓慢失效,智能的上限,如何再次突破? 9月12日,在2025 Inclusion·外滩大会“Data meets AI:智能时代的双引擎”见解论坛上,产学界的多位权威专家给出了新解法:数据驱动了AI发展,AI也让数据迎来了新一轮的进化,双引擎融合驱动才是演进方向。 论坛由中国人工智能学会、上海交通大学与蚂蚁集团联合主办。
9/13/2025 4:55:00 PM
新闻助手
攻克强化学习「最慢一环」!交大字节联手,RL训练速度飙升2.6倍
强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/13/2025 4:45:23 PM
鹭羽
他同时参与创办OpenAI/DeepMind,还写了哈利波特同人小说
这是硅谷版世界末日传教士Eliezer Yudkowsky的最新论点。 Yudkowsky用现在的话说,是个不折不扣的斜杠青年,是MIRI创始人,也是著名的哈利波特同人文作者。 但最引人注目的身份则是一手缔造OpenAI和谷歌DeepMind的中之人。
9/13/2025 4:43:06 PM
鹭羽
AI水论文还得AI治:西湖大学首次模拟人类专家思考链,AI审稿分钟级给出全面反馈
审稿不用再等了,高质量的AI审稿平台来了! 如今,AI生成的论文数量激增,如何从海量的AI “水文”中筛选出真正高质量的研究成果,已经成为学术界必须直面的难题。 为此,西湖大学自然语言处理实验室推出了首个AI生成学术成果的开放预印本平台AiraXiv,以及首个模拟人类专家思考链的AI审稿人系统DeepReview。
9/13/2025 2:10:27 PM
梦晨
扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源
挑战自回归的扩散语言模型刚刚迎来了一个新里程碑:蚂蚁集团和人大联合团队用 20T 数据,从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。 该模型虽然激活参数仅 1.4B,但性能可以比肩参数更多的自回归稠密模型 Qwen2.5-3B,而且推理速度更快。 这为扩散语言模型的技术可行性提供了关键验证。
9/12/2025 9:34:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
AI模型