蚂蚁集团
推理速度10倍提升,蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
近日,蚂蚁集团正式开源业界首个高性能扩散语言模型(Diffusion Large Language Model,dLLM)推理框架 dInfer。 在基准测试中,dInfer 将 dLLM 的推理速度相比于 Fast-dLLM 提升了 10 倍以上,并在关键的单批次(batch size=1)推理场景下,作为首个开源框架实现了大幅超越经过高度优化的自回归(AR)模型的性能里程碑,在 HumanEval 上达到 1011 tokens / 秒的吞吐量 。 dInfer 通过一系列算法与系统协同创新,攻克了 dLLM 的推理瓶颈,兑现了其内生并行生成带来的推理效率潜力。
推理性能提升10倍!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
10月13日,蚂蚁集团正式开源业界首个高性能扩散语言模型推理框架dInfer。 在基准测试中,dInfer将扩散语言模型的推理速度相比于英伟达扩散模型框架Fast-dLLM提升了10.7倍;在代码生成任务HumanEval上,dInfer在单批次推理中创造了1011Tokens/秒的速度,首次在开源社区中实现扩散语言模型的单批次推理速度显著超越自回归模型。 dInfer的工作表明,扩散语言模型具备显著的效率潜力,可以通过系统性的创新工程兑现,为通往AGI的架构路径提供极具竞争力的选项。
LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
卷王指南又更新了,这次还有番外篇。 开源 2.0 :变脸堪比整容等了一百多天,悬念终于揭晓。 9 月 13 日上午,蚂蚁集团开源团队(「开源技术增长」)携《 2025 大模型开源开发生态全景图 》2.0 版,亮相上海外滩大会。
高阶程序,让AI从技术可行到商业可信的最后一公里
很多人相信,我们已经进入了所谓的「AI 下半场」,一个模型能力足够强大、应用理应爆发的时代。 然而,对于这个时代真正缺少的东西,不同的人有不同的侧重,比如(前)OpenAI 研究者姚顺雨强调了评估的重要性,著名数学家陶哲轩则指出必须降低成本才能实现规模化应用。 而蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬则强调了数据的价值:「数据决定了 AI 应用能力的上限。
蚂蚁百灵开源轻量级MoE语言模型Ling-mini-2.0,1.4B激活性能比肩大规模模型
据百灵大模型公众号,近期蚂蚁百灵团队了开源兼具 SOTA 性能 与 高效性 的 MoE 架构大语言模型系列Ling 2.0,发布首个版本 Ling-mini-2.0。 据了解,Ling-mini-2.0体量小巧,却性能十足。 它具备16B总参数,但每个输入 token 仅激活其中的 1.4B(non-embedding 789M)。
数字生活的原生入口:蚂蚁集团发布AI眼镜全新技术框架gPass
日前,在 2025 Inclusion・外滩大会上,蚂蚁集团发布了全球首个智能眼镜可信连接技术框架 ——gPass。 该技术具备「安全、交互、连接」三大核心能力,致力于实现 AI 眼镜与智能体之间安全、可信、即时信息交互,为用户打造自然无感的服务体验,同时构建起面向眼镜厂商和开发者的安全 AI 数字服务生态。 AI 眼镜的核心价值,在于它将成为 「AI 原生入口」,彻底重构数字生活服务模式。
上海加速医疗器械领域 AI 技术应用,助力高端产业全链条发展
人工智能开源生态正在经历一场前所未有的变革洗礼。 蚂蚁集团在外滩大会上重磅发布的大模型开源开发全景与趋势2.0版本,如同一面镜子,清晰映射出这个快速演进领域的真实面貌。 这份全景图的诞生并非简单的数据堆砌,而是通过严谨的OpenRank评价体系精心筛选的结果。
扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源
挑战自回归的扩散语言模型刚刚迎来了一个新里程碑:蚂蚁集团和人大联合团队用 20T 数据,从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。 该模型虽然激活参数仅 1.4B,但性能可以比肩参数更多的自回归稠密模型 Qwen2.5-3B,而且推理速度更快。 这为扩散语言模型的技术可行性提供了关键验证。
蚂蚁集团数字蚂力首批专家级“AI数字员工团队”亮相外滩大会
9月11日,在2025 Inclusion·外滩大会上,蚂蚁集团旗下数字蚂力宣布实现重大产品升级,正式推出首批专家级“AI数字员工团队”,覆盖客服、营销、巡检、销售培训及研发五大核心业务领域,致力于将AI深度融入企业运营,为企业提供可量化、确定性的业务增长结果,破解AI在真实场景中“落地难、见效慢、协同繁”的共性困境。 据悉,其中AI数字客服团队可帮助中小企业提升约70%的人效,降低35%的运营成本,并大幅提高业务转化率。 在数字蚂力的电商客户实践中,这一模式已为企业带来约10%的GMV增长。
蚂蚁百宝箱新品Tbox超级智能体亮相外滩大会,5分钟即可完成专业教学素材
9月11日,蚂蚁百宝箱智能体开发平台在2025Inclusion·外滩大会上重磅发布新产品Tbox超级智能体(www.tbox.cn)。 全新的Tbox通过多智能体协同架构,可以让平台上多个智能体形成工作小组,共同完成用户指定的任务,交付成果。 与此同时,生态开发者构建的智能体也能加入小组为用户提供服务,通过参与服务的实际贡献获得收益。
Agentic Deep Research新范式,推理能力再突破,可信度增加,蚂蚁安全团队出品
尽管 LLM 的能力与日俱增,但其在复杂任务上的表现仍受限于静态的内部知识。 为从根本上解决这一限制,突破 AI 能力界限,业界研究者们提出了 Agentic Deep Research 系统,在该系统中基于 LLM 的 Agent 通过自主推理、调用搜索引擎和迭代地整合信息来给出全面、有深度且正确性有保障的解决方案。 OpenAI 和 Google 的研究者们总结了 Agentic Deep Researcher 的几大优势:(1)深入的问题理解能力(Comprehensive Understanding):能够处理复杂、多跳的用户提问;(2)强大的信息整合能力(Enhanced Synthesis):能够将广泛甚至冲突的信息源整合为合理的输出;(3)减轻用户的认知负担(Reduced User Effort):整个 research 过程完全自主,不需要用户的过多干预。
蚂蚁集团联合中国人工智能学会发布AGI科研专项基金
近日,中国人工智能学会(CAAI)主办的2025第三届人工智能大模型技术高峰论坛在安徽合肥顺利举行。 论坛上,CAAI理事长、中国工程院院士戴琼海与蚂蚁集团平台技术事业群副总裁曹恺共同发布了2025年度CAAI-蚂蚁科研基金(AGI专项)。 本期基金全面围绕通用人工智能(AGI)技术,涵盖AGI数据与评测、AGI基础模型、AGI Infra三大方向,开放课题共27项,计划支持额度超500万,以发挥产学合作力量攻坚AGI技术。
蚂蚁集团人工智能企业服务总部、西部研发中心落地成都
AI在线 7 月 25 日消息,据“成都发布”公众号,7 月 23 日,成都市人民政府与蚂蚁科技集团股份有限公司签署战略合作协议。 根据协议,双方将共同推动蚂蚁集团在蓉设立人工智能企业服务总部和西部研发中心,并聚焦人工智能场景应用、金融科技创新、跨境支付便利化等领域开展全方位合作,更好助推成都人工智能产业高质量发展和国际消费中心城市建设。 AI在线从官方公告获悉,成都高新区还与蚂蚁集团签订了人工智能企业服务总部项目投资合作协议。
消息称蚂蚁集团新设通用人工智能研究中心,一众“明星 AI 新秀”加盟
AI在线 7 月 24 日消息,雷峰网“AI 科技评论”今晚爆料称,蚂蚁集团近日新设了通用人工智能研究中心,隶属于蚂蚁技术研究院,人员包括蓝振忠、武威、吴翼、赵俊博等一众“明星 AI 新秀”,发力 AGI 基础技术研究。 今年年初,就有消息称蚂蚁将设立 AGI 研究部门,不过上半年是隶属于蚂蚁集团 CTO 线,由何征宇直接领导。 这次的调整则是由 AGI 研究转向研究院,并由蓝振忠担任中心主任,赵俊博、吴翼、武威等人向其汇报。
全球首个 AI 智能体安全测试标准发布,蚂蚁集团、清华大学、中国电信等联合编制
AI在线 7 月 14 日消息,据蚂蚁技术消息,世界数字科学院(WDTA)在联合国日内瓦总部日前正式发布 AI STR 系列新标准《AI 智能体运行安全测试标准》,标准由蚂蚁集团、清华大学、中国电信牵头,联合普华永道、新加坡南洋理工大学、美国圣路易斯华盛顿大学等二十余家国内外机构、企业及高校共同编制,为全球首个单智能体运行安全测试标准。 据介绍,该标准针对智能体跨越“语言墙”所带来的“行为”风险,首次将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境对应起来,构建了全链路风险分析框架;同时,细分了智能体风险类型,完善并创新提出了模型检测、网络通信分析和工具模糊测试等测试方法,弥补了智能体安全测试技术标准的空白。 AI在线从蚂蚁技术获悉,该标准不仅提供了一套可行可靠的智能体安全基准,也为全球 AI 智能体生态的安全、可信和可持续发展增加了有益的探索。
WDTA发布全球首个AI智能体运行安全测试标准,蚂蚁集团、清华大学等联合编制
日前,世界数字科学院(WDTA)在联合国日内瓦总部正式发布AI STR系列新标准《AI智能体运行安全测试标准》,标准由蚂蚁集团、清华大学、中国电信牵头,联合普华永道、新加坡南洋理工大学、美国圣路易斯华盛顿大学等二十余家国内外机构、企业及高校共同编制,为全球首个单智能体运行安全测试标准。 该标准针对智能体跨越“语言墙”所带来的“行为”风险,首次将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境对应起来,构建了全链路风险分析框架;同时,细分了智能体风险类型,完善并创新提出了模型检测、网络通信分析和工具模糊测试等测试方法,弥补了智能体安全测试技术标准的空白。 标准在AI for Good全球峰会期间由联合国社会发展研究所(UNRISD)与世界数字科学院(WDTA)联合主办的“数字技术与人工智能社会影响全球咨询会”上发布。
KAG-Thinker:「结构化」思考新范式,支持逻辑严谨的大模型复杂推理
近日, 蚂蚁集团知识引擎团队协同浙江大学、同济大学正式发布了其在结构化推理领域的最新成果 —— KAG-Thinker 模型,该模型是 KAG 框架的重要迭代升级,聚焦于为通用或专业领域复杂推理任务构建稳定、可解释的思考范式。 2025 年以来,OpenAI 推出的 Deep Research 展示了大模型在复杂推理任务中多轮检索、规划推理的强大能力。 随后,产学界涌现了较多以模型为中心 (Model-Centric) 的方法,比如 Search-R1、ReSearch 等。
蚂蚁集团发布 AI 健康应用 AQ:可看病症、看医生、看报告
蚂蚁集团发布AI健康应用AQ,提供健康科普、就诊咨询、报告解读等上百项功能,连接全国超5000家医院、近百万医生。AQ基于蚂蚁医疗大模型,支持多模态交互,已通过权威评测。#蚂蚁集团 #AI健康应用AQ #医疗服务升级
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉