无问芯穹(Infinigence-AI)
超DeepEP两倍!无问芯穹FUSCO以「空中变阵」突破MoE通信瓶颈,专为Agent爆发设计
随着 ChatGPT、Gemini、DeepSeek-V3、Kimi-K2 等主流大模型纷纷采用混合专家架构(Mixture-of-Experts, MoE)及专家并行策略(Expert Parallelism, EP),MoE 技术已在产业应用中逐渐成为主流。 与此同时,以代码智能体、Cursor 类对话式 IDE 为代表的新型应用,一方面显著推高了用户请求规模,另一方面大幅拉长了单次推理的上下文长度,两者均呈现出一个数量级以上的增长。 在 MoE 架构下,这种变化不仅线性放大了计算开销,还显著增加了跨专家的通信与调度成本,使得整体系统压力接近一个数量级提升,并在规模化服务场景中进一步被放大。
范式转移!无问芯穹推出基础设施智能体蜂群,开启Agentic智能体基础设施新纪元
智能体(AI Agent)是 AI 演进的关键方向,正逐渐成为人机协同与机器自主决策的核心载体,并有望演进为未来智能社会的基本单元。 而基础设施作为智能体落地的重要支撑,却仍然依赖大量「胶水代码」来机械拼合各个环节,并时常陷入这样的困境 —— 宝贵的智算资源在静默中闲置,突发的故障让天价训练任务一夜中断,庞大的运维团队在无尽的告警和排障中疲于奔命 —— 传统的工具链和人力运维模式,已无法应对智能体生产的动态性与复杂性。 我们需要对当下的智能体基础设施进行一次范式上的革新,让基础设施系统本身拥有自主决策、协同和进化的能力。
这届WAIC,无问芯穹发布了三个「盒子」
「算力是智能时代的土壤,其规模与效率决定着数字未来的疆界。 」7 月 28 日,2025 年世界人工智能大会上,无问芯穹联合创始人、CEO 夏立雪发布了无问芯穹全规模 AI 效能跃升方案,并正式推出三大核心产品:无穹 AI 云、无界智算平台与无垠终端智能。 该方案是一套面向未来智能基础设施的软硬协同系统,为跨地域智算网络、智算集群与多形态智能终端等全规模场景,统一适配多种异构算力,提供从模型调度、性能优化到应用部署的全链路支持。
不卡顿、免费的满血版DeepSeek-R1 API,在无问芯穹这里用上了,更有异构算力鼎力相助
还在为 DeepSeek R1 官网的卡顿抓狂? 无问芯穹大模型服务平台现已上线满血版 DeepSeek-R1、V3,无需邀请即可免费用 Token! 另有异构算力鼎力相助,支持通过 Infini-AI 异构云平台一键获取 DeepSeek 系列模型与多元异构自主算力服务。
全球首个支持单任务千卡规模异构芯片混合训练平台,来自无问芯穹
“打开水龙头前,我们不需要知道水是从哪条河里来的。同理,未来我们用各种 AI 应用时,也不会知道它调用了哪些基座模型,用到了哪种加速卡的算力——这就是最好的 AI Native 基础设施。”7月4日,在2024年世界人工智能大会AI基础设施论坛上,无问芯穹联合创始人兼CEO夏立雪发布了无问芯穹大规模模型的异构分布式混合训练系统,千卡异构混合训练集群算力利用率最高达到了97.6%。同时,夏立雪宣布无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万
GPU推理提速4倍,256K上下文全球最长:无问芯穹刷新大模型优化记录
想用大模型赚钱?这个实力强劲的新面孔决定先把推理成本打下来。大模型业务到底多烧钱?前段时间,华尔街日报的一则报道给出了参考答案。报道显示,微软的 GitHub Copilot 业务(背后由 OpenAI 的 GPT 大模型支撑)虽然每月收费 10 美元,但平均还是要为每个用户倒贴 20 美元。可见当前 AI 服务提供商们正面临着严峻的经济账挑战 —— 这些服务不仅构建成本高昂,运营成本也非常高。有人比喻说:「使用 AI 总结电子邮件,就像是让兰博基尼送披萨外卖。」对此,OpenAI 算过一笔更详细的账:当上下文长度
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
AI新词
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
腾讯
算法
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
生成式AI
大型语言模型
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉