国产算力
中国电信完成业界首个国产算力的跨架构大模型推理技术验证,英伟达、昇腾、沐曦芯片无缝运行
AI在线 12 月 12 日消息,据通信产业网今日报道,中国电信研究院联合中国科学院计算技术研究所、华为昇腾、沐曦等,依托中国电信云网融合技术中试验证平台,成功完成业界首个面向国产算力的跨架构大模型推理技术验证。 中国电信研究院牵头启动“Triton 统一跨架构推理框架”技术攻关,通过自研 Triton 跨架构编译器与统一大模型算子库,实现同一套算子源码在英伟达、昇腾、沐曦三类芯片上无缝运行。 本次技术验证已完成 10 余款主流开源模型在三类芯片上的端到端推理测试,核心指标表现优异:平均迁移时间≤3 天,较传统适配模式效率提升超 80%;精度误差 0.5%,确保模型推理可靠性;在同等延迟约束下,系统吞吐达到各芯片原生算子库的 90% 以上,实现性能与适配效率的双重优化。
12/12/2025 8:58:14 PM
汪淼
硅基流动 SiliconCloud 推出加速版 DeepSeek-R1-0528,TPM 提升至 500 万
近日,硅基流动 SiliconCloud 平台正式上线了基于国产算力的推理加速版 DeepSeek-R1-0528。 这一新版本在性能上进行了显著提升,TPM(每分钟最大 Token 数)提升至500万,满足用户在复杂场景下的高并发需求。 同时,Pro 版 R1的 RPM(每分钟最多允许的请求数)也提升至3万,确保了流畅的使用体验。
5/30/2025 10:01:19 AM
AI在线
多个领域突破!科大讯飞深度推理大模型讯飞星火X1全新升级
科大讯飞宣布其深度推理大模型讯飞星火 X1完成全新升级。 作为业界唯一基于全国产算力训练的深度推理大模型,讯飞星火 X1在多个关键领域实现了显著突破,进一步巩固了其在 AI 领域的领先地位。 此次升级,讯飞星火 X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升。
4/21/2025 12:00:57 PM
AI在线
科大讯飞依靠国产算力卡成功进入大模型研发梯队
近日,科大讯飞在互动平台上回答投资者提问,透露了其在国产算力领域的最新进展,引发广泛关注。 科大讯飞表示,凭借仅仅1万张910B 国产算力卡,他们已经跻身于大模型研发的第一梯队。 这一成绩令人瞩目,因为同类企业在此领域所需的算力往往远超此数。
3/11/2025 2:15:00 PM
AI在线
科大讯飞即将发布新版本星火 X1,超越 OpenAI 的国产算力平台
近日,科大讯飞在一次机构调研中透露,正在全力训练的纯国产算力平台 “星火 X1” 新版本即将问世,预计将在未来三个月内完成。 这一新版本的发布被寄予厚望,科大讯飞表示,该平台将具备更强的数学解题能力和复杂的过程思维链能力,力争在这些方面全面对标甚至超越 OpenAI 的技术。 “星火 X1” 的新版本是科大讯飞在国产算力平台上的一项重要尝试,标志着中国在人工智能领域自主可控技术的进一步发展。
2/14/2025 9:53:00 AM
AI在线
「鲶鱼」DeepSeek 正在搅动上下游
作者|朱可轩编辑|陈彩娴春节结束,DeepSeek 热度不减,而要说刚刚过去的春节假期,留给科技圈的印象可能是“卷上加卷”,几乎无人不在热议分析着 DeepSeek 这条“鲶鱼”。 硅谷方面迎来了空前的危机感:开源的信徒们声量再度走高,甚至连 OpenAI 都在反思闭源的决策是否正确;低算力成本的新范式引发芯片巨头英伟达连锁反应,创下美股史上最大规模单日市值蒸发纪录;政府部门下场调查 DeepSeek 使用芯片的合规性......在海外对 DeepSeek 评价褒贬不一的同时,国内也迎来了空前繁荣。 DeepSeek 发布 R1 模型后上线的 APP 接到泼天流量,初步验证了应用端增长将会拉动整个 AI 生态发展。
2/7/2025 6:10:00 PM
朱可轩
清程极智 CEO 汤雄超:训推一体机并非 AI Infra 的未来
早在超算时代,清华大学高性能计算研究中心便一直是解决算力需求相关软件问题的行家。 “目前 AI Infra 赛道几家国内厂商中,只有我们有过十万台服务器的超大规模国产算力集群的使用和调优经验。 ”汤雄超向 AI 科技评论介绍道。
10/16/2024 9:34:00 AM
朱可轩
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉