SpikingBrain

不靠英伟达，中科院在国产 GPU 上跑通 76B 类脑大模型

过去几年，大模型几乎都依赖 Transformer，它支撑了 GPT、Claude、Gemini 等一众前沿模型的进步，但也一直被诟病：一旦文本变长，计算量和内存消耗就会成倍膨胀，百万级 token 几乎不可承受。与此同时，大模型训练几乎完全依赖 NVIDIA 的 GPU 体系。从算力到软件栈，整个行业被牢牢绑定在 CUDA 上，硬件自主化成了迟迟迈不过去的门槛。

9/24/2025 4:24:00 PM

郑佳美

资讯热榜

看完刘润年度演讲，教你做好AI时代的能力迁徙！中国华电发布 “华电智” 大模型，能源管理进入智能新时代蚂蚁数科发布多语种视觉大模型训练框架，打破语言壁垒！苹果Siri将大变样！付费请谷歌助力AI升级黑客新手法：利用 OpenAI API 创建 “隐形” 后门恶意软件谷歌推出新款 Vertex AI 代理构建工具，助力企业智能化后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）谷歌流量显著下降，People Inc. 与微软达成 AI 内容授权协议

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型具身智能生成百度 Sora 工具 GPU 华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习架构生成式AI DeepMind 亚马逊编程视觉 Transformer AI模型预测特斯拉 MCP