模型压缩

Attention Sink产生的起点？清华&美团首次揭秘MoE LLM中的超级专家机制

Attention Sink产生的起点？清华&美团首次揭秘MoE LLM中的超级专家机制

稀疏激活的混合专家模型（MoE）通过动态路由和稀疏激活机制，极大提升了大语言模型（LLM）的学习能力，展现出显著的潜力。基于这一架构，涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。然而，随着模型参数的迅速膨胀，如何高效部署和推理成了新的挑战。

8/11/2025 2:46:00 PM

机器之心

终于把深度学习中的模型压缩搞懂了！

终于把深度学习中的模型压缩搞懂了！

今天给大家分享几种常见的模型压缩技术。在深度学习中，模型压缩是减少模型大小、降低计算复杂度，同时尽可能保持模型性能的一类技术。它在移动端、嵌入式设备和边缘计算等资源受限的环境中尤其重要。

2/17/2025 1:09:59 PM

程序员小寒

提升人工智能性能的三种关键的LLM压缩策略

提升人工智能性能的三种关键的LLM压缩策略

译者 | 布加迪审校 | 重楼在当今快节奏的数字环境中，依赖人工智能的企业面临着新的挑战：运行人工智能模型的延迟、内存使用和计算能力成本。随着人工智能快速发展，幕后推动这些创新的模型变得越来越复杂、资源密集。虽然这些大模型在处理各种任务中取得了出色的性能，但它们通常伴随着很高的计算和内存需求。

11/19/2024 8:08:16 AM

布加迪

1

资讯热榜

印度创新试点：AI 聊天机器人助力电子商务购物新方式两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用软银贷款50亿美元助力AI投资，孙正义押注未来科技！ OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升 Sora2公布提示词指南！直接抄作业能玩一整天！ AI黑话听不懂？收藏这份3分钟快速扫盲指南！前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法 Stable Diffusion 芯片腾讯苹果 AI for Science Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成预测视觉架构伟达 DeepMind Transformer 编程神器推荐 AI模型亚马逊 Copilot