研究公司公布 SwiftKV 技术：优化大模型提示词处理过程、降低 50% AI 推论时间

作者：漾仔 2025-01-17 05:15

研究公司 Snowflake 公布了一款名为“SwiftKV”的 AI 模型调校技术，并在 Hugging Face 开源三款利用“SwiftKV”技术进行调校的 Llama 3.1 AI 模型。

研究公司 Snowflake 公布了一款名为“SwiftKV”的 AI 模型调校技术，并在 Hugging Face 开源三款利用“SwiftKV”技术进行调校的 Llama 3.1 AI 模型（点此访问）。

AI在线获悉，SwiftKV 技术的核心在于优化模型提示词处理过程。研究人员指出，通常情况下大模型最为消耗计算资源的环节在于处理用户为模型输入的提示词，而许多企业为模型自定义了极长的提示词，据称平均情况“大约是输出生成内容的 10 倍”。

据 Snowflake 介绍，这一“SwiftKV”模型调校技术专门为相应预制的提示词处理进行优化，号称突破了传统的键值（Key-Value，KV）缓存压缩技术，还在模型推理过程中引入模型重组与知识保存自我蒸馏方法，从而有效提升模型吞吐量、降低了延迟和运算成本，号称可以帮助 AI 模型显著缩短推理时间，可以降低模型 50% 推论时间。

实验结果表明，在利用 SwiftKV 技术优化 Llama 3.1 的 80 亿和 700 亿参数模型后，相应模型的整体吞吐量可提升两倍，同时相应模型也在代码自动补全、文本摘要等方面表现出色。

研究公司公布 SwiftKV 技术：优化大模型提示词处理过程、降低 50% AI 推论时间

理想同学接入 DeepSeek-R1-0528 最新模型

理想同学的官方账号 @AI理想同学今日发文宣布：理想同学已接入 DeepSeek-R1-0528 最新模型。据介绍，理想同学手机、网页端已正式接入 DeepSeek R1-0528 最新版，切换“DeepSeek 模型”并开启“深度思考”模式即可使用最新的 AI 问答、创作能力。

6/12/2025 6:17:38 PM 归泷

OpenAI 最强推理模型、能够“思考”图片，o3 和 o4-mini 正式发布

OpenAI 官方介绍称，这是其在 o 系列模型中最新训练的成果，可以在回答前进行更长时间的思考，也宣称是“迄今为止 OpenAI 发布的最智能的模型”，代表了 ChatGPT 能力的一次重大飞跃，从好奇的用户到高级研究人员都将因此受益。

4/17/2025 1:27:45 AM 汪淼

Transformer革新药物研发：TRACER框架实现反应感知的分子设计与合成优化

编辑 | 2049药物研发周期长、成本高是制药行业面临的重大挑战。据统计，一个新药从研发到上市平均需要 12 年时间，投入高达 26 亿美元。为提升研发效率，深度学习在分子生成领域取得了显著进展。

2/26/2025 3:52:00 PM ScienceAI

研究公司公布 SwiftKV 技术：优化大模型提示词处理过程、降低 50% AI 推论时间

相关资讯

理想同学接入 DeepSeek-R1-0528 最新模型

OpenAI 最强推理模型、能够“思考”图片，o3 和 o4-mini 正式发布

Transformer革新药物研发：TRACER框架实现反应感知的分子设计与合成优化