AI在线 AI在线

研究公司公布 SwiftKV 技术:优化大模型提示词处理过程、降低 50% AI 推论时间

研究公司 Snowflake 公布了一款名为“SwiftKV”的 AI 模型调校技术,并在 Hugging Face 开源三款利用“SwiftKV”技术进行调校的 Llama 3.1 AI 模型。

研究公司 Snowflake 公布了一款名为“SwiftKV”的 AI 模型调校技术,并在 Hugging Face 开源三款利用“SwiftKV”技术进行调校的 Llama 3.1 AI 模型(点此访问)。

AI在线获悉,SwiftKV 技术的核心在于优化模型提示词处理过程。研究人员指出,通常情况下大模型最为消耗计算资源的环节在于处理用户为模型输入的提示词,而许多企业为模型自定义了极长的提示词,据称平均情况“大约是输出生成内容的 10 倍”。

研究公司公布 SwiftKV 技术:优化大模型提示词处理过程、降低 50% AI 推论时间

据 Snowflake 介绍,这一“SwiftKV”模型调校技术专门为相应预制的提示词处理进行优化,号称突破了传统的键值(Key-Value,KV)缓存压缩技术,还在模型推理过程中引入模型重组与知识保存自我蒸馏方法,从而有效提升模型吞吐量、降低了延迟和运算成本,号称可以帮助 AI 模型显著缩短推理时间,可以降低模型 50% 推论时间

实验结果表明,在利用 SwiftKV 技术优化 Llama 3.1 的 80 亿和 700 亿参数模型后,相应模型的整体吞吐量可提升两倍,同时相应模型也在代码自动补全、文本摘要等方面表现出色。

研究公司公布 SwiftKV 技术:优化大模型提示词处理过程、降低 50% AI 推论时间

相关资讯

OpenAI 最强推理模型、能够“思考”图片,o3 和 o4-mini 正式发布

OpenAI 官方介绍称,这是其在 o 系列模型中最新训练的成果,可以在回答前进行更长时间的思考,也宣称是“迄今为止 OpenAI 发布的最智能的模型”,代表了 ChatGPT 能力的一次重大飞跃,从好奇的用户到高级研究人员都将因此受益。
4/17/2025 1:27:45 AM
汪淼

Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化

编辑 | 2049药物研发周期长、成本高是制药行业面临的重大挑战。 据统计,一个新药从研发到上市平均需要 12 年时间,投入高达 26 亿美元。 为提升研发效率,深度学习在分子生成领域取得了显著进展。
2/26/2025 3:52:00 PM
ScienceAI

聊聊SpringAI流式输出的底层实现?

在 Spring AI 中,流式输出(Streaming Output)是一种逐步返回 AI 模型生成结果的技术,允许服务器将响应内容分批次实时传输给客户端,而不是等待全部内容生成完毕后再一次性返回。 这种机制能显著提升用户体验,尤其适用于大模型响应较慢的场景(如生成长文本或复杂推理结果)。 技术实现在 Spring AI 中流式输出的实现有以下两种方式:通过 ChatModel 实现流式输出。
4/24/2025 12:00:00 AM
磊哥
  • 1