TPM

大模型指标：RPM、TPM…这些“神秘代码”到底是什么？

大模型指标：RPM、TPM…这些“神秘代码”到底是什么？

一、RPM：每分钟能“说多少话”？定义：RPM全称是Requests Per Minute（每分钟请求数），表示大模型每分钟能处理的请求次数。比如，某模型设置RPM=300，就意味着每分钟最多响应300次用户提问。

3/13/2025 8:33:37 AM 若有无

豆包大模型公布价格清单，支持国内最高并发标准

豆包大模型公布价格清单，支持国内最高并发标准

近期，火山引擎官网更新了豆包大模型的定价详情，全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请求数）均达到国内最高标准。以豆包主力模型 pro-32k 为例，价格比行业低99%，TPM限额则高达同规格模型的2.7倍到8倍。图：豆包系列模型“后付费”定价信息官方信息显示：在按照 Tokens 实际使用量计算费用的“后付费”模式下，豆包通用模型-pro、豆包通用模型-lite的 32k 及以下窗口版本，模型限流为 1

5/21/2024 10:55:00 AM 新闻助手

火山豆包大模型价格清单公布：支持“预付 / 后付”双模式，号称“国内最高并发标准”

火山豆包大模型价格清单公布：支持“预付 / 后付”双模式，号称“国内最高并发标准”

字节跳动在 5 月 15 日的“春季火山引擎 FORCE 原动力大会”中推出了豆包大模型（原名“云雀”），该模型主要面向行业场景，能够提供多种图文音频生成能力，IT之家整理如下：豆包通用模型 pro：字节跳动自研 LLM 模型专业版，支持 128k 长文本，全系列可精调，具备更强的理解、生成、逻辑等综合能力，适配问答、总结、创作、分类等丰富场景；豆包通用模型 lite：字节跳动自研 LLM 模型轻量版，对比专业版提供更低 token 成本、更低延迟，为企业提供灵活经济的模型选择；豆包・角色扮演模型：个性化的角色创作

5/21/2024 10:33:05 AM 漾仔

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉