AI在线 AI在线

智谱 AI 宣布 GLM-4-Flash 大模型免费开放:支持中文、英语、日语、韩语、等 26 种语言

智谱 AI 今日宣布,GLM-4-Flash 大模型免费开放,通过智谱 AI 大模型开放平台调用。GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务,生成速度能达到 72.14 token/s,约等于 115 字符/s。GLM-4-Flash 具备多轮对话、网页浏览、Function Call(函数调用)和长文本推理(支持最大 128K 上下文)等功能,同时支持包括中文、英语、日语、韩语、德语在内的 26 种语言。官方表示,通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法

智谱 AI 今日宣布,GLM-4-Flash 大模型免费开放,通过智谱 AI 大模型开放平台调用。

GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务,生成速度能达到 72.14 token/s,约等于 115 字符/s。

GLM-4-Flash 具备多轮对话、网页浏览、Function Call(函数调用)和长文本推理(支持最大 128K 上下文)等功能,同时支持包括中文、英语、日语、韩语、德语在内的 26 种语言

官方表示,通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法,在推理层面实现模型的延迟降低与速度提升,更大并发量和吞吐量不仅提升了效率,而且让推理成本显著降低,从而免费推出。

在预训练方面,官方引入了大语言模型进入数据筛选流程,获得 10T 高质量多语言数据,数据量是 ChatGLM3-6B 模型的 3 倍以上;同时采用了 FP8 技术进行预训练,提高了训练效率和计算量。

AI在线附相关链接如下:

体验地址:https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash

说明文档:https://open.bigmodel.cn/dev/api#glm-4

相关资讯

智谱宣布旗下多款大模型产品降价 其中GLM-4-Plus降价90%

智谱宣布旗下多款大模型产品降价 其中GLM-4-Plus降价90%

4月24日,智谱BigModel开放平台宣布进入“亿时代”,对旗下多款大模型产品进行价格调整,大幅降低使用门槛,让更多的企业能够以极低成本拥抱大模型技术。 智谱BigModel开放平台此次价格调整涉及多个模型产品。 其中,GLM-4-FlashX模型每亿tokens的价格仅为10元,该模型基于强大的预训练基座,具有超快的推理速度,功能调用能力与GPT-4相当,在数据抽取、生成、翻译等方面表现出色。
4/24/2025 12:00:49 PM AI在线
真香!智谱大模型,有了首个免费的API

真香!智谱大模型,有了首个免费的API

大模型API,正式进入Flash时代。最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推出了 Mini 版,号称比当前最为先进的小模型能力更强,价格更低。如果你现在访问 ChatGPT,会发现原来的默认模型 GPT-3.5 已经消失,新的默认选项就是 GPT-4o mini。自 2022 年底一直沿用的 GPT-3.5 终于被取代了,这不禁让人
8/27/2024 5:00:00 PM 机器之心
阿里巴巴推出新款 Qwen 模型,三秒音频即可克隆声音

阿里巴巴推出新款 Qwen 模型,三秒音频即可克隆声音

近日,阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型,旨在通过文本指令生成或克隆声音。 其中,Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音,用户可以精确定义声音的特征,如情感和说话节奏。 例如,用户可以请求生成一个 “中年男性,洪亮的男中音 —— 充满活力的广告解说,快速的语速,夸张的音调变化,充满销售魅力的声音”。
12/24/2025 11:41:18 AM AI在线