AI在线 AI在线

RWKV7-G1 1.5B全球语言推理模型发布 支持100多种自然语言

4月29日,RWKV基金会宣布开源发布了RWKV7-G11.5B推理模型,这是一款具备强大推理能力和多语言支持的模型,特别适合在端侧设备(如手机)上运行。 该模型基于World v3.5数据集训练,包含小说、网页、数学、代码和推理数据,总数据量达到5.16T tokens。 RWKV7-G11.5B模型在推理逻辑性方面表现出色,能够完成多语言、数学和代码任务。

4月29日,RWKV基金会宣布开源发布了RWKV7-G11.5B推理模型,这是一款具备强大推理能力和多语言支持的模型,特别适合在端侧设备(如手机)上运行。该模型基于World v3.5数据集训练,包含小说、网页、数学、代码和推理数据,总数据量达到5.16T tokens。

RWKV7-G11.5B模型在推理逻辑性方面表现出色,能够完成多语言、数学和代码任务。其英语和多语言能力显著强于同规模的开源模型,包括同期发布的Qwen3-1.7B-Base。在MMLU(Multilingual Mathematics Language Understanding)评测中,该模型的准确度达到了48.2%,比之前的RWKV-7World1.5B的44.8%有显著提升。

在“无法作弊的评测”(Uncheatable Eval)中,RWKV7-G11.5B的综合得分在同参数规模的开源模型中处于领先地位,超越了Qwen2.5-1.5B,仅次于参数更多的Qwen3-1.7B。这一评测使用最新的论文和新闻文章等实时数据,评估开源大语言模型的真实建模能力和泛化能力。

微信截图_20250430083056.png

RWKV7-G11.5B模型支持全球100多种自然语言,比同参数量的Transformer模型更强。在多语言翻译任务中,该模型能够准确地将中文翻译为多种语言。此外,该模型还具备基础的代码能力,能够完成Leetcode题目,并在数学题目解答中表现出色。

为了方便用户体验,RWKV基金会提供了在线demo和移动端聊天APP。用户可以通过Hugging Face或魔搭社区的在线demo体验已完成训练的RWKV7-G10.1B、0.4B和1.5B模型。此外,还提供了处于内测阶段的RWKV端侧聊天APP,支持Android和iOS版本。

RWKV7-G11.5B模型的发布计划包括G10.1B、0.4B、1.5B和即将发布的2.9B模型。当前已发布的模型包括G10.1B、0.4B和1.5B,而G12.9B模型预计将在5月中旬发布。此外,RWKV基金会也在准备更大更优的数据集World v3.7,预计不久将开始训练RWKV7-G17B模型。

快速体验 G11.5B:https://huggingface.co/spaces/RWKV-Red-Team/RWKV-LatestSpace

相关资讯

无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍

Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型,其在每个基准测试中,都优于 Llama 2 13B,并且在代码、数学和推理方面也优于 LLaMA 1 34B。与大模型相比,小模型具有很多优点,比如对算力的要求低、可在端侧运行等。近日,又有一个新的语言模型出现了,即 7.52B 参数 Eagle 7B,来自开源非盈利组织 RWKV,其具有以下特点:基于 RWKV-v5 架构构
2/1/2024 2:37:00 PM
机器之心

OpenAI 最强推理模型、能够“思考”图片,o3 和 o4-mini 正式发布

OpenAI 官方介绍称,这是其在 o 系列模型中最新训练的成果,可以在回答前进行更长时间的思考,也宣称是“迄今为止 OpenAI 发布的最智能的模型”,代表了 ChatGPT 能力的一次重大飞跃,从好奇的用户到高级研究人员都将因此受益。
4/17/2025 1:27:45 AM
汪淼

专家圆桌:“国产类 ChatGPT ”所存在的差距与挑战

内容来源:ChatGPT 及大模型专题研讨会 转载自CSDN稿件在经历寒冬、雾霾,甚至大家纷纷看不到希望之际,ChatGPT 犹如一场春雨,给做 AI 甚至 NLP 等研究的人带来了新的希望。3 月 11 日,由中国人工智能学会主办,中国人工智能学会 NLP 专委会、真格基金、达观数据共同承办,中国信通院云大所支持的「ChatGPT 及大模型专题研讨会」正式举行。在圆桌对话环节,来自学术界、产业界及投资界的知名专家学者,就 ChatGPT 引发的新 AI 浪潮、大模型“基础模型”论、“国产类 ChatGPT ”所存
4/21/2023 9:41:00 AM
达观数据
  • 1