Sea-Helm
新加坡国家AI计划“换芯”:弃用Meta Llama,拥抱阿里Qwen3-32B,开源模型Sea-Lion v4 登顶东南亚语言榜
新加坡人工智能计划AISG发布新一代大语言模型Qwen-Sea-Lion-v4,底层由Meta Llama全面切换为阿里巴巴“通义千问”Qwen3-32B,并在东南亚语言综合评估基准(Sea-Helm)夺得2000亿参数开源榜单第一名。 切换原因 - 语言适配:Llama对印尼语、泰语、马来语等低资源语言表现不佳;Qwen3预训练覆盖119种语言/方言,含36万亿token,原生多语架构降低后续训练门槛 - 分词优化:新模型放弃西方常用“句子分词器”,采用字节对编码(BPE),可无空格切分泰语、缅甸语字符,翻译准确率与推理速度显著提升 - 算力友好:量化后模型可在32GB内存消费级笔记本运行,契合东南亚大量中小企业算力稀缺场景训练数据 AISG贡献1000亿东南亚语言token,内容浓度13%,为Llama2的26倍;阿里运用“高级后训练”注入区域知识,使模型更好理解新加坡式英语、马来式英语等混用语言。 性能结果 Sea-Helm榜单显示,Qwen-Sea-Lion-v4在印尼语、越南语、泰语、马来语任务上平均领先原Llama基线8.4%,文档级推理与跨语言摘要指标均排名第一。
11/26/2025 6:06:26 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
AI新词
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
具身智能
生成式
神经网络
机器学习
3D
RAG
AI视频
人形机器人
研究
大语言模型
百度
生成
Sora
GPU
工具
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
生成式AI
场景
DeepMind
深度学习
AI模型
特斯拉
架构
MCP
亚马逊
Transformer
编程
视觉
预测