AI在线 AI在线

开源模型

Liquid AI 发布 LFM2.5:一款面向边缘设备的小型 AI 模型家族

Liquid AI 发布 LFM2.5:一款面向边缘设备的小型 AI 模型家族

Liquid AI 最近推出了 LFM2.5,这是一个新一代的小型基础模型家族,基于 LFM2架构,专注于边缘设备和本地部署。 该模型家族包括 LFM2.5-1.2B-Base 和 LFM2.5-1.2B-Instruct,同时扩展了日语、视觉语言和音频语言的变种。 这些模型以开源权重形式发布在 Hugging Face 上,并通过 LEAP 平台进行展示。
1/7/2026 4:46:59 PM AI在线
源 Yuan 3.0 Flash 多模态基础大模型开源发布:40B 参数规模,单次推理仅激活约 3.7B

源 Yuan 3.0 Flash 多模态基础大模型开源发布:40B 参数规模,单次推理仅激活约 3.7B

AI在线 12 月 31 日消息,浪潮旗下 YuanLab.ai 团队 12 月 30 日开源发布源 Yuan 3.0 Flash 多模态基础大模型。 Yuan 3.0 Flash 是一款 40B 参数规模的多模态基础大模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约 3.7B 参数。 Yuan 3.0 Flash 提出和采用了强化学习训练方法(RAPO),通过反思抑制奖励机制(RIRM),从训练层面引导模型减少无效反思,在提升推理准确性的同时,大幅压缩了推理过程的 token 消耗,降低算力成本。
12/31/2025 5:28:55 PM 汪淼
中国开源大模型全球登顶!千问下载量超美,OpenAI被指“封闭失速”,《连线》:AI价值看生态而非智商

中国开源大模型全球登顶!千问下载量超美,OpenAI被指“封闭失速”,《连线》:AI价值看生态而非智商

全球AI格局正在悄然重塑。 据Hugging Face最新数据, 2025 年 7 月,中国开源大模型的全球下载量首次超越美国,其中阿里通义千问(Qwen)高居榜首;与此同时,第三方API平台OpenRouter的调用数据显示,千问已成为全球第二大最受欢迎的开源模型,仅次于Meta的Llama系列,力压Google、Anthropic等巨头。  “生态广度”成新衡量标准,GPT- 5 遇冷引反思这一趋势引发西方科技媒体高度关注。
12/29/2025 7:01:46 PM AI在线
美团推出 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar

美团推出 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar

近日,美团旗下的 LongCat 团队宣布开源其最新的视频生成模型 ——LongCat-Video-Avatar,标志着虚拟人技术的又一次重要突破。 该模型在长视频生成领域表现优异,具有多项核心功能,吸引了广泛的开发者关注。 LongCat-Video-Avatar 基于此前的 LongCat-Video 模型,延续了 “一个模型支持多任务” 的设计理念,原生支持音频文本转视频(AT2V)、音频文本图像转视频(ATI2V)及视频续写等功能。
12/19/2025 12:16:17 PM AI在线
英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列,吞吐量达上一代 4 倍

英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列,吞吐量达上一代 4 倍

AI在线 12 月 15 日消息,英伟达今日发布 Nemotron 3 开源模型系列,包括 Nano、Super 和 Ultra 三种规格,宣称是构建 AI 智能体应用时“具有最佳准确性的最高效开源模型家族”。 Nemotron 3 系列模型宣称引入了一种突破性的混合潜在专家(MoE)架构,帮助开发者大规模构建和部署可靠的多智能体系统。 英伟达表示,随着组织从单一模型聊天机器人转向协作式的多智能体 AI 系统,开发者面临着越来越多的挑战,包括通信开销、上下文漂移和高昂的推理成本。
12/15/2025 10:27:53 PM 汪淼
整体生成 × 精准控制:HoloCine 如何实现分钟级电影叙事?

整体生成 × 精准控制:HoloCine 如何实现分钟级电影叙事?

大家好,我是肆〇柒。 今天我们一起了解一项来自香港科技大学(HKUST)与蚂蚁集团(Ant Group)联合团队的创新研究——HoloCine。 这项研究首次实现了分钟级、多镜头、高一致性的电影级视频整体生成,不仅在Transition Control指标上达到0.9837(远超现有方法),更展现出对镜头语言、角色记忆甚至电影术语的“理解”能力。
11/4/2025 3:00:00 AM 肆零柒
阿里云CTO透露:通义千问开源300+模型 下载量破6亿大关

阿里云CTO透露:通义千问开源300+模型 下载量破6亿大关

在 2025 云栖大会上,阿里云智能集团的首席技术官周靖人分享了一项令人瞩目的成就:通义千问项目截至目前已成功开源超过 300 个模型,且其下载总量已经突破了 6 亿次。 这一数字无疑展示了阿里云在 AI 领域的强大影响力和用户认可度。 周靖人在会上表示,通义千问项目的模型涵盖了全尺寸、全模态,能够满足不同用户的需求。
9/25/2025 11:26:28 AM AI在线
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

全球最快的开源大模型来了——速度达到了每秒2000个tokens! 虽然只有320亿参数(32B),吞吐量却是超过典型GPU部署的10倍以上的那种。 它就是由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)和初创公司G42 AI合作推出的K2 Think。
9/10/2025 7:21:11 PM 十三
DeepSeek V3.1:低调发布,重磅发声

DeepSeek V3.1:低调发布,重磅发声

译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
8/23/2025 8:20:29 AM 李睿
AI“诸神黄昏”本周上演?GPT-5、Claude 4.1、Gemini 3 传言同步发布,地表最强模型之战一触即发

AI“诸神黄昏”本周上演?GPT-5、Claude 4.1、Gemini 3 传言同步发布,地表最强模型之战一触即发

人工智能领域可能在本周迎来一次集中爆发。 据悉,GPT-5、OpenAI开源模型、Claude Opus 4.1,以及Gemini 3都有可能在本周发布。 这预示着,全球顶尖AI公司的下一代旗舰模型或将同步登场。
8/6/2025 12:10:51 PM
谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作

谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作

AI在线 7 月 26 日消息,综合新浪科技及澎湃新闻,2025 世界人工智能大会今日开幕,谷歌前 CEO 埃里克・施密特表示,在中国那些领先的模型都是开源的,也是开放权重的。 但美国领先的模型都不是开源的,也不是开放权重的,这就是当前 AI 发展的整体局面。 AI在线从施密特的发言中获悉,施密特赞赏说,中国 AI 过去两年取得了巨大成就,中美应该开展合作,共同维护世界稳定,确保人类能够掌控这些 AI 工具。
7/26/2025 4:23:44 PM 清源
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国

DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国

几千人盲投,Kimi K2 超越 DeepSeek 拿下全球开源第一! 歪果网友们直接炸了,评论区秒变夸夸打卡现场:今天,竞技场终于更新了 Kimi K2 的排名情况 ——开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。 并且各类单项能力也不差,能和一水儿闭源模型打得有来有回:连续多轮对话并列第一,o3 和 Grok 4 均为第四;编程能力第二,和 GPT 4.5、Grok 4 持平;应对复杂提示词能力第二,和 o3、4o 位于同一梯队;……甚至眼尖的朋友也发现了,唯二闯入总榜 TOP 10 的开源模型都来自中国。
7/18/2025 5:59:31 PM
月之暗面卷土重来?Kimi K2杀回来了

月之暗面卷土重来?Kimi K2杀回来了

为什么一个中国公司的开源模型,能让硅谷的闭源巨头们感到紧张? 昨天看到月之暗面发布Kimi K2的消息,我特意去测试了一下。 说实话,刚开始我还是有点怀疑,毕竟之前见过太多"对标GPT-4"的宣传最后都不了了之。
7/16/2025 9:29:39 AM 阿丸笔记
MiniMax 发布全球首个开源大规模 AI 模型,技术突破引发行业关注

MiniMax 发布全球首个开源大规模 AI 模型,技术突破引发行业关注

近日,上海的 AI 独角兽公司 MiniMax 正式推出了全球首个开源大规模混合架构推理模型 ——MiniMax-M1。 该模型一经推出,便迅速跻身权威评测榜单,成为全球开源模型的第二名,仅次于近期发布的 DeepSeek-R1-0528。 这一里程碑式的成就让 MiniMax 创始人兼 CEO 闫俊杰在社交媒体上感慨:“第一次感觉到大山不是不能翻越。
7/5/2025 7:46:36 AM AI在线
国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行

国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行

网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R1 等通用大模型。
6/23/2025 6:56:33 PM 汪淼
​月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

​月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

月之暗面(Moonshot AI)宣布推出其新开源模型 Kimi-Dev-72B,这一模型专注于软件工程任务,并在 AI 编程基准测试 SWE-bench Verified 中创下了全球最高的开源模型成绩。 Kimi-Dev-72B 以仅72亿参数量的设计,成功超越了刚发布不久的 DeepSeek-R1,后者的参数量高达671亿。 在 SWE-bench Verified 测试中,Kimi-Dev-72B 获得了60.4% 的高分,成为当前开源模型中的新标杆。
6/17/2025 4:01:40 PM AI在线
OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”

OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”

OpenAI CEO山姆・奥尔特曼宣布,原定初夏发布的开源模型将推迟至夏末,因团队取得‘意想不到且相当惊人’的成果。该模型旨在超越现有开源推理模型,如DeepSeek R1。行业竞争激烈,Mistral和Qwen近期也发布了新模型。#AI开源模型##OpenAI#
6/11/2025 7:50:44 AM 远洋
字节 Seed 开源统一多模态理解和生成模型 BAGEL

字节 Seed 开源统一多模态理解和生成模型 BAGEL

BAGEL 具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs,如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与专业生成器如 SD3 竞争的文本到图像质量。
6/3/2025 6:12:28 PM 汪淼