AI在线 AI在线

开源模型

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

全球最快的开源大模型来了——速度达到了每秒2000个tokens! 虽然只有320亿参数(32B),吞吐量却是超过典型GPU部署的10倍以上的那种。 它就是由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)和初创公司G42 AI合作推出的K2 Think。
9/10/2025 7:21:11 PM
十三

DeepSeek V3.1:低调发布,重磅发声

译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
8/23/2025 8:20:29 AM
李睿

AI“诸神黄昏”本周上演?GPT-5、Claude 4.1、Gemini 3 传言同步发布,地表最强模型之战一触即发

人工智能领域可能在本周迎来一次集中爆发。 据悉,GPT-5、OpenAI开源模型、Claude Opus 4.1,以及Gemini 3都有可能在本周发布。 这预示着,全球顶尖AI公司的下一代旗舰模型或将同步登场。
8/6/2025 12:10:51 PM

谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作

AI在线 7 月 26 日消息,综合新浪科技及澎湃新闻,2025 世界人工智能大会今日开幕,谷歌前 CEO 埃里克・施密特表示,在中国那些领先的模型都是开源的,也是开放权重的。 但美国领先的模型都不是开源的,也不是开放权重的,这就是当前 AI 发展的整体局面。 AI在线从施密特的发言中获悉,施密特赞赏说,中国 AI 过去两年取得了巨大成就,中美应该开展合作,共同维护世界稳定,确保人类能够掌控这些 AI 工具。
7/26/2025 4:23:44 PM
清源

DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国

几千人盲投,Kimi K2 超越 DeepSeek 拿下全球开源第一! 歪果网友们直接炸了,评论区秒变夸夸打卡现场:今天,竞技场终于更新了 Kimi K2 的排名情况 ——开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。 并且各类单项能力也不差,能和一水儿闭源模型打得有来有回:连续多轮对话并列第一,o3 和 Grok 4 均为第四;编程能力第二,和 GPT 4.5、Grok 4 持平;应对复杂提示词能力第二,和 o3、4o 位于同一梯队;……甚至眼尖的朋友也发现了,唯二闯入总榜 TOP 10 的开源模型都来自中国。
7/18/2025 5:59:31 PM

月之暗面卷土重来?Kimi K2杀回来了

为什么一个中国公司的开源模型,能让硅谷的闭源巨头们感到紧张? 昨天看到月之暗面发布Kimi K2的消息,我特意去测试了一下。 说实话,刚开始我还是有点怀疑,毕竟之前见过太多"对标GPT-4"的宣传最后都不了了之。
7/16/2025 9:29:39 AM
阿丸笔记

MiniMax 发布全球首个开源大规模 AI 模型,技术突破引发行业关注

近日,上海的 AI 独角兽公司 MiniMax 正式推出了全球首个开源大规模混合架构推理模型 ——MiniMax-M1。 该模型一经推出,便迅速跻身权威评测榜单,成为全球开源模型的第二名,仅次于近期发布的 DeepSeek-R1-0528。 这一里程碑式的成就让 MiniMax 创始人兼 CEO 闫俊杰在社交媒体上感慨:“第一次感觉到大山不是不能翻越。
7/5/2025 7:46:36 AM
AI在线

国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行

网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R1 等通用大模型。
6/23/2025 6:56:33 PM
汪淼

​月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

月之暗面(Moonshot AI)宣布推出其新开源模型 Kimi-Dev-72B,这一模型专注于软件工程任务,并在 AI 编程基准测试 SWE-bench Verified 中创下了全球最高的开源模型成绩。 Kimi-Dev-72B 以仅72亿参数量的设计,成功超越了刚发布不久的 DeepSeek-R1,后者的参数量高达671亿。 在 SWE-bench Verified 测试中,Kimi-Dev-72B 获得了60.4% 的高分,成为当前开源模型中的新标杆。
6/17/2025 4:01:40 PM
AI在线

OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”

OpenAI CEO山姆・奥尔特曼宣布,原定初夏发布的开源模型将推迟至夏末,因团队取得‘意想不到且相当惊人’的成果。该模型旨在超越现有开源推理模型,如DeepSeek R1。行业竞争激烈,Mistral和Qwen近期也发布了新模型。#AI开源模型##OpenAI#
6/11/2025 7:50:44 AM
远洋

字节 Seed 开源统一多模态理解和生成模型 BAGEL

BAGEL 具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs,如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与专业生成器如 SD3 竞争的文本到图像质量。
6/3/2025 6:12:28 PM
汪淼

Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具

Claude 团队来搞开源了 —— 推出“电路追踪”(circuit tracing)工具,可以帮大伙儿读懂大模型的“脑回路”,追踪其思维过程。
5/31/2025 10:36:22 PM
汪淼

B站团队开源动漫视频生成模型 AniSora,一键创建不同风格片段

AniSora 能够一键创建多种动漫风格的视频片段,包括系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫 PV 和鬼畜动画等。
5/18/2025 10:07:54 AM
汪淼

成本仅DeepSeek三分之一!阿里发布全球最强开源大模型Qwen3系列

小道消息一直在说,前天深夜或者昨天凌晨,阿里会发 Qwen3。 然后我特意早早的睡了一两小时,凌晨 1 点起床,就为了等 Qwen3 发。 结果这一等,就是好几个小时。
5/1/2025 1:13:13 AM
数字生命卡兹克

智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元

北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2亿元人民币,支持智谱的开源模型研发与开源社区生态建设。 智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。 智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。
4/18/2025 12:01:21 PM
AI在线

智谱华章获北京AI产业基金2亿元追加投资,开源模型战略获官方认可

北京市人工智能产业投资基金近日宣布,向北京智谱华章科技股份有限公司(简称"智谱")追加投资2亿元人民币。 据基金方面透露,智谱是该基金成立以来投资的第一家AI大模型企业,也是目前成长最快的企业之一。 智谱在文本、推理、语音、图像、视频和代码等领域的模型能力建设方面积累深厚,同时拥有完善的商业化布局,已经建立了超过百万规模的开发者社区和企业用户基础。
4/18/2025 10:01:29 AM
AI在线

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型

智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。 这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。 此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数,利用15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据。
4/15/2025 10:01:27 AM
AI在线

昆仑万维推出 Skywork-OR1 系列模型:全面开放、免费使用、完全开源

昆仑万维今日发文宣布,天工团队在首款中文逻辑推理大模型 Skywork-o1 基础上迭代优化,推出了全新升级的 Skywork-OR1(Open Reasoner 1) 系列模型。
4/13/2025 9:53:09 PM
归泷