AI在线 AI在线

开源模型

谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作

AI在线 7 月 26 日消息,综合新浪科技及澎湃新闻,2025 世界人工智能大会今日开幕,谷歌前 CEO 埃里克・施密特表示,在中国那些领先的模型都是开源的,也是开放权重的。 但美国领先的模型都不是开源的,也不是开放权重的,这就是当前 AI 发展的整体局面。 AI在线从施密特的发言中获悉,施密特赞赏说,中国 AI 过去两年取得了巨大成就,中美应该开展合作,共同维护世界稳定,确保人类能够掌控这些 AI 工具。
7/26/2025 4:23:44 PM
清源

DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国

几千人盲投,Kimi K2 超越 DeepSeek 拿下全球开源第一! 歪果网友们直接炸了,评论区秒变夸夸打卡现场:今天,竞技场终于更新了 Kimi K2 的排名情况 ——开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。 并且各类单项能力也不差,能和一水儿闭源模型打得有来有回:连续多轮对话并列第一,o3 和 Grok 4 均为第四;编程能力第二,和 GPT 4.5、Grok 4 持平;应对复杂提示词能力第二,和 o3、4o 位于同一梯队;……甚至眼尖的朋友也发现了,唯二闯入总榜 TOP 10 的开源模型都来自中国。
7/18/2025 5:59:31 PM

月之暗面卷土重来?Kimi K2杀回来了

为什么一个中国公司的开源模型,能让硅谷的闭源巨头们感到紧张? 昨天看到月之暗面发布Kimi K2的消息,我特意去测试了一下。 说实话,刚开始我还是有点怀疑,毕竟之前见过太多"对标GPT-4"的宣传最后都不了了之。
7/16/2025 9:29:39 AM
阿丸笔记

MiniMax 发布全球首个开源大规模 AI 模型,技术突破引发行业关注

近日,上海的 AI 独角兽公司 MiniMax 正式推出了全球首个开源大规模混合架构推理模型 ——MiniMax-M1。 该模型一经推出,便迅速跻身权威评测榜单,成为全球开源模型的第二名,仅次于近期发布的 DeepSeek-R1-0528。 这一里程碑式的成就让 MiniMax 创始人兼 CEO 闫俊杰在社交媒体上感慨:“第一次感觉到大山不是不能翻越。
7/5/2025 7:46:36 AM
AI在线

国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行

网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R1 等通用大模型。
6/23/2025 6:56:33 PM
汪淼

​月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

月之暗面(Moonshot AI)宣布推出其新开源模型 Kimi-Dev-72B,这一模型专注于软件工程任务,并在 AI 编程基准测试 SWE-bench Verified 中创下了全球最高的开源模型成绩。 Kimi-Dev-72B 以仅72亿参数量的设计,成功超越了刚发布不久的 DeepSeek-R1,后者的参数量高达671亿。 在 SWE-bench Verified 测试中,Kimi-Dev-72B 获得了60.4% 的高分,成为当前开源模型中的新标杆。
6/17/2025 4:01:40 PM
AI在线

OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”

OpenAI CEO山姆・奥尔特曼宣布,原定初夏发布的开源模型将推迟至夏末,因团队取得‘意想不到且相当惊人’的成果。该模型旨在超越现有开源推理模型,如DeepSeek R1。行业竞争激烈,Mistral和Qwen近期也发布了新模型。#AI开源模型##OpenAI#
6/11/2025 7:50:44 AM
远洋

字节 Seed 开源统一多模态理解和生成模型 BAGEL

BAGEL 具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs,如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与专业生成器如 SD3 竞争的文本到图像质量。
6/3/2025 6:12:28 PM
汪淼

Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具

Claude 团队来搞开源了 —— 推出“电路追踪”(circuit tracing)工具,可以帮大伙儿读懂大模型的“脑回路”,追踪其思维过程。
5/31/2025 10:36:22 PM
汪淼

B站团队开源动漫视频生成模型 AniSora,一键创建不同风格片段

AniSora 能够一键创建多种动漫风格的视频片段,包括系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫 PV 和鬼畜动画等。
5/18/2025 10:07:54 AM
汪淼

成本仅DeepSeek三分之一!阿里发布全球最强开源大模型Qwen3系列

小道消息一直在说,前天深夜或者昨天凌晨,阿里会发 Qwen3。 然后我特意早早的睡了一两小时,凌晨 1 点起床,就为了等 Qwen3 发。 结果这一等,就是好几个小时。
5/1/2025 1:13:13 AM
数字生命卡兹克

智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元

北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2亿元人民币,支持智谱的开源模型研发与开源社区生态建设。 智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。 智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。
4/18/2025 12:01:21 PM
AI在线

智谱华章获北京AI产业基金2亿元追加投资,开源模型战略获官方认可

北京市人工智能产业投资基金近日宣布,向北京智谱华章科技股份有限公司(简称"智谱")追加投资2亿元人民币。 据基金方面透露,智谱是该基金成立以来投资的第一家AI大模型企业,也是目前成长最快的企业之一。 智谱在文本、推理、语音、图像、视频和代码等领域的模型能力建设方面积累深厚,同时拥有完善的商业化布局,已经建立了超过百万规模的开发者社区和企业用户基础。
4/18/2025 10:01:29 AM
AI在线

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型

智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。 这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。 此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数,利用15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据。
4/15/2025 10:01:27 AM
AI在线

昆仑万维推出 Skywork-OR1 系列模型:全面开放、免费使用、完全开源

昆仑万维今日发文宣布,天工团队在首款中文逻辑推理大模型 Skywork-o1 基础上迭代优化,推出了全新升级的 Skywork-OR1(Open Reasoner 1) 系列模型。
4/13/2025 9:53:09 PM
归泷

谷歌前科学家出品!Reka开源Reka Flash 3,能力超Gemma 3 27B

Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。 这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。 别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。
3/21/2025 2:01:00 PM
AI在线

32B参数的“逆袭”!OLMo 2 32B横空出世,叫板GPT-3.5 Turbo

近日,艾伦人工智能研究所(AI2)重磅发布了其最新的大型语言模型——OLMo232B。 这款模型一经亮相便自带光环,因为它不仅是OLMo2系列的最新力作,更以“完全开放”的姿态,向那些高墙深垒的专有模型发起了强有力的挑战。 OLMo232B最引人注目的特点莫过于其彻彻底底的开源属性。
3/18/2025 2:53:00 PM
AI在线

开源图片超分模型Thera:可以提升图片清晰度,让模糊从此“下岗”

各位追求高清无码的视觉动物们,请注意!图像处理界又添一枚猛将——Thera,一款开源的任意尺度超分辨率模型,带着满满的黑科技和友好的开源姿态,闪亮登场啦! 这位新晋“美图秀秀Plus”不仅能让你的模糊照片重见天日,还能以你意想不到的灵活方式进行放大,简直是细节控们的福音,模糊党的克星!想放多大就多大?还在为固定倍数的图片放大而烦恼吗?Thera 告诉你,那都是过去式了!这款由苏黎世联邦理工学院和苏黎世大学的大佬们联手打造的神器,最引人注目的特点就是其任意尺度超分辨率能力。 你可以随心所欲地指定放大倍数,无论是3.14倍这种略显“调皮”的数字,还是其他任何你想要的比例,Thera 都能轻松应对,真正实现了“我的清晰度我做主”!
3/17/2025 9:47:00 AM
AI在线