开源模型
Liquid AI 发布 LFM2.5:一款面向边缘设备的小型 AI 模型家族
Liquid AI 最近推出了 LFM2.5,这是一个新一代的小型基础模型家族,基于 LFM2架构,专注于边缘设备和本地部署。 该模型家族包括 LFM2.5-1.2B-Base 和 LFM2.5-1.2B-Instruct,同时扩展了日语、视觉语言和音频语言的变种。 这些模型以开源权重形式发布在 Hugging Face 上,并通过 LEAP 平台进行展示。
源 Yuan 3.0 Flash 多模态基础大模型开源发布:40B 参数规模,单次推理仅激活约 3.7B
AI在线 12 月 31 日消息,浪潮旗下 YuanLab.ai 团队 12 月 30 日开源发布源 Yuan 3.0 Flash 多模态基础大模型。 Yuan 3.0 Flash 是一款 40B 参数规模的多模态基础大模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约 3.7B 参数。 Yuan 3.0 Flash 提出和采用了强化学习训练方法(RAPO),通过反思抑制奖励机制(RIRM),从训练层面引导模型减少无效反思,在提升推理准确性的同时,大幅压缩了推理过程的 token 消耗,降低算力成本。
中国开源大模型全球登顶!千问下载量超美,OpenAI被指“封闭失速”,《连线》:AI价值看生态而非智商
全球AI格局正在悄然重塑。 据Hugging Face最新数据, 2025 年 7 月,中国开源大模型的全球下载量首次超越美国,其中阿里通义千问(Qwen)高居榜首;与此同时,第三方API平台OpenRouter的调用数据显示,千问已成为全球第二大最受欢迎的开源模型,仅次于Meta的Llama系列,力压Google、Anthropic等巨头。 “生态广度”成新衡量标准,GPT- 5 遇冷引反思这一趋势引发西方科技媒体高度关注。
美团推出 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar
近日,美团旗下的 LongCat 团队宣布开源其最新的视频生成模型 ——LongCat-Video-Avatar,标志着虚拟人技术的又一次重要突破。 该模型在长视频生成领域表现优异,具有多项核心功能,吸引了广泛的开发者关注。 LongCat-Video-Avatar 基于此前的 LongCat-Video 模型,延续了 “一个模型支持多任务” 的设计理念,原生支持音频文本转视频(AT2V)、音频文本图像转视频(ATI2V)及视频续写等功能。
英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列,吞吐量达上一代 4 倍
AI在线 12 月 15 日消息,英伟达今日发布 Nemotron 3 开源模型系列,包括 Nano、Super 和 Ultra 三种规格,宣称是构建 AI 智能体应用时“具有最佳准确性的最高效开源模型家族”。 Nemotron 3 系列模型宣称引入了一种突破性的混合潜在专家(MoE)架构,帮助开发者大规模构建和部署可靠的多智能体系统。 英伟达表示,随着组织从单一模型聊天机器人转向协作式的多智能体 AI 系统,开发者面临着越来越多的挑战,包括通信开销、上下文漂移和高昂的推理成本。
整体生成 × 精准控制:HoloCine 如何实现分钟级电影叙事?
大家好,我是肆〇柒。 今天我们一起了解一项来自香港科技大学(HKUST)与蚂蚁集团(Ant Group)联合团队的创新研究——HoloCine。 这项研究首次实现了分钟级、多镜头、高一致性的电影级视频整体生成,不仅在Transition Control指标上达到0.9837(远超现有方法),更展现出对镜头语言、角色记忆甚至电影术语的“理解”能力。
阿里云CTO透露:通义千问开源300+模型 下载量破6亿大关
在 2025 云栖大会上,阿里云智能集团的首席技术官周靖人分享了一项令人瞩目的成就:通义千问项目截至目前已成功开源超过 300 个模型,且其下载总量已经突破了 6 亿次。 这一数字无疑展示了阿里云在 AI 领域的强大影响力和用户认可度。 周靖人在会上表示,通义千问项目的模型涵盖了全尺寸、全模态,能够满足不同用户的需求。
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!
全球最快的开源大模型来了——速度达到了每秒2000个tokens! 虽然只有320亿参数(32B),吞吐量却是超过典型GPU部署的10倍以上的那种。 它就是由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)和初创公司G42 AI合作推出的K2 Think。
DeepSeek V3.1:低调发布,重磅发声
译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
AI“诸神黄昏”本周上演?GPT-5、Claude 4.1、Gemini 3 传言同步发布,地表最强模型之战一触即发
人工智能领域可能在本周迎来一次集中爆发。 据悉,GPT-5、OpenAI开源模型、Claude Opus 4.1,以及Gemini 3都有可能在本周发布。 这预示着,全球顶尖AI公司的下一代旗舰模型或将同步登场。
谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作
AI在线 7 月 26 日消息,综合新浪科技及澎湃新闻,2025 世界人工智能大会今日开幕,谷歌前 CEO 埃里克・施密特表示,在中国那些领先的模型都是开源的,也是开放权重的。 但美国领先的模型都不是开源的,也不是开放权重的,这就是当前 AI 发展的整体局面。 AI在线从施密特的发言中获悉,施密特赞赏说,中国 AI 过去两年取得了巨大成就,中美应该开展合作,共同维护世界稳定,确保人类能够掌控这些 AI 工具。
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
几千人盲投,Kimi K2 超越 DeepSeek 拿下全球开源第一! 歪果网友们直接炸了,评论区秒变夸夸打卡现场:今天,竞技场终于更新了 Kimi K2 的排名情况 ——开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。 并且各类单项能力也不差,能和一水儿闭源模型打得有来有回:连续多轮对话并列第一,o3 和 Grok 4 均为第四;编程能力第二,和 GPT 4.5、Grok 4 持平;应对复杂提示词能力第二,和 o3、4o 位于同一梯队;……甚至眼尖的朋友也发现了,唯二闯入总榜 TOP 10 的开源模型都来自中国。
月之暗面卷土重来?Kimi K2杀回来了
为什么一个中国公司的开源模型,能让硅谷的闭源巨头们感到紧张? 昨天看到月之暗面发布Kimi K2的消息,我特意去测试了一下。 说实话,刚开始我还是有点怀疑,毕竟之前见过太多"对标GPT-4"的宣传最后都不了了之。
MiniMax 发布全球首个开源大规模 AI 模型,技术突破引发行业关注
近日,上海的 AI 独角兽公司 MiniMax 正式推出了全球首个开源大规模混合架构推理模型 ——MiniMax-M1。 该模型一经推出,便迅速跻身权威评测榜单,成为全球开源模型的第二名,仅次于近期发布的 DeepSeek-R1-0528。 这一里程碑式的成就让 MiniMax 创始人兼 CEO 闫俊杰在社交媒体上感慨:“第一次感觉到大山不是不能翻越。
国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行
网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R1 等通用大模型。
月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录
月之暗面(Moonshot AI)宣布推出其新开源模型 Kimi-Dev-72B,这一模型专注于软件工程任务,并在 AI 编程基准测试 SWE-bench Verified 中创下了全球最高的开源模型成绩。 Kimi-Dev-72B 以仅72亿参数量的设计,成功超越了刚发布不久的 DeepSeek-R1,后者的参数量高达671亿。 在 SWE-bench Verified 测试中,Kimi-Dev-72B 获得了60.4% 的高分,成为当前开源模型中的新标杆。
OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”
OpenAI CEO山姆・奥尔特曼宣布,原定初夏发布的开源模型将推迟至夏末,因团队取得‘意想不到且相当惊人’的成果。该模型旨在超越现有开源推理模型,如DeepSeek R1。行业竞争激烈,Mistral和Qwen近期也发布了新模型。#AI开源模型##OpenAI#
字节 Seed 开源统一多模态理解和生成模型 BAGEL
BAGEL 具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs,如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与专业生成器如 SD3 竞争的文本到图像质量。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉