开源

北京发布开源生态三年行动方案！2028年前打造10个国际顶级开源项目，AI大模型落地目标100个

中国开源生态迎来政策强引擎。近日，《北京市开源生态体系建设实施方案（2026— 2028 年）正式印发，明确提出：到 2028 年，培育 10 个具有国际影响力的开源项目（其中不少于 5 个达到国际引领水平），打造 30 个国内明星开源项目（AI领域占比超1/3），并推动 100 个行业大模型实现规模化落地应用。这一方案标志着北京正以国家战略高度系统性构建全球领先的开源创新高地。

12/26/2025 9:56:52 AM AI在线

艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

近日，艾伦人工智能研究所（Ai2）发布了全新的 Molmo2开源视频语言模型。这一系列新模型和相关训练数据展示了该非营利机构在开源领域的坚定承诺，特别是在企业希望掌控模型使用的背景下，这无疑是一项重大利好。 Molmo2包含几种不同的模型版本，包括基于阿里巴巴 Qwen3语言模型的 Molmo2-4B 和 Molmo2-8B，此外还有基于 Ai2Olmo 语言模型的完全开源版本 Molmo2-O-7B。

12/17/2025 11:02:02 AM AI在线

加码开源技术，英伟达收购 AI 软件公司 SchedMD

AI在线 12 月 16 日消息，英伟达当地时间周一宣布，已收购人工智能软件公司 SchedMD。此举彰显了这家芯片设计巨头对开源技术的加倍投入，并进一步加码人工智能生态系统投资，以应对日益激烈的竞争。除了高性能芯片，英伟达同时也提供涵盖物理仿真、自动驾驶等多个领域的自有 AI 模型，并以开源软件形式供研究人员和企业使用。

12/16/2025 7:59:40 AM 远洋

智谱开源 GLM-4.6V 系列：106B 原生支持 Function Call，轻量版 9B 免费商用

智谱正式并上线开源 GLM-4.6V 多模态大模型系列，含基础版 GLM-4.6V（总参106B，激活12B）与轻量版 GLM-4.6V-Flash(9B)。新模型将上下文窗口提升至128k tokens，视觉理解精度达同参数 SOTA，首次把 Function Call 能力原生融入视觉模型，打通「视觉感知 → 可执行行动」完整链路。 API 价格较 GLM-4.5V 下降50%，输入1元 / 百万 tokens、输出3元 / 百万 tokens;GLM-4.6V-Flash 完全免费，已集成 GLM Coding Plan 与专用 MCP 工具，开发者可零成本商用。

12/9/2025 11:36:59 AM AI在线

阶跃开源4B Agent模型，跑通所有安卓设备，手搓党一键部署

GELab-Zero团队投稿. 量子位 | 公众号 QbitAI首次将GUI Agent模型与完整配套基建同步开放，支持手搓党一键部署！这就是阶跃星辰刚刚开源的GELab-Zero。

11/30/2025 3:04:32 PM 衡宇

Zleap技术解密：后RAG时代已来，SAG重新定义AI搜索

大家好，我是Jomy，是智跃Zleap的CEO，也是Zleap产品和技术的主要设计者。此前在报道中，我曾粗略介绍过Zleap产品背后的技术：一个能帮助CEO自动整理、总结海量企业内部信息的智能Agent。今天，我要正式为大家介绍驱动这个Agent的底层技术：SAG。

11/18/2025 11:17:48 AM 鹭羽

今晚19点｜2GPU+2CPU微调超大模型，带你上手开源KTransformers

视点发自凹非寺. 量子位｜公众号 QbitAI2GPU 2CPU就可以在本地微调自己的DeepSeek 671B / Kimi K2 1TB超大模型了。这就是前两天量子位介绍的明星开源项目KTransformers，吸引了很多伙伴的关注。

11/11/2025 5:03:01 PM 林樾

Cursor“自研”模型套壳国产开源？网友：毕竟好用又便宜

美国顶流AI产品“套壳”中国开源大模型，这事儿上“热搜”了（doge）。 𝕏网友都在感叹：大家都认为中国大模型正在迎头赶上。不，它们已经赶上了。

11/3/2025 8:52:00 AM

开源Agent编程模型MiniMax M2，性价比之王

开源模型之王易主，不过还是国产模型！行业评测里，它在 Artificial Analysis 榜单综合进入全球前五、开源模型第一梯队，重点在编程、工具使用、深度搜索这些 Agent 核心能力上表现亮眼。 MiniMax 刚发布并开源M2模型，它采用稀疏 MoE 架构，总参数 230B，但推理时仅激活约 10B，这意味着在保持高性能的同时，把算力开销和延迟压下来了。

10/31/2025 9:07:24 AM 阿丸笔记

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

10/31/2025 8:50:00 AM

OpenAI 再出开源力作 Safeguard 模型：可完整展示 AI“思维链”，强化内容分类能力

10 月 30 日消息，科技媒体 NeoWin 昨日（10 月 29 日）发布博文，报道称 OpenAI 公司推出 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款开源权重模型，专门用于根据用户提供的策略对内容进行推理、分类和标记。这是继今年早些时候发布 gpt-oss 系列推理模型后，OpenAI 在开源领域的又一重要举措。新模型是此前 gpt-oss 模型的微调版本，同样遵循宽松的 Apache 2.0 许可证，允许任何开发者免费使用、修改和商业部署。

10/30/2025 4:21:13 PM 故渊

DeepSeek-OCR：用视觉模态给长文本“瘦身”，大模型处理效率再突破

在大语言模型（LLMs）不断拓展能力边界的今天，长文本处理始终是道绕不开的坎——文本序列每增加一倍，计算量就可能翻四倍，像处理一本几十万字的书籍、一份上千页的金融报告时，内存溢出、推理卡顿成了常态。但DeepSeek团队最近开源的DeepSeek-OCR模型，给出了一个全新解法：把文本“画”成图像，用视觉Token实现高效压缩。原本需要1000个文本Token存储的内容，现在100个视觉Token就能搞定，还能保持97%的OCR精度。

10/30/2025 7:00:00 AM Goldma

美团视频生成模型来了！一出手就是开源SOTA

美团，你是跨界上瘾了是吧！（doge）没错，最新开源SOTA视频模型，又是来自这家“送外卖”的公司。模型名为LongCat-Video，参数13.6B，支持文生/图生视频，视频时长可达数分钟。

10/28/2025 8:40:00 AM

最强OCR竟然不是DeepSeek、Paddle！HuggingFace新作：六大顶尖开源OCR模型横评！继DS后又杀出匹黑马！

编辑 | 听雨在AI快速进化的浪潮中，文字和图像的界限正在被重新定义。那些能“看懂”文件、理解图表、读出语义的视觉语言模型（VLM），正在让传统OCR（光学字符识别）进入一个全新的智能阶段。如果你还以为OCR只是“识字”的工具，那你可能错过了它真正的革命性变化。

10/24/2025 4:42:09 PM 听雨

李开复：美国在AI硬件赛道已败给中国！中国AI算力将是美国十倍！警告AI速度失控：先上车再修路，将酿成重大事故！

编辑 | 云昭在旧金山TED AI大会上，创新工场董事长、AI科学家李开复通过视频连线发表演讲，罕见地直言：“在AI硬件和机器人制造方面，美国正在被中国超越。 ”李表示，这一点也不夸张。在AI硬件与机器人赛道，中国的领先正在成为事实。

10/24/2025 12:45:11 PM 云昭

谷歌痛失王座？港科大贾佳亚团队DreamOmni2开源，超强P图暴击Nano Banana

AI图像模型杀疯了！年初，GPT-4o引爆了一股「吉卜力」热潮。最近，全网更是玩疯了Nano Banana生成的3D手办。

10/23/2025 12:41:13 PM

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

这不巧了吗……智谱和DeepSeek，又双叒撞车了。太卷了，DeepSeek-OCR刚发布不到一天，智谱就开源了自家的视觉Token方案——Glyph。既然是同台对垒，那自然得请这两天疯狂点赞DeepSeek的卡帕西来鉴赏一下：或许你也会对我们的工作感兴趣。

10/23/2025 8:55:04 AM

中国首个AI开源后端平台，让前端开发彻底“自给自足”了！

AI 只写一半应用这几年，AI Coding 工具的发展实在是太快了，你随便丢给它一个复杂的需求，它就能迅速拆分成一个个任务，生成漂亮的界面，着实是让人震惊不已。但是深入观察一下就会发现，那只是“一半的应用”：只有前端代码，没有后端，界面漂亮，数据却是假的。原因很简单，后端要涉及数据库、API、服务器等复杂环境，要想让AI完全自动生成、集成、部署，难度极高。

10/22/2025 3:48:46 PM 刘欣

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型 AI新词机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果算法腾讯 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算大型语言模型 AI设计生成式AI 搜索视频生成亚马逊 AI模型 DeepMind 特斯拉场景深度学习 Transformer 架构 Copilot MCP 编程视觉

开源

北京发布开源生态三年行动方案！2028年前打造10个国际顶级开源项目，AI大模型落地目标100个

​艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

加码开源技术，英伟达收购 AI 软件公司 SchedMD

智谱开源 GLM-4.6V 系列：106B 原生支持 Function Call，轻量版 9B 免费商用

阶跃开源4B Agent模型，跑通所有安卓设备，手搓党一键部署

Zleap技术解密：后RAG时代已来，SAG重新定义AI搜索

今晚19点｜2GPU+2CPU微调超大模型，带你上手开源KTransformers

Cursor“自研”模型套壳国产开源？网友：毕竟好用又便宜

开源Agent编程模型MiniMax M2，性价比之王

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

OpenAI 再出开源力作 Safeguard 模型：可完整展示 AI“思维链”，强化内容分类能力

DeepSeek-OCR：用视觉模态给长文本“瘦身”，大模型处理效率再突破

美团视频生成模型来了！一出手就是开源SOTA

最强OCR竟然不是DeepSeek、Paddle！HuggingFace新作：六大顶尖开源OCR模型横评！继DS后又杀出匹黑马！

李开复：美国在AI硬件赛道已败给中国！中国AI算力将是美国十倍！警告AI速度失控：先上车再修路，将酿成重大事故！

谷歌痛失王座？港科大贾佳亚团队DreamOmni2开源，超强P图暴击Nano Banana

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

中国首个AI开源后端平台，让前端开发彻底“自给自足”了！

艾伦人工智能研究所推出 Molmo 2 开源视频语言模型