开源
北京发布开源生态三年行动方案!2028年前打造10个国际顶级开源项目,AI大模型落地目标100个
中国开源生态迎来政策强引擎。 近日,《北京市开源生态体系建设实施方案(2026— 2028 年)正式印发,明确提出:到 2028 年,培育 10 个具有国际影响力的开源项目(其中不少于 5 个达到国际引领水平),打造 30 个国内明星开源项目(AI领域占比超1/3),并推动 100 个行业大模型实现规模化落地应用。 这一方案标志着北京正以国家战略高度系统性构建全球领先的开源创新高地。
艾伦人工智能研究所推出 Molmo 2 开源视频语言模型
近日,艾伦人工智能研究所(Ai2)发布了全新的 Molmo2开源视频语言模型。 这一系列新模型和相关训练数据展示了该非营利机构在开源领域的坚定承诺,特别是在企业希望掌控模型使用的背景下,这无疑是一项重大利好。 Molmo2包含几种不同的模型版本,包括基于阿里巴巴 Qwen3语言模型的 Molmo2-4B 和 Molmo2-8B,此外还有基于 Ai2Olmo 语言模型的完全开源版本 Molmo2-O-7B。
加码开源技术,英伟达收购 AI 软件公司 SchedMD
AI在线 12 月 16 日消息,英伟达当地时间周一宣布,已收购人工智能软件公司 SchedMD。 此举彰显了这家芯片设计巨头对开源技术的加倍投入,并进一步加码人工智能生态系统投资,以应对日益激烈的竞争。 除了高性能芯片,英伟达同时也提供涵盖物理仿真、自动驾驶等多个领域的自有 AI 模型,并以开源软件形式供研究人员和企业使用。
智谱开源 GLM-4.6V 系列:106B 原生支持 Function Call,轻量版 9B 免费商用
智谱正式并上线开源 GLM-4.6V 多模态大模型系列,含基础版 GLM-4.6V(总参106B,激活12B)与轻量版 GLM-4.6V-Flash(9B)。 新模型将上下文窗口提升至128k tokens,视觉理解精度达同参数 SOTA,首次把 Function Call 能力原生融入视觉模型,打通「视觉感知 → 可执行行动」完整链路。 API 价格较 GLM-4.5V 下降50%,输入1元 / 百万 tokens、输出3元 / 百万 tokens;GLM-4.6V-Flash 完全免费,已集成 GLM Coding Plan 与专用 MCP 工具,开发者可零成本商用。
阶跃开源4B Agent模型,跑通所有安卓设备,手搓党一键部署
GELab-Zero团队 投稿. 量子位 | 公众号 QbitAI首次将GUI Agent模型与完整配套基建同步开放,支持手搓党一键部署! 这就是阶跃星辰刚刚开源的GELab-Zero。
Zleap技术解密:后RAG时代已来,SAG重新定义AI搜索
大家好,我是Jomy,是智跃Zleap的CEO,也是Zleap产品和技术的主要设计者。 此前在报道中,我曾粗略介绍过Zleap产品背后的技术:一个能帮助CEO自动整理、总结海量企业内部信息的智能Agent。 今天,我要正式为大家介绍驱动这个Agent的底层技术:SAG。
今晚19点|2GPU+2CPU微调超大模型,带你上手开源KTransformers
视点 发自 凹非寺. 量子位|公众号 QbitAI2GPU 2CPU就可以在本地微调自己的DeepSeek 671B / Kimi K2 1TB超大模型了。 这就是前两天量子位介绍的明星开源项目KTransformers,吸引了很多伙伴的关注。
Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜
美国顶流AI产品“套壳”中国开源大模型,这事儿上“热搜”了(doge)。 𝕏网友都在感叹:大家都认为中国大模型正在迎头赶上。 不,它们已经赶上了。
开源Agent编程模型MiniMax M2,性价比之王
开源模型之王易主,不过还是国产模型! 行业评测里,它在 Artificial Analysis 榜单综合进入全球前五、开源模型第一梯队,重点在编程、工具使用、深度搜索这些 Agent 核心能力上表现亮眼。 MiniMax 刚发布并开源M2模型,它采用稀疏 MoE 架构,总参数 230B,但推理时仅激活约 10B,这意味着在保持高性能的同时,把算力开销和延迟压下来了。
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana
最新最强的开源原生多模态世界模型——北京智源人工智能研究院(BAAI)的悟界·Emu3.5来炸场了。 图、文、视频任务一网打尽,不仅能画图改图,还能生成图文教程,视频任务更是增加了物理真实性。 先感受一下它的高精度操作:一句话消除手写痕迹。
OpenAI 再出开源力作 Safeguard 模型:可完整展示 AI“思维链”,强化内容分类能力
10 月 30 日消息,科技媒体 NeoWin 昨日(10 月 29 日)发布博文,报道称 OpenAI 公司推出 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款开源权重模型,专门用于根据用户提供的策略对内容进行推理、分类和标记。 这是继今年早些时候发布 gpt-oss 系列推理模型后,OpenAI 在开源领域的又一重要举措。 新模型是此前 gpt-oss 模型的微调版本,同样遵循宽松的 Apache 2.0 许可证,允许任何开发者免费使用、修改和商业部署。
DeepSeek-OCR:用视觉模态给长文本“瘦身”,大模型处理效率再突破
在大语言模型(LLMs)不断拓展能力边界的今天,长文本处理始终是道绕不开的坎——文本序列每增加一倍,计算量就可能翻四倍,像处理一本几十万字的书籍、一份上千页的金融报告时,内存溢出、推理卡顿成了常态。 但DeepSeek团队最近开源的DeepSeek-OCR模型,给出了一个全新解法:把文本“画”成图像,用视觉Token实现高效压缩。 原本需要1000个文本Token存储的内容,现在100个视觉Token就能搞定,还能保持97%的OCR精度。
美团视频生成模型来了!一出手就是开源SOTA
美团,你是跨界上瘾了是吧! (doge)没错,最新开源SOTA视频模型,又是来自这家“送外卖”的公司。 模型名为LongCat-Video,参数13.6B,支持文生/图生视频,视频时长可达数分钟。
最强OCR竟然不是DeepSeek、Paddle!HuggingFace新作:六大顶尖开源OCR模型横评!继DS后又杀出匹黑马!
编辑 | 听雨在AI快速进化的浪潮中,文字和图像的界限正在被重新定义。 那些能“看懂”文件、理解图表、读出语义的视觉语言模型(VLM),正在让传统OCR(光学字符识别)进入一个全新的智能阶段。 如果你还以为OCR只是“识字”的工具,那你可能错过了它真正的革命性变化。
李开复:美国在AI硬件赛道已败给中国!中国AI算力将是美国十倍!警告AI速度失控:先上车再修路,将酿成重大事故!
编辑 | 云昭在旧金山TED AI大会上,创新工场董事长、AI科学家李开复通过视频连线发表演讲,罕见地直言:“在AI硬件和机器人制造方面,美国正在被中国超越。 ”李表示,这一点也不夸张。 在AI硬件与机器人赛道,中国的领先正在成为事实。
谷歌痛失王座?港科大贾佳亚团队DreamOmni2开源,超强P图暴击Nano Banana
AI图像模型杀疯了! 年初,GPT-4o引爆了一股「吉卜力」热潮。 最近,全网更是玩疯了Nano Banana生成的3D手办。
智谱运气是差一点点,视觉Token研究又和DeepSeek撞车了
这不巧了吗……智谱和DeepSeek,又双叒撞车了。 太卷了,DeepSeek-OCR刚发布不到一天,智谱就开源了自家的视觉Token方案——Glyph。 既然是同台对垒,那自然得请这两天疯狂点赞DeepSeek的卡帕西来鉴赏一下:或许你也会对我们的工作感兴趣。
中国首个AI开源后端平台,让前端开发彻底“自给自足”了!
AI 只写一半应用这几年,AI Coding 工具的发展实在是太快了,你随便丢给它一个复杂的需求,它就能迅速拆分成一个个任务,生成漂亮的界面,着实是让人震惊不已。 但是深入观察一下就会发现,那只是“一半的应用”:只有前端代码,没有后端,界面漂亮,数据却是假的。 原因很简单,后端要涉及数据库、API、服务器等复杂环境,要想让AI完全自动生成、集成、部署,难度极高。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉