AI在线 AI在线

开源

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。 模型地址:,该模型是 DeepSeek-V3 系列最新的基础模型。 至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。
8/20/2025 9:08:00 AM

英伟达开源9B参数小模型,比Qwen3快6倍

小模型也开始卷起来了! 在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型,以及谷歌发布了一款可以在智能手机上运行的小型模型之后,英伟达也加入了这场浪潮,推出了自己的新型小型语言模型(SLM):Nemotron Nano v2。 这款9B的“小”模型在复杂推理基准测试上的准确率与Qwen3-8B相当或更高,速度快6倍。
8/19/2025 4:10:46 PM

字节Seed开源长线记忆多模态Agent,像人一样能听会看

不圆 发自 凹非寺. 量子位 | 公众号 QbitAI字节Seed发布全新多模态智能体框架——M3-Agent。 像人类一样能听会看、具备长期记忆,并且免费开源!
8/18/2025 4:04:41 PM
不圆

Meta刚刚开源DINOv3,横扫60+任务,无标注封神!

今天凌晨,全球社交、科技巨头Meta开源了,最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习,无需标注数据就能大幅度降低训练所需要的时间和算力资源。 并且与前一代相比,DINOv3的训练数据大12倍扩大至17亿张图像以及大7倍的70亿参数。
8/15/2025 9:07:09 AM

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。 但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。 然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。
8/13/2025 11:42:09 AM

机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」

8 月 11 日,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。 开源链接:机器人上下文协议 RynnRCP - 语言 - 动作模型 RynnVLA-001 RynnEC ,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。 达摩院将 MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了 RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。
8/11/2025 6:09:37 PM

智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开

就在上个月底,智谱放出重磅炸弹 —— 开源新一代旗舰模型 GLM-4.5 以及轻量版 GLM-4.5-Air。 其不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合,还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。 这个成绩在所有国产模型和开源模型中均排名第一!
8/11/2025 5:58:44 PM

达摩院开源具身智能“三大件”,机器人上下文协议首次开源

8月11日消息,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型RynnVLA-001-7B、世界理解模型RynnEC、以及机器人上下文协议RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。 具身智能领域飞速发展,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。 达摩院将MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。
8/11/2025 11:14:21 AM
量子位的朋友们

刚刚,小红书开源了多模态大模型dots.vlm1,性能直追SOTA!

最近的AI圈只能说是神仙打架,太卷了。 OpenAI终于发了开源模型,Claude从Opus 4升级到4.1,谷歌推出生成游戏世界的Genie 3引发社区热议。 国产模型这边,就在前几天,HuggingFace上排在最前面的10个开源模型还都来自国内。
8/7/2025 4:24:19 PM
新智元

OpenAI重磅发布gpt-oss系列开源大模型:媲美 GPT-4o

不论你是独立开发者、企业还是研究机构,现在都可以免费拥有一款与 GPT-4o 接近实力的语言模型。 开源但不“阉割”:媲美 GPT-4o,运行成本极低OpenAI 在这次发布中非常有诚意:gpt-oss-120b:在核心推理任务上已接近 GPT-4o-mini,支持 128k 上下文,单卡 80GB GPU 可跑。 gpt-oss-20b:性能对标 GPT-3.5(o3-mini),仅需 16GB 显存,可部署于消费级设备、本地推理、离线使用等场景。
8/7/2025 2:05:40 PM
AI大模型应用开发

腾讯AI Lab开源可复现的深度研究智能体,最大限度降低外部依赖

深度研究智能体(Deep Research Agents)凭借大语言模型(LLM)和视觉-语言模型(VLM)的强大能力,正在重塑知识发现与问题解决的范式。 然而,现有开源智能体框架多依赖付费工具,限制了可复现性和普适性。 腾讯AI Lab全新推出的Cognitive Kernel-Pro,一款全开源、多模块、层次化的智能体框架,为深度研究智能体的开发与训练提供了突破性解决方案。
8/6/2025 3:37:52 PM
不圆

阿里刚刚开源Qwen-Image,免费版GPT-4o吉卜力,中文最好模型

今天凌晨,阿里巴巴达摩院开源了最新文生图模型Qwen-Image。 Qwen-Image是一个200亿参数的MMDiT模型,可生成写实、动漫、赛博朋克、科幻、极简、复古、超现实、水墨等几十种类型的图片,支持图片的风格迁移、增删改、细节增强、文字编辑,人物姿态调整等常规操作。 Qwen-Image也可以生成OpenAI的GPT-4o爆火全网的吉卜力风格图片。
8/5/2025 9:15:15 AM

手机也能跑大模型,腾讯混元推出多款小尺寸开源模型

8月 4 日,腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 这四款模型的推出,是腾讯混元大模型持续开源的一大举措,也进一步丰富了混元开源模型体系,可为开发者和企业提供更多尺寸的模型选择。 目前,四个模型均在 Github 和 HuggingFace 等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。
8/4/2025 4:12:39 PM
一水

开源AI是个伪概念!Claude之父语出惊人:DS是否开源都不影响我们的商业价值!不惧“年亏30亿”:做前沿模型就像风投

出品 | 51CTO技术栈(微信号:blog51cto)硅谷很少有播客,比Anthropic CEO Dario更具戏剧性了。 他的发言之犀利,让人听得直冒冷汗——他谈和黄仁勋的不合,直言奥特曼做AI的使命“不够真诚”,不看好Meta的AI路线,甚至主动提起了马斯克的Grok前阵子的政治翻车事件。 不到一个小时,分分钟就把硅谷大半圈的人都“得罪”了个遍。
8/1/2025 5:55:47 PM
伊风

凝聚开源共识,第三届杭州产投融生态大会在杭召开

数字浪潮奔涌,开源引领未来。 7月31日,第三届杭州产投融生态大会在杭州圆满召开。 杭州市政府相关领导及市级有关部门代表到场支持。
8/1/2025 5:37:01 PM
鹭羽

VLM与扩散模型深度整合,图像理解生成编辑三合一模型登场,权重数据训练流程全开源

VLM和扩散模型被整合到一起了。 ModelScope(魔搭)团队发布Nexus-Gen V2,一个同时支持图像理解、生成和编辑的统一模型,而且模型权重、训练流程和数据集全部开源。 这事儿有多重要?
8/1/2025 2:32:01 PM

1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升

当大模型在数学题和代码任务里“卷”参数规模时,一支来自快手和清华的团队给出了不同答案——. 他们用1.5B参数的小模型,在多个推理基准上干过了同量级SOTA。 秘密在于给模型的“学习过程”做了精细化管理:让该记牢的知识稳住,让该灵活的推理放开。
7/31/2025 12:13:29 PM
不圆

1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了

听说了吗,GPT-5这两天那叫一个疯狂造势,奥特曼怕不是真有些急了(doge)。 但有一说一,回顾上半年最火AI事件,GPT-4o带来的“吉卜力”风暴,还是热度TOP。 △数据来自微信指数不仅由“万物皆可吉卜力”为始,GPT-4o生图功能被网友们疯玩至今,更重要的是,还引发了更深的技术思考:AIGC的范式,已经被悄然改变。
7/31/2025 8:45:00 AM