开源
DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。 模型地址:,该模型是 DeepSeek-V3 系列最新的基础模型。 至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。
8/20/2025 9:08:00 AM
英伟达开源9B参数小模型,比Qwen3快6倍
小模型也开始卷起来了! 在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型,以及谷歌发布了一款可以在智能手机上运行的小型模型之后,英伟达也加入了这场浪潮,推出了自己的新型小型语言模型(SLM):Nemotron Nano v2。 这款9B的“小”模型在复杂推理基准测试上的准确率与Qwen3-8B相当或更高,速度快6倍。
8/19/2025 4:10:46 PM
字节Seed开源长线记忆多模态Agent,像人一样能听会看
不圆 发自 凹非寺. 量子位 | 公众号 QbitAI字节Seed发布全新多模态智能体框架——M3-Agent。 像人类一样能听会看、具备长期记忆,并且免费开源!
8/18/2025 4:04:41 PM
不圆
Meta刚刚开源DINOv3,横扫60+任务,无标注封神!
今天凌晨,全球社交、科技巨头Meta开源了,最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习,无需标注数据就能大幅度降低训练所需要的时间和算力资源。 并且与前一代相比,DINOv3的训练数据大12倍扩大至17亿张图像以及大7倍的70亿参数。
8/15/2025 9:07:09 AM
OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了
前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。 但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。 然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。
8/13/2025 11:42:09 AM
机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
8 月 11 日,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。 开源链接:机器人上下文协议 RynnRCP - 语言 - 动作模型 RynnVLA-001 RynnEC ,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。 达摩院将 MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了 RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。
8/11/2025 6:09:37 PM
智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开
就在上个月底,智谱放出重磅炸弹 —— 开源新一代旗舰模型 GLM-4.5 以及轻量版 GLM-4.5-Air。 其不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合,还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。 这个成绩在所有国产模型和开源模型中均排名第一!
8/11/2025 5:58:44 PM
达摩院开源具身智能“三大件”,机器人上下文协议首次开源
8月11日消息,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型RynnVLA-001-7B、世界理解模型RynnEC、以及机器人上下文协议RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。 具身智能领域飞速发展,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。 达摩院将MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。
8/11/2025 11:14:21 AM
量子位的朋友们
刚刚,小红书开源了多模态大模型dots.vlm1,性能直追SOTA!
最近的AI圈只能说是神仙打架,太卷了。 OpenAI终于发了开源模型,Claude从Opus 4升级到4.1,谷歌推出生成游戏世界的Genie 3引发社区热议。 国产模型这边,就在前几天,HuggingFace上排在最前面的10个开源模型还都来自国内。
8/7/2025 4:24:19 PM
新智元
OpenAI重磅发布gpt-oss系列开源大模型:媲美 GPT-4o
不论你是独立开发者、企业还是研究机构,现在都可以免费拥有一款与 GPT-4o 接近实力的语言模型。 开源但不“阉割”:媲美 GPT-4o,运行成本极低OpenAI 在这次发布中非常有诚意:gpt-oss-120b:在核心推理任务上已接近 GPT-4o-mini,支持 128k 上下文,单卡 80GB GPU 可跑。 gpt-oss-20b:性能对标 GPT-3.5(o3-mini),仅需 16GB 显存,可部署于消费级设备、本地推理、离线使用等场景。
8/7/2025 2:05:40 PM
AI大模型应用开发
腾讯AI Lab开源可复现的深度研究智能体,最大限度降低外部依赖
深度研究智能体(Deep Research Agents)凭借大语言模型(LLM)和视觉-语言模型(VLM)的强大能力,正在重塑知识发现与问题解决的范式。 然而,现有开源智能体框架多依赖付费工具,限制了可复现性和普适性。 腾讯AI Lab全新推出的Cognitive Kernel-Pro,一款全开源、多模块、层次化的智能体框架,为深度研究智能体的开发与训练提供了突破性解决方案。
8/6/2025 3:37:52 PM
不圆
阿里刚刚开源Qwen-Image,免费版GPT-4o吉卜力,中文最好模型
今天凌晨,阿里巴巴达摩院开源了最新文生图模型Qwen-Image。 Qwen-Image是一个200亿参数的MMDiT模型,可生成写实、动漫、赛博朋克、科幻、极简、复古、超现实、水墨等几十种类型的图片,支持图片的风格迁移、增删改、细节增强、文字编辑,人物姿态调整等常规操作。 Qwen-Image也可以生成OpenAI的GPT-4o爆火全网的吉卜力风格图片。
8/5/2025 9:15:15 AM
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
8月 4 日,腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 这四款模型的推出,是腾讯混元大模型持续开源的一大举措,也进一步丰富了混元开源模型体系,可为开发者和企业提供更多尺寸的模型选择。 目前,四个模型均在 Github 和 HuggingFace 等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。
8/4/2025 4:12:39 PM
一水
开源AI是个伪概念!Claude之父语出惊人:DS是否开源都不影响我们的商业价值!不惧“年亏30亿”:做前沿模型就像风投
出品 | 51CTO技术栈(微信号:blog51cto)硅谷很少有播客,比Anthropic CEO Dario更具戏剧性了。 他的发言之犀利,让人听得直冒冷汗——他谈和黄仁勋的不合,直言奥特曼做AI的使命“不够真诚”,不看好Meta的AI路线,甚至主动提起了马斯克的Grok前阵子的政治翻车事件。 不到一个小时,分分钟就把硅谷大半圈的人都“得罪”了个遍。
8/1/2025 5:55:47 PM
伊风
凝聚开源共识,第三届杭州产投融生态大会在杭召开
数字浪潮奔涌,开源引领未来。 7月31日,第三届杭州产投融生态大会在杭州圆满召开。 杭州市政府相关领导及市级有关部门代表到场支持。
8/1/2025 5:37:01 PM
鹭羽
VLM与扩散模型深度整合,图像理解生成编辑三合一模型登场,权重数据训练流程全开源
VLM和扩散模型被整合到一起了。 ModelScope(魔搭)团队发布Nexus-Gen V2,一个同时支持图像理解、生成和编辑的统一模型,而且模型权重、训练流程和数据集全部开源。 这事儿有多重要?
8/1/2025 2:32:01 PM
1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升
当大模型在数学题和代码任务里“卷”参数规模时,一支来自快手和清华的团队给出了不同答案——. 他们用1.5B参数的小模型,在多个推理基准上干过了同量级SOTA。 秘密在于给模型的“学习过程”做了精细化管理:让该记牢的知识稳住,让该灵活的推理放开。
7/31/2025 12:13:29 PM
不圆
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
听说了吗,GPT-5这两天那叫一个疯狂造势,奥特曼怕不是真有些急了(doge)。 但有一说一,回顾上半年最火AI事件,GPT-4o带来的“吉卜力”风暴,还是热度TOP。 △数据来自微信指数不仅由“万物皆可吉卜力”为始,GPT-4o生图功能被网友们疯玩至今,更重要的是,还引发了更深的技术思考:AIGC的范式,已经被悄然改变。
7/31/2025 8:45:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
具身智能
生成
百度
Sora
工具
GPU
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
架构
DeepMind
亚马逊
编程
特斯拉
视觉
Transformer
AI模型
预测
MCP