模型
突发!DeepSeek刚刚开源V3.1-Base
今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。 非常低调没有任何介绍,只是把模型放上去了。 但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
8/20/2025 9:35:20 AM
DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。 模型地址:,该模型是 DeepSeek-V3 系列最新的基础模型。 至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。
8/20/2025 9:08:00 AM
美国专家来中国转了一圈:AI比赛已经结束了
现状来看,美国后继乏力,比赛可能已经结束了。 这就是一个美国专家,近期来中国转了一圈,然后回国后被万千美国网友议论的最新结论。 而且这个结论,不少美国人由衷认同,因为论据核心主要涉及——电力。
8/20/2025 9:04:00 AM
英伟达开源9B参数小模型,比Qwen3快6倍
小模型也开始卷起来了! 在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型,以及谷歌发布了一款可以在智能手机上运行的小型模型之后,英伟达也加入了这场浪潮,推出了自己的新型小型语言模型(SLM):Nemotron Nano v2。 这款9B的“小”模型在复杂推理基准测试上的准确率与Qwen3-8B相当或更高,速度快6倍。
8/19/2025 4:10:46 PM
首个3D动作游戏专用VLA模型,打黑神话&只狼超越人类玩家 | ICCV 2025
3B多模态大模型在动作角色扮演游戏的战斗任务中,成功率超越GPT-4o和人类玩家,淘天集团未来生活实验室团队提出了CombatVLA,已被ICCV 2025接收。 在复杂的三维环境中实现实时决策仍面临重大挑战,要求模型能在秒级时间尺度做出响应,具备高分辨率感知能力,并能够在动态条件下进行战术推理。 如下图所示,团队给出了CombatVLA推理得到的AoT解释、解析成Python代码的动作指令,以及执行这些动作后的帧序列。
8/19/2025 4:08:20 PM
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
刚刚,OpenAI又离职一名华人大佬。 前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布,并参与o*-mini、o3等模型工作。
8/19/2025 3:58:59 PM
小模型才是 Agent 的未来?这篇立场文把话挑明了
AI圈最近什么最火? 答案里一定有AI Agent。 从能帮你预订机票、规划旅行的私人助理,到能自动编写、调试代码的程序员搭档,AI智能体的浪潮正汹涌而来。
8/19/2025 9:20:02 AM
超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家
一个小解码器让所有模型当上领域专家! 华人团队新研究正在引起热议。 他们提出了一种比目前业界主流采用的DAPT(领域自适应预训练)和RAG(检索增强生成)更方便、且成本更低的方法。
8/19/2025 9:12:00 AM
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
OpenAI在8月初发布了开放权重模型家族gpt-oss,这是公司自2019年GPT-2以来首次真正意义上的开源动作。 仅仅两周后,一位研究者就将这一模型“拆解重组”,推出了与官方版本迥异的变体。 康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris,公开了名为gpt-oss-20b-base的新版本。
8/19/2025 2:10:00 AM
AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行
AI能预测未来吗? 在《黑客帝国》里,先知能对Neo的未来做出预测。 以ChatGPT为代表的AI,则可以根据过去的语料来「预测下一个Token」。
8/18/2025 5:16:45 PM
GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?
「GPT-5,是一个分水岭」。 昨天,OpenAI联创Greg Brockman在Latent Space团队的专访中对GPT-5做出了高度的评价。 这一小时的访谈,含金量极高。
8/18/2025 9:16:00 AM
奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买
你们有没有发现,GPT-5最近好像变得不太一样了? 刚刚,OpenAI宣布GPT-5即将恢复GPT-4o的「温暖」风格。 奥特曼认为模型变暖只是第一步,让用户自定义ChatGPT风格才能真正解决问题。
8/18/2025 9:10:00 AM
AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃
或许你也注意到了这个现象——AI和机器学习的繁荣,已经造成了一场少有人谈论的危机。 学生和研究人员过剩,就业前景有限,整个学术体系已经不堪重负。 随着NeurIPS、ICML和CVPR等会议的投稿数量激增,同行评审流程正在崩溃。
8/18/2025 8:51:00 AM
Claude Code 史诗级更新!AI 编程进入“反向教学”模式,写到一半会停下考你:这行代码你来写
Claude code又更新了,最近claude几乎一天一更新,今天,Claude Code 和 Claude App 推出了学习模式,感觉Claude Code正在朝着万能Agent发展先说 Claude Code:现在支持用 /output-style 来定制沟通风格,Output styles允许你把 Claude Code 调整为任意类型的Agent来配合你的工作流程,同时保留它的核心能力(运行本地脚本、读写文件、维护 TODO)这次主打两种风格,专为学生和开发者提升技能而来:Explanatory(解释)——Claude 会把它的思考过程摊开说,为什么这么设计、有哪些权衡、最佳实践是什么,一边写代码一边讲门道Learning(学习)——更像结对编程的导师。 Claude 会不时暂停,把部分任务交给你来写,再给出指导与反馈,边做边学实操上,如果你想更深入理解它在做什么、为什么这么做,选 Explanatory;如果你想通过亲手编码快速进步,选 Learning,把 Claude 当成带你升级打怪的搭档就好。 更多细节可看官方文档:,对所有 Claude App 用户也有好消息:此前在 Claude for Education首发的 Learning 风格,现在全面开放。
8/15/2025 9:16:16 AM
Meta刚刚开源DINOv3,横扫60+任务,无标注封神!
今天凌晨,全球社交、科技巨头Meta开源了,最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习,无需标注数据就能大幅度降低训练所需要的时间和算力资源。 并且与前一代相比,DINOv3的训练数据大12倍扩大至17亿张图像以及大7倍的70亿参数。
8/15/2025 9:07:09 AM
链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防
思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段,通过在输入中加入「Let’s think step by step」等提示,模型会生成类似人类的中间推理步骤,显著提升复杂任务的表现。 然而,这些流畅的推理链条是否真的反映了模型的推理能力? 亚利桑那州立大学的一项最新研究却发现,CoT 推理可能并不是真正的推理,而更像是对训练数据分布内模式的复现。
8/15/2025 9:03:24 AM
LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer
OpenAI 在 AI 领域引领了一波又一波浪潮,想必很多人好奇,这些创新背后的研究人员是如何通过面试的? 尤其是现在,OpenAI 已经成为全球最受瞩目的 AI 公司之一,吸引了无数顶尖人才投递简历。 想要加入这个团队,着实不容易。
8/15/2025 8:57:02 AM
GPT-4o替代爹味GPT-5!奥特曼光速滑跪,OpenAI连夜回滚「赛博舔狗」
GPT-5发布之后,奥特曼面临的是从未想象过的愤怒民意。 许多网友激动反抗说:GPT-5太冷漠无情,太爹味了,赶快把我的GPT-4o「男友/女友」还给我! 铺天盖地的吐槽和骂声中,奥特曼不得不连夜让GPT-4o等一众旧模型回归,不过只有Pro用户能看到,而且还需手动设置。
8/14/2025 6:20:04 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉