SOTA

月之暗面斩获5亿美元C轮融资:手握百亿现金不急IPO，剑指AGI世界巅峰

国内大模型领军企业月之暗面（Moonshot AI）近日再次震撼行业。创始人兼CEO杨植麟在内部信中透露，公司已顺利完成5亿美元的 C 轮融资。得益于持续的融资助力，目前月之暗面账面现金储备已突破100亿元人民币。

12/31/2025 5:11:05 PM AI在线

MiniMax Agent 平台上线开源编码和代理模型 MiniMax M2.1

MiniMax M2.1正式上线。这款模型专为真实编码和原生 AI 组织设计，能够轻松应对从氛围构建到严肃工作流程的各种需求。 MiniMax M2.1是一款拥有100亿激活量的 SOTA（最先进技术）开源编码和代理模型，其在 SWE-multilingual 测试中得分72.5%，而在新发布的 VIBE-bench 测试中更是取得了88.6% 的高分，超越了 Gemini3Pro 和 Claude4.5Sonnet 等多款领先的闭源模型。

12/23/2025 2:41:53 PM AI在线

NeurIPS 2025｜火山引擎多媒体实验室联合南开大学推出TempSamp-R1强化学习新框架，视频时序理解大模型SOTA！

在人工智能与多媒体技术深度融合的当下，视频时序定位（Video Temporal Grounding）成为视频理解领域的核心任务之一，其目标是根据自然语言查询，在长段视频流中精准定位出与之匹配的时序片段。这一能力是智能视频剪辑、内容检索、人机交互、事件分析等众多场景落地的关键基础。例如，快速定位球赛进球瞬间、影视剧名场面、游戏高光镜头、响应“回放主角微笑片段” 、异常事件查看等需求，均依赖于高效精准的时序定位技术。

10/22/2025 10:16:02 AM 多媒体实验室

大模型“精细化”对齐，真实性提升25.8%刷新SOTA！token级精准编辑，无需训练即插即用

提升大模型对齐能力新方法，在TruthfulQA任务上真实性指标提升25.8%，刷新当前最优性能！方法名为Token-Aware Editing (TAE)，是一种token感知的推理时表征编辑方法。该方法首次系统性地从token层面解决了传统表征编辑技术的问题，无需训练、即插即用，可广泛应用于对话系统、内容审核、偏见mitigation等场景。

9/27/2025 12:58:47 PM 衡宇

只要科学任务能打分，AI就能实现SOTA结果 | 谷歌最新论文

不圆发自凹非寺. 量子位 | 公众号 QbitAI只要科学任务可以评分，AI就能找到超越人类专家的方法，实现SOTA结果？这是谷歌一篇最新论文里的内容：.

9/15/2025 3:51:47 PM 不圆

长文本检索新突破！斯坦福RAPTOR：用递归树结构兼顾语义深度与细节，刷新多数据集SOTA

在大语言模型（LLMs）主导的AI时代，“检索增强”早已成为提升模型事实准确性、降低幻觉的核心技术。然而，当前主流的检索方法仍面临一个关键瓶颈：无论是传统的BM25、基于深度学习的DPR，还是新兴的LLM检索器，大多依赖“文本分块单一维度匹配”的模式，难以捕捉长文本（如学术论文、书籍章节）中的层次化语义结构——要么因只取片段丢失上下文，要么因过度抽象遗漏关键细节。斯坦福大学团队在2024年ICLR提出RAPTOR（Recursive Abstractive Processing for Tree-Organized Retrieval），用“递归树状检索”的新思路打破了这一困境。

9/15/2025 9:25:26 AM Goldma

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快

今天，我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型，成为行业首个具备“高刷”视频理解能力的多模态模型，看得准、看得快，看得长！高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA，且性能超过 Qwen2.5-VL 72B，堪称最强端侧多模态模型。 MiniCPM-V 4.5 亮点一览 ?

8/27/2025 11:50:00 AM 徐咪

突破Claude-4编程上限！自进化Agent框架拿下新SOTA，底模越好性能越高，已开源

突破多步推理瓶颈，让Claude-3.7-Sonnet解题成功率暴增20.6%。在SWE-Bench Verified上刷新开源框架SOTA！中科院、清华大学、阶跃星辰等提出SE-Agent，一个创新的自进化（Self-Evolution）框架。

8/19/2025 11:26:46 AM

逆天!旧Mac上能run千亿参数SOTA!效果惊人:一次生成游戏，0修改！本地大模型拐点来了!网友：别被大模型叙事带偏了(附指南）

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）起猛了，连老电脑都能跑智谱家新一代的 SOTA 模型了！一篇来自技术人 Simon Willison（Python 知名 Web 框架 Django 的共同创始人）的实测文章，在 Hacker News 上引发热议：“我 2.5 年高龄的旧笔记本，现在不仅能在本地跑千亿参数模型，甚至还能用它写出一款完整的 JavaScript 太空入侵者游戏。 ”图片这个模型，正是昨天新鲜出炉的 GLM-4.5 系列。

7/30/2025 2:11:55 PM 伊风

WAIC抢先爆料：金融“黑马”大模型超DeepSeek刷新SOTA，论文已上线

又到了一年一度“中国AI春晚”WAIC，各家大厂动作频发的时候。今年会有哪些看点？你别说，我们还真在扒论文的过程中，发现了一些热乎线索。

7/25/2025 3:24:17 PM

网页编程众测排名：DeepSeek-R1超越Claude 4加冕全球第一

编程王者Claude地位不稳了？？大模型竞技场最新战报出炉，DeepSeek新版R1拿下网页编程第一，小胜Claude Opus 4。

6/17/2025 5:14:01 PM

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。然而再一次遭到网友质疑：怎么又不跟最新版Qwen和DeepSeek R1 0528对比？（此前该公司发布Ministral 3B/8B时，声称“始终优于同行”，却没有对比Qwen2.5）图片图片在该模型发布的前几个小时，Mistral AI的CEO Arthur Mensch在接受炉边访谈时声称即将发布的Magistral能够与其他所有竞争对手相抗衡。

6/11/2025 2:28:34 PM

多模态检索大升级！智源三大SOTA模型，代码、图文理解能力拉满

检索增强技术在代码及多模态场景中的发挥着重要作用，而向量模型是检索增强体系中的重要组成部分。针对这一需求，近日，智源研究院联合多所高校研发了三款向量模型，包括代码向量模型BGE-Code-v1，多模态向量模型BGE-VL-v1.5以及视觉化文档向量模型BGE-VL-Screenshot。这些模型取得了代码及多模态检索的最佳效果，并以较大优势登顶CoIR、Code-RAG、MMEB、MVRB等领域内主要测试基准。

5/20/2025 1:02:23 PM 新智元

图像编辑开源新SOTA，来自多模态卷王阶跃！大模型行业正步入「多模态时间」

全球AI大模型智能涌现，现在正在进入“多模态时间”。一方面，全球业内各式各样的技术进展，都围绕多模态如火如荼展开。另一方面，AI应用和落地的需求中，多模态也是最重要的能力。

4/28/2025 2:13:43 PM

多模态生成框架新SOTA：文本+空间+图像随意组合，20W+数据开源，复旦腾讯优图出品

能处理任意条件组合的新生成框架来了！复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine，一种基于DiT的多条件可控生成框架，能够处理包括但不限于文本提示、空间映射和主体图像在内的任意控制条件的任意组合，并保持高度的一致性和出色的和谐性。具体效果be like：图片据了解，现有的多条件可控生成框架或是只能处理单一种类的多个条件，或是只适用于某种特定的多类别组合，从而普遍缺乏通用性的多类别多条件的组合式生成能力。

4/17/2025 2:55:00 AM

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

扩散生成模型通常需要50-100次迭代去噪步骤，效率很低，时间步蒸馏技术可以极大提高推理效率，「基于分布的蒸馏」方法，如生成对抗网络GAN及其变分分数蒸馏VSD变体，以及「基于轨迹的蒸馏方法」（如直接蒸馏、渐进蒸馏、一致性模型）可以实现10-100倍的图像生成加速效果。但仍然存在一些关键难点，比如基于GAN的方法由于对抗动态的振荡特性和模式坍塌问题，训练过程不稳定；基于VSD的方法需要联合训练一个额外的扩散模型，增加了计算开销；一致性模型虽然稳定，但在极少数步骤（例如少于4步）的情况下，生成质量会下降。如何开发一个能够兼顾效率、灵活性和质量的蒸馏框架成了模型部署的关键。

4/1/2025 5:10:00 AM 新智元

耗时一年半！谷歌新定义具身通用最强SOTA，轰动硅谷！物理世界的原生推理能力、灵活性让人惊掉下巴！网友：亿些震撼！

出品 | 51CTO技术栈（微信号：blog51cto）想知道世界SOTA级别的模型用在物理世界中有多震撼吗？ Google DeepMind做了一件破天荒的事情。大模型自爆火以来，已经过去两年多，但在物理世界中真正能转化为机器人行为，还是一个世界级难题。

3/13/2025 1:37:14 PM 云昭

DiffUCD：扩散模型助力无监督高光谱变化检测，超越SOTA，逼近监督方法！

一眼概览DiffUCD 提出了一种创新的无监督高光谱影像变化检测（HSI-CD）方法，利用语义相关性扩散模型（SCDM）和跨时间对比学习（CTCL），在无需标注的情况下提高检测精度，在多个基准数据集上超越现有方法。核心问题高光谱影像变化检测（HSI-CD）旨在识别同一区域在不同时刻的地表变化。然而，受限于以下挑战：• 现有方法依赖大量标注数据，而高质量的人工标注成本高昂。

3/3/2025 5:00:00 AM 萍哥学AI

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉