模型

3D高斯泼溅，可输入视图量高达500！推理速度提升3倍，内存少80%

在增强现实（AR）和虚拟现实（VR）等前沿应用领域，新视角合成（Novel View Synthesis, NVS）正扮演着越来越关键的角色。近年来，3D高斯泼溅（3D Gaussian Splatting, 3DGS）技术横空出世，凭借其革命性的实时渲染能力和卓越的视觉质量，迅速成为NVS领域的一大突破。然而，传统3DGS对耗时的「逐场景优化」的依赖，严重限制了其在实际应用中的部署。

6/18/2025 8:54:48 AM

首个全面梳理语音大模型发展脉络的权威综述，入选ACL 2025主会

本文第一作者：崔文谦，香港中文大学博士生，致力于语音大模型，多模态大模型，AI音乐生成等方向的研究。由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收！这是该领域首个全面系统的综述，为语音 AI 的未来发展指明了方向。

6/18/2025 8:53:00 AM

逐个token太慢！大模型原生并行出token，CMU、英伟达新作Multiverse

众所周知，大语言模型的参数量越来越大，算力需求也越来越可怕，然而因为「祖宗之法」，推理只能一个一个 token 按顺序来。对此，卡耐基梅隆大学（CMU）Infini-Al-Lab 的研究人员拿出了「多元宇宙」Multiverse，这是一个全新的生成式建模框架，支持原生的并行生成。参与这项研究的机器学习大佬，CMU 助理教授陈天奇表示，这是一个有前途的大方向。

6/18/2025 8:51:28 AM

大模型“拼好题”，45K数据撬动18%提升，数学问题拒绝死记硬背 | MathFusion

当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换，好比是让学生反复做同一道题的变种，却忽略了数学题目之间内在的关联性。为了打破这种局限，让大模型学会“串联”与“并联”知识，上海AI Lab、人大高瓴等团队联合提出了MathFusion，通过指令融合增强大语言模型解决数学问题的能力。仅使用45K的合成指令，MathFusion在多个基准测试中平均准确率提升了18.0个百分点，展现了卓越的数据效率和性能。

6/18/2025 8:51:00 AM

形式化证明迈向多模态，MLLM正确率仅4%！港科大等推出全新基准

近年来，自动定理证明（ATP）取得了显著进展，但大部分工作都集中在处理纯文本形式的定理。然而，在现实世界中，尤其是在几何学领域，许多定理的呈现和理解都离不开图像、图表等视觉元素。人类数学家善于从这些图表中获取直觉，并将其作为引导严谨证明过程的关键。

6/18/2025 8:49:00 AM

不用千亿参数也能合成高质量数据！这个开源框架让小模型“组团逆袭”，7B性能直追72B

无需蒸馏任何大规模语言模型，小模型也能自给自足、联合提升？上海人工智能实验室联合中国人民大学提出的GRA框架（Generator–Reviewer–Adjudicator）正是这样一种新范式：该方法以“多人协作”、“角色分工”的理念为核心，系统性探索了多开源小模型如何通过协同机制生成高质量训练数据。实验结果显示，在涵盖数学、代码、逻辑推理、通识问答等10个主流数据集上，GRA生成的数据质量与单个大型语言模型（如Qwen-2.5-72B-Instruct）输出相当或更高，并在多数任务中取得了显著领先。

6/18/2025 8:47:00 AM

MiniMax Agent的能力，彻底震撼了我

我最近试用了一款叫MiniMax Agent的产品，说实话，体验完之后整个人都不好了。图片你想想，以前我们做个网站，得先构思、找素材、写代码、调UI，光是找合适的图片就要花半天时间。现在这玩意儿，你只要说一句话，它就能帮你搞定一切。

6/18/2025 2:01:00 AM 阿丸笔记

同一天开源新模型，一推理一编程，MiniMax和月之暗面开卷了

同一天，国内大模型厂商扎堆发起了新模型。 AI「六小龙」中的 MiniMax 和月之暗面各自公布了开源新成果。其中，MiniMax 启动了「MiniMax Week」，并在第一天开源了其最新的长上下文推理 LLM——MiniMax-M1。

6/17/2025 3:24:48 PM

刚刚，LMArena最新模型榜单出炉！DeepSeek-R1网页编程能力赶超了Claude Opus 4

在开源模型领域，DeepSeek 又带来了惊喜。上个月 28 号，DeepSeek 来了波小更新，其 R1 推理模型升级到了最新版本（0528），并公开了模型及权重。这一次，R1-0528 进一步改进了基准测试性能，提升了前端功能，减少了幻觉，支持 JSON 输出和函数调用。

6/17/2025 9:09:00 AM

Kimi新模型拿下代码开源SOTA，仅仅72B，发布即开源

深夜，沉寂已久的Kimi突然发布了新模型——开源代码模型Kimi-Dev，在SWE-bench Verified上以60.4%的成绩取得开源SOTA。参数量只有72B，但编程水平比最新的DeepSeek-R1还强，和闭源模型比较也表现优异。有网友看到后表示，感觉月之暗面的实力被低估了，其水平应该比xAI强。

6/17/2025 9:07:24 AM

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

当前，Agentic RAG（Retrieval-Augmented Generation）正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中，搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面，部分方法优化的目标与真实下游需求存在偏离，另一方面，搜索器与生成器间的耦合也影响了泛化与部署效率。

6/17/2025 9:04:33 AM

2天完成人类12年工作，AI自动更新文献综述，准确率碾压人类近15%

当碳基生物还在为写文献综述，打开了一百个浏览器窗口时，隔壁AI已经卷起来了。（doge）两天完成人类12年工作——医学研究领域中，系统评价（SRs）作为临床决策的黄金标准，平均耗时超过16个月，花费10万美元以上，且容易延长无效或有害治疗方法的使用。于是多伦多大学、哈佛医学院等机构联合开发了AI端到端工作流程——otto-SR。

6/17/2025 9:00:00 AM

MIT工科生跨界AI，独作论文登Nature：只需3.5小时修复600年前名画

MIT理工男跨界艺术，一不小心就以一篇独作论文登上Nature？由他设计的AI算法，将原本需要数月/数年才能搞定的名画修复工作，极限压缩至几小时。 Alex Kachkine，打破画作修复只能对原作数字扫描品进行“缝缝补补”的传统艺能，提出一种“以数字方式修复一幅画，并在物理上实现效果”的全新方法。

6/17/2025 8:50:00 AM

4B Qwen3逆袭671B DeepSeek！字节DAPO微调方法这么猛的吗

6/17/2025 8:45:00 AM

ACL 2025｜为什么你设计的 Prompt 会成功？新理论揭示大模型 Prompt 设计的奥秘与效能

本文共同一作是张翔和曹峻泰。张翔是英属哥伦比亚大学研究生，主要研究兴趣集中在大模型推理和 AI for Science；曹峻泰是英属哥伦比亚大学研究生，主要研究兴趣集中在大模型推理和可解释性研究；本文通讯作者是来自纽约大学石溪分校的助理教授尤晨羽，以及来自 Meta Gen AI 的研究员丁渡鉴。近年来，大型语言模型（LLM）在自然语言处理领域取得了革命性进展。

6/16/2025 2:44:14 PM

Muon作者仅用一篇博客，就被OpenAI看中了

「许多博士（包括过去的我）都陷入了这样一个误区：认为只有在顶级会议上发表论文才是终极目标。」AI 云服务商 Hyperbolic CEO Yuchen Jin 如是说。但现在，发表论文并不与学术影响力直接画等号了。

6/16/2025 2:43:38 PM

10% KV Cache实现无损数学推理！这个开源方法解决推理大模型「记忆过载」难题

推理大模型虽好，但一个简单的算数问题能推理整整三页，还都是重复的“废话”，找不到重点……一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法，出现了！ R-KV开源登场：显存↓90%、吞吐×6.6、准确率=100%。它可以通过实时对token进行排序，兼顾重要性和非冗余性，仅保留信息丰富且多样化的token，从而解决大模型推理时的冗余问题。

6/16/2025 2:41:07 PM

网页智能体新突破！引入协同进化世界模型，腾讯AI Lab提出新框架

让网页智能体自演进突破性能天花板！腾讯AI Lab提出WebEvolver框架，通过引入协同进化的世界模型（World Model），让智能体在真实网页环境中实现10%的性能提升。由此突破现有基于大语言模型（LLM）的网页智能体“自我迭代演进的性能最终会停滞”的瓶颈。

6/16/2025 2:40:40 PM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 GGUF 是什么？一文看懂大模型里最火的模型格式最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉