理论

Sebastian Raschka长文：DeepSeek-R1、o3背后，RL推理训练正悄悄突破上限

著名 AI 研究者和博主 Sebastian Raschka 又双叒叕更新博客了。这次的主题是《LLM 推理的强化学习现状》。博客地址： AI 社区很热闹，尤其是 Llama 4 和 GPT-4.5 等新旗舰模型的发布。

4/22/2025 9:12:00 AM

机器之心

AI创造新物理学，暴力破解引力波！宇宙观测开挂50倍，三体人直呼内行

就在刚刚，AI又将物理学，推动到了全新的领域。来自马克斯·普朗克光科学研究所（MPL）、加州理工等机构的科学家发现，AI已经设计出了人类尚未理解的引力波探测工具。这一发现，直接将可观测的宇宙体积扩大了50倍！

4/22/2025 9:08:00 AM

新智元

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

本文的作者来自伊利诺伊大学香槟分校（UIUC）、马萨诸塞大学（UMass）和谷歌。本文的第一作者为 UIUC 博士生金博文，主要研究方向为与大语言模型相关的智能体、推理和强化学习研究。其余学生作者为 UMass 博士生曾翰偲和 UIUC 博士生岳真锐。

4/22/2025 9:06:00 AM

机器之心

更懂公务员的大模型：写作/意图理解/公文排版全拿捏，部署成本直降90%，来自金山

当政务大模型具备推理能力，部署成本直降90%，写作效率提升71.58%、意图理解提升34.87%、公文排版能力提升12%。如上新进展，来自金山办公。时隔四个月，金山自研政务大模型完成推理能力升级。

4/22/2025 9:05:36 AM

量子位

采样越多越聪明？隐式扩展颠覆认知，采样搜索如何挑出完美解

先让模型生成多个候选答案，再通过自我验证挑出「真金」。基于采样的搜索在许多推理任务中表现优异，可关于它的扩展趋势，还有许多未解之谜。随着采样数量的增加，模型的推理性能能否继续提升？

4/22/2025 8:50:00 AM

新智元

谷歌新型 AI 系统在复杂诊断中表现超越医生

译者 | 刘汪洋审校 | 重楼最近，《自然》杂志上的一篇新论文引发了关注。它展示了谷歌如何用 AI 改变医疗的未来：通过自动化技术降低成本、减轻医生负担，使他们能够将更多精力投入到复杂病例的处理中。当你带着疑难杂症就医时，自然希望得到准确的诊断。

4/22/2025 8:13:39 AM

刘汪洋

译者 | 朱先忠审校 | 重楼简介模型蒸馏是一种机器学习新技术，其基本思想是让较小的模型（学生）模仿较大的模型（老师）的行为。当前，已经存在几种方法可以实现这一技术（将在下文中展开具体介绍），但其目标都是在学生模型中获得比从头开始训练更好的泛化能力。模型蒸馏示例：学生（较小）模型使用蒸馏损失函数从教师模型中学习，该函数使用“软标签”和预测（使用OpenAI GPT4o生成的图表）一、为什么模型蒸馏很重要？

4/22/2025 8:08:37 AM

朱先忠

万字拆解！最新多模态 RAG 技术全景解析！

来自华为云的最新多模态RAG综述，非常全面，对多模态RAG感兴趣的朋友强烈推荐！复制1、引言传统的RAG系统主要依赖于文本数据，通过检索与查询语义相似的相关文档片段，并将其与查询结合，形成增强的输入，供LLMs生成回答。这种方法使得LLMs能够在推理阶段动态整合最新信息，从而提高回答的准确性和可靠性。

4/22/2025 7:00:00 AM

Goldma

2025年全球GenAI手机出货量有望突破4亿部，渗透率约占三分之一

根据Counterpoint的最新预测，2025年全球智能手机市场将迎来一个重要的里程碑：三分之一的智能手机出货量将支持生成式人工智能（GenAI），预计全年出货量将超过4亿部。这一趋势标志着智能手机行业在人工智能技术集成方面的快速进步，也预示着GenAI将成为未来智能手机的核心功能之一。 d3001.pngGenAI集成加速，技术与市场需求推动变革从2024年到2025年，全球智能手机支持GenAI的比例显著提升。

4/22/2025 6:58:02 AM

AI和现代工作空间推动全球视频会议设备市场增长

AI已成为推动市场发展的关键加速器，消除了以往阻碍视频广泛采用的许多障碍。 AI驱动的创新——从自动会议记录、实时翻译到智能摄像头取景和噪声抑制——正在彻底改变视频会议体验，使其更加无缝、引人入胜、个性化和高效。市场正见证着前所未有的创新浪潮，其中AI和数据驱动的见解处于前沿地位。

4/22/2025 6:54:40 AM

D1net编译

被LangChain4j坑惨了！

最近在深度体验和使用 Spring AI 和 LangChain4j，从开始的满怀期待五五开，但最后极具痛苦的使用 LangChain4j，让我真正体验到了正规军和草台班子的区别。 Spring AI VS LangChain4jSpring AI：使用简单、写法优雅、但功能提供的较少、成熟度稍高；LangChain4j：作为移植大模型著名框架 LangChain 功能稍多、灵活度高、使用复杂、满是 BUG。还有根本找不到关键内容的官方文档，该有的重要内容是一点都不介绍啊，使用和学习成本很高。

4/22/2025 3:00:00 AM

磊哥

微软开源“原生1bit”三进制LLM：2B参数，0.4GB内存/单CPU就能跑，性能与同规模全精度开源模型相当

微软以小搏大，发布首个开源2B参数规模“原生1bit”LLM——BitNet b1.58 2B4T，单CPU就能跑，性能与同规模全精度开源模型相当。它采用三进制{-1, 0, 1}存储权重，相较于传统的16位浮点数可大幅降低显存需求。只需0.4GB内存即可运行。

4/21/2025 6:43:31 PM

量子位

被Cursor多次拒绝，OpenAI怒买Windsurf，很不划算！多少有点慌不择食

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）经历了OpenAI的o3和谷歌的Gemini 2.5 Flash发布之后，AI圈的注意力再一次给到了编程赛道。最近一个争议比较大的新闻，要属“OpenAI收购Cursor不成，反过来要收购AI编程初创里的老二Windsurf”。 30亿美元，特别是对于一家仅仅成立2年，且目前品牌运营时间仅约5个月的创业公司来说，可以说是非常体面和梦寐以求的退出额度。

4/21/2025 5:18:15 PM

云昭

AI工具的广泛使用标志着恶意机器人活动的新时代

据Thales称，易于获取的AI工具的增多显著降低了网络攻击者的入门门槛，使他们能够大规模创建和部署恶意机器人。十年来，自动化机器人流量首次超过人类产生的流量，在2024年构成所有网络流量的51%，这一转变在很大程度上归因于AI和大型语言模型(LLM)的兴起，它们简化了用于恶意目的的机器人的创建和扩展。随着AI工具变得越来越容易获取，网络犯罪分子越来越多地利用这些技术来创建和部署恶意机器人，这些机器人现在占所有互联网流量的37%，较2023年的32%有显著增长，这是恶意机器人活动连续第六年增长，给致力于保护其数字资产的企业带来了安全挑战。

4/21/2025 4:39:09 PM