理论
Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
著名 AI 研究者和博主 Sebastian Raschka 又双叒叕更新博客了。 这次的主题是《LLM 推理的强化学习现状》。 博客地址: AI 社区很热闹,尤其是 Llama 4 和 GPT-4.5 等新旗舰模型的发布。
4/22/2025 9:12:00 AM
机器之心
AI创造新物理学,暴力破解引力波!宇宙观测开挂50倍,三体人直呼内行
就在刚刚,AI又将物理学,推动到了全新的领域。 来自马克斯·普朗克光科学研究所(MPL)、加州理工等机构的科学家发现,AI已经设计出了人类尚未理解的引力波探测工具。 这一发现,直接将可观测的宇宙体积扩大了50倍!
4/22/2025 9:08:00 AM
新智元
UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
本文的作者来自伊利诺伊大学香槟分校(UIUC)、马萨诸塞大学(UMass)和谷歌。 本文的第一作者为 UIUC 博士生金博文,主要研究方向为与大语言模型相关的智能体、推理和强化学习研究。 其余学生作者为 UMass 博士生曾翰偲和 UIUC 博士生岳真锐。
4/22/2025 9:06:00 AM
机器之心
更懂公务员的大模型:写作/意图理解/公文排版全拿捏,部署成本直降90%,来自金山
当政务大模型具备推理能力,部署成本直降90%,写作效率提升71.58%、意图理解提升34.87%、公文排版能力提升12%。 如上新进展,来自金山办公。 时隔四个月,金山自研政务大模型完成推理能力升级。
4/22/2025 9:05:36 AM
量子位
采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解
先让模型生成多个候选答案,再通过自我验证挑出「真金」。 基于采样的搜索在许多推理任务中表现优异,可关于它的扩展趋势,还有许多未解之谜。 随着采样数量的增加,模型的推理性能能否继续提升?
4/22/2025 8:50:00 AM
新智元
谷歌新型 AI 系统在复杂诊断中表现超越医生
译者 | 刘汪洋审校 | 重楼最近,《自然》杂志上的一篇新论文引发了关注。 它展示了谷歌如何用 AI 改变医疗的未来:通过自动化技术降低成本、减轻医生负担,使他们能够将更多精力投入到复杂病例的处理中。 当你带着疑难杂症就医时,自然希望得到准确的诊断。
4/22/2025 8:13:39 AM
刘汪洋
AI模型蒸馏:大语言模型的“瘦身革命”
译者 | 朱先忠审校 | 重楼简介模型蒸馏是一种机器学习新技术,其基本思想是让较小的模型(学生)模仿较大的模型(老师)的行为。 当前,已经存在几种方法可以实现这一技术(将在下文中展开具体介绍),但其目标都是在学生模型中获得比从头开始训练更好的泛化能力。 模型蒸馏示例:学生(较小)模型使用蒸馏损失函数从教师模型中学习,该函数使用“软标签”和预测(使用OpenAI GPT4o生成的图表)一、为什么模型蒸馏很重要?
4/22/2025 8:08:37 AM
朱先忠
万字拆解!最新多模态 RAG 技术全景解析!
来自华为云的最新多模态RAG综述,非常全面,对多模态RAG感兴趣的朋友强烈推荐! 复制1、引言传统的RAG系统主要依赖于文本数据,通过检索与查询语义相似的相关文档片段,并将其与查询结合,形成增强的输入,供LLMs生成回答。 这种方法使得LLMs能够在推理阶段动态整合最新信息,从而提高回答的准确性和可靠性。
4/22/2025 7:00:00 AM
Goldma
2025年全球GenAI手机出货量有望突破4亿部,渗透率约占三分之一
根据Counterpoint的最新预测,2025年全球智能手机市场将迎来一个重要的里程碑:三分之一的智能手机出货量将支持生成式人工智能(GenAI),预计全年出货量将超过4亿部。 这一趋势标志着智能手机行业在人工智能技术集成方面的快速进步,也预示着GenAI将成为未来智能手机的核心功能之一。 d3001.pngGenAI集成加速,技术与市场需求推动变革从2024年到2025年,全球智能手机支持GenAI的比例显著提升。
4/22/2025 6:58:02 AM
AI和现代工作空间推动全球视频会议设备市场增长
AI已成为推动市场发展的关键加速器,消除了以往阻碍视频广泛采用的许多障碍。 AI驱动的创新——从自动会议记录、实时翻译到智能摄像头取景和噪声抑制——正在彻底改变视频会议体验,使其更加无缝、引人入胜、个性化和高效。 市场正见证着前所未有的创新浪潮,其中AI和数据驱动的见解处于前沿地位。
4/22/2025 6:54:40 AM
D1net编译
被LangChain4j坑惨了!
最近在深度体验和使用 Spring AI 和 LangChain4j,从开始的满怀期待五五开,但最后极具痛苦的使用 LangChain4j,让我真正体验到了正规军和草台班子的区别。 Spring AI VS LangChain4jSpring AI:使用简单、写法优雅、但功能提供的较少、成熟度稍高;LangChain4j:作为移植大模型著名框架 LangChain 功能稍多、灵活度高、使用复杂、满是 BUG。 还有根本找不到关键内容的官方文档,该有的重要内容是一点都不介绍啊,使用和学习成本很高。
4/22/2025 3:00:00 AM
磊哥
微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当
微软以小搏大,发布首个开源2B参数规模“原生1bit”LLM——BitNet b1.58 2B4T,单CPU就能跑,性能与同规模全精度开源模型相当。 它采用三进制{-1, 0, 1}存储权重,相较于传统的16位浮点数可大幅降低显存需求。 只需0.4GB内存即可运行。
4/21/2025 6:43:31 PM
量子位
被Cursor多次拒绝,OpenAI怒买Windsurf,很不划算!多少有点慌不择食
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)经历了OpenAI的o3和谷歌的Gemini 2.5 Flash发布之后,AI圈的注意力再一次给到了编程赛道。 最近一个争议比较大的新闻,要属“OpenAI收购Cursor不成,反过来要收购AI编程初创里的老二Windsurf”。 30亿美元,特别是对于一家仅仅成立2年,且目前品牌运营时间仅约5个月的创业公司来说,可以说是非常体面和梦寐以求的退出额度。
4/21/2025 5:18:15 PM
云昭
AI工具的广泛使用标志着恶意机器人活动的新时代
据Thales称,易于获取的AI工具的增多显著降低了网络攻击者的入门门槛,使他们能够大规模创建和部署恶意机器人。 十年来,自动化机器人流量首次超过人类产生的流量,在2024年构成所有网络流量的51%,这一转变在很大程度上归因于AI和大型语言模型(LLM)的兴起,它们简化了用于恶意目的的机器人的创建和扩展。 随着AI工具变得越来越容易获取,网络犯罪分子越来越多地利用这些技术来创建和部署恶意机器人,这些机器人现在占所有互联网流量的37%,较2023年的32%有显著增长,这是恶意机器人活动连续第六年增长,给致力于保护其数字资产的企业带来了安全挑战。
4/21/2025 4:39:09 PM
o3被曝「无视」前成果?华人博士生实名指控,谢赛宁等大牛激烈争辩
在视觉感知方面,o3和o4-mini在思维链中进行图像推理, 代表了一个重要突破。 华盛顿大学计算机科学博士生施惟佳站出来表示,o3和o4-mini可能用到了她之前的研究Visual Sketchpad 。 论文链接:,曾提出通过可视化辅助增强模型推理。
4/21/2025 4:32:29 PM
新智元
最新研究给AI医生泼冷水:诊断准确率仅为52.1%,与非专家医生相当
在人工智能(AI)技术飞速发展的当下,AI在医疗领域的应用一直备受关注。 然而,一项最新的研究结果却给AI医生的前景泼了一盆冷水。 据报道,大阪都会大学医学研究生院的研究团队深入评估了生成式AI在诊断医疗状况方面的表现,并将其与医生进行了对比,发现结果不那么如人意。
4/21/2025 4:28:16 PM
选AI比选对象还难!起名黑洞OpenAI的新模型,到底怎么选?
如果你最近关注AI新闻,可能会被各种层出不穷的新模型搞的眼花缭乱。 尤其是堪称「起名黑洞」的OpenAI,命起名来可谓是是毫无章法。 即便是AI圈的资深团队,在面对同时发布的o3、o4-mini、GPT-4.1、GPT-4.1 mini和GPT-4.1 nano时,也是蒙圈的。
4/21/2025 4:27:18 PM
新智元
o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因
OpenAI新模型发布后,大家体感都幻觉更多了。 甚至有人测试后发出预警:使用它辅助编程会很危险。 图片具体来说,它经常捏造从未运行过的代码返回结果,在被质问时找理由狡辩,甚至还会说是用户的错。
4/21/2025 4:25:58 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
AI新词
智能体
Gemini
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型