AI在线 AI在线

算法

强化学习也遇到了“天花板”?Andrej Karpathy构建了一个新算法

强化学习也遇到了“天花板”?Andrej Karpathy构建了一个新算法

RL还行不行? 表面上很风光,但真实情况怎样呢? 大神Karpathy提出了一种超越当前RL范式、更接近人类学习机制的新思路强化学习的强大与局限Karpathy首先肯定了强化学习的巨大价值。
7/14/2025 9:26:45 AM
AB实验新突破:携程提出图贪心分流算法,解决两大核心难题

AB实验新突破:携程提出图贪心分流算法,解决两大核心难题

作者简介小白,携程算法工程师,关注营销定价领域。 携程火车票部门为解决智行酒店商户侧AB实验中,预实验分流中遇到的分流不均、分流组流量交叉问题,提出了一种用于非用户端AB实验的分流算法,该算法通过优化的随机抽样模块与贪心交换模块,保证实验组之间多指标的相似性;通过图算法模块,降低实验组之间的流量交叉。 通过实证分析,该算法一方面有效的提升了商户端实验在多指标下的分流效率;另一方面,相比于使用先验知识进行分流,显著降低了实验组之间的流量交叉。
7/11/2025 9:16:00 AM
史上最惨AI店长!被顾客耍到破产,「人格觉醒」却忘了自己是代码

史上最惨AI店长!被顾客耍到破产,「人格觉醒」却忘了自己是代码

AI当店长,靠谱吗? 想象一下:给一个AI完全控制一家小店的权力,不只是收银——而是一整个运营和管理。 定价、库存、客服、供应商谈判、包括和顾客讨价还价,所有这些工作都由它亲自完成。
6/30/2025 9:01:00 AM
只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题

只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题

只训练数学,却在物理化学生物战胜o1! 强化学习提升模型推理能力再添例证。 来自上海创智学院、上海AI Lab的MM-Eureka系列工作提出了新的强化学习算法CPGD(Clipped Policy Gradient Optimization with Policy Drift)——相比于传统GRPO、RLOO等算法显著缓解了训练不稳定(甚至崩溃)的问题,并带来显著性能提升。
6/24/2025 8:45:00 AM
英伟达完成从游戏芯片商到AI巨头的战略转型

英伟达完成从游戏芯片商到AI巨头的战略转型

全球半导体巨头英伟达(NVIDIA)近日宣布在波士顿设立量子研究中心,标志着这家以游戏显卡起家的公司已完成向人工智能领导者的战略转型。 据公开资料显示,英伟达目前市值已突破万亿美元,成为推动AI技术发展的核心力量。 从游戏硬件到AI芯片的跨越英伟达成立于1993年,最初专注于为游戏行业提供图形处理器(GPU)。
6/23/2025 4:00:38 PM AI在线
亚马逊CEO全员信曝光,硅谷AI裁员潮已至!年薪50万湾区HR被算法淘汰

亚马逊CEO全员信曝光,硅谷AI裁员潮已至!年薪50万湾区HR被算法淘汰

别不信,AI真来抢你的工作了! 就在刚刚,亚马逊CEO给员工发出全员信。 他明确表示,在未来几年内,由于AI带来的效率提升,公司员工数量必将减少。
6/19/2025 9:12:00 AM
微软分享三大王炸算法:突破大模型推理瓶颈,性能大涨

微软分享三大王炸算法:突破大模型推理瓶颈,性能大涨

今天凌晨,微软在官网分享了自研的三大创新算法,以帮助大模型增强其推理能力。 无论你是小参数或者是大参数模型玩家,都能从rStar-Math、LIPS 、CPL这三大算法获益,突破推理瓶颈,极大增强模型的数学推理和思考链的能力。 rStar-MathrStar-Math算法主要通过蒙特卡洛树搜索(MCTS)实现深度思考。
6/18/2025 9:06:00 AM
腾讯举办算法大赛,百万奖金邀全球技术人才

腾讯举办算法大赛,百万奖金邀全球技术人才

腾讯启动算法大赛,提供百万奖金和直通offer,挑战全模态序列生成式推荐技术。大赛报名截止7月31日,面向全球高校学子。#腾讯算法大赛# #AI技术#
6/16/2025 11:51:17 AM 远洋
做AI方向的设计,先了解这8个基础技术要点!

做AI方向的设计,先了解这8个基础技术要点!

AI 除了作为工具增进我们的设计效率和质量外,也成为了许多产品设计增强自己竞争力,许多新解决方案应运而生的一种机会。 作为设计师,我们也需要根据自己负责的产品范围了解一些基础的技术点,才能更好的设计出能够被用户理解的好产品,所以我会分享一些 AI 产品中常见的技术知识点。 更多基础干货:.
6/10/2025 12:19:30 AM 林影落
谷歌 DeepMind 负责人:AI 变革邮箱管理、对抗内容算法推荐,通用人工智能未来 5~10 年实现

谷歌 DeepMind 负责人:AI 变革邮箱管理、对抗内容算法推荐,通用人工智能未来 5~10 年实现

在 SXSW 伦敦站活动中,谷歌 DeepMind 首席执行官戴密斯・哈萨比斯(Demis Hassabis)表示,人工智能(AI)在迅猛发展下,其引发的巨大变革,不亚于互联网诞生或工业革命。
6/4/2025 8:48:37 AM 故渊
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型,如今堪称AI界的「吞金巨兽」。 从写诗到解题,从对话到编程,它们几乎无所不能,但动辄千亿甚至万亿参数的规模,让部署成本高得离谱。 以FP16精度部署的DeepSeek-R1 671B为例,推理时大概需要1342GB的显存,如果是32GB 5090显卡,需要整整42张!
5/26/2025 9:41:26 AM
50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间

50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间

相信大家都曾有过这样的经历:运行某个程序时,电脑突然卡住,轻则恢复文件,重则重新创建;或者手机频繁弹出「内存不足」的警告,让我们不得不忍痛删除珍贵的照片或应用。 这些日常的烦恼,其实都指向了计算世界中两个至关重要的基本要素:时间和空间。  时间和空间(也称为内存)是计算中最基本的两种资源:任何算法在执行时都需要一定的时间,并在运行过程中占用一定的空间以存储数据。
5/26/2025 9:09:00 AM 机器之心
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

随着 DeepSeek R1 的持续爆火,推理和强化学习已经成为 AI 领域的热门词汇。 短短几个月的时间,我们已经见证了太多的推理大模型,AI 更新迭代速度似乎已经快进到了以天为单位。 但在众多研究成果中找到值得关注的内容并不容易。
5/26/2025 8:48:00 AM
2030年前必须实现AGI!谷歌祖师爷现场「催更」DeepMind CEO

2030年前必须实现AGI!谷歌祖师爷现场「催更」DeepMind CEO

谷歌的I/O大会证明蓝星的科技正统还在谷歌。 除了发布Gemini 2.5最新版本继续遥遥领先OpenAI的奥特曼以外,还掏出两幅眼镜来拳打苹果,脚踢Meta。 会后还把谷歌的「开山老祖」谢尔盖·布林(Sergey Brin)请了出来,逼Demis Hassabis赶紧在2030年前(也就5年内了)实现AGI。
5/23/2025 9:08:00 AM
手机流畅处理128K长文本,vivo端侧新算法突破内存限制 | ACL 2025

手机流畅处理128K长文本,vivo端侧新算法突破内存限制 | ACL 2025

在端侧设备上处理长文本常常面临计算和内存瓶颈。 vivo AI研究院推出的EdgeInfinite算法专为端侧设备设计,让设备处理超长文本时更加高效流畅,该方法能够在不到10GB GPU内存的设备上处理长达128K tokens的输入。 该研究成果已中稿ACL 2025。
5/20/2025 3:14:39 PM
震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

就在刚刚,有人用Claude写代码证实——谷歌DeepMind的AlphaEvolve求解矩阵乘法的突破,100%正确! 即使已经过去好几天,AI圈依然有许多人沉浸在这个AI的余震中。 在时隔半个世纪(56年)后,AlphaEvolve将4×4的复数矩阵计算次数,从1969年Strassen的49次减少到了48次。
5/20/2025 9:07:00 AM
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

天下苦大模型矩阵乘法久矣。 毕竟不论是训练还是推理过程,矩阵乘法作为最主要的计算操作之一,往往都需要消耗大量的算力。 那么就没有一种更“快、好、省”的方法来搞这事儿吗?
5/19/2025 9:05:00 AM
微软老员工48岁生日被裁,妻子发帖怒斥算法裁人!全球大血洗6000人

微软老员工48岁生日被裁,妻子发帖怒斥算法裁人!全球大血洗6000人

微软6000人血色大裁员,余波还在震荡。 从消息曝出到今天,三天内,这6000个人已经从单纯的数字,浮现成了一个个有血有肉的人物故事,不断冲击着我们的神经。 一位妻子沉痛地发帖说:我的丈夫,一位25年的微软老员工,因为被算法选中,在48岁当天被裁掉了。
5/16/2025 3:46:10 PM