算法

谷歌AlphaEvolve发布！Gemini自进化AI破解数学难题，优化芯片与数据中心，训练速度飙升32.5%！

谷歌DeepMind发布了一项颠覆性研究成果——AlphaEvolve，一款结合Gemini大语言模型与进化算法的AI编码代理。这款系统不仅能自动发现和优化复杂算法，还在谷歌的数据中心、芯片设计和AI训练中展现了惊人实力，甚至助力Gemini模型自我优化，堪称AI领域的“左脚踩右脚”式突破。 AIbase深入剖析这一技术里程碑，揭示其核心原理与广泛影响。

5/15/2025 2:00:45 PM AI在线

谷歌 DeepMind 推出 AlphaEvolve:AI 首次打破数学56年纪录，优化自身训练系统

谷歌 DeepMind 今日发布 AlphaEvolve，一款具备自我进化能力的人工智能代理，它不仅能自主发明复杂的计算机算法，还已广泛应用于谷歌的数据中心、芯片设计和 AI 模型训练中，取得了显著成果。 AlphaEvolve 将 Gemini 大语言模型与进化式优化方法结合，自动测试、改进并提升整个代码库，而不仅限于单一函数。该系统已在内部悄然运行一年多，提升了计算资源调度效率、加速了模型训练，并在数学研究上实现了突破。

5/15/2025 11:01:54 AM AI在线

重磅！谷歌DeepMind发布AlphaEvolve：AI界的“算法设计进化大师”诞生

谷歌DeepMind刚刚又往前拱了一大步，宣布推出 AlphaEvolve智能体，目标直指更上游，用于通用算法的设计发现和优化简单说，AlphaEvolve就像个AI界的“算法育种大师”。它把自家Gemini大模型（Gemini Flash负责广撒网，洞察力强的Gemini Pro负责深挖）和一套“自动化考官”（负责验证算法靠不靠谱、效率高不高）结合起来，再套上一个“进化论”的框架，让好算法能一代更比一代强AlphaEvolve工作流程：工程师设定框架，AI通过“提示采样器”给LLM喂招，LLM出新招（程序），“考官”打分，好招进“兵器谱”，并用来启发下一轮出招。去年DeepMind就秀过肌肉，证明LLM能生成代码函数来搞定科学问题。

5/15/2025 9:17:00 AM

破解300年数学难题，智能体大突破！谷歌发布超强AI Agent

今天凌晨，谷歌Deepmind在官网发布了，用于设计高级算法的编程AI Agent——AlphaEvolve。 AlphaEvolve与谷歌的大模型Gemini实现深度集成，用于自动评估通用算法的发现与优化，可以帮助开发人员快速设计出最好、高效的矩阵算法。简单来说，大模型擅长生成各种想法和算法，但是没人知道这些到底行不行，而AlphaEvolve相当于“质检员”，能够按照特定标准来衡量这些想法是否可行。

5/15/2025 9:08:00 AM

RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用，在训练阶段可以提供稳定的 reward，评估阶段可以选择更好的 sample 结果，甚至单独作为 evaluator。尽管近期强化学习（RL）在传统视觉任务和多模态推理任务中取得了显著进展，但其在奖励建模中的应用仍然受到挑战，尤其是如何通过强化学习对奖励模型引入长期推理能力。来自快手、中科院、清华、南大的研究团队发现，直接把现有的 RL 算法（比如 Reinforce ）用到训练 MRM 上，会遇到很多问题，比如训练过程很不稳定，甚至直接崩掉。

5/12/2025 2:23:42 PM

OpenAI 姚顺雨：“算法为王”终结，欢迎来到“产品思维”时代

回顾过去几十年，AI的发展几乎就是一部“顶级模型与新方法”迭代史。从DeepBlue击败象棋世界冠军、AlphaGo征服围棋、GPT-4刷爆各类考试榜单，到o1、R1等新一代模型横扫数学、编程、写作、操作等任务，每一次历史性突破的背后，都是训练方法、模型架构的根本性创新。这时候的游戏规则很简单：谁能发明更强的训练方法、模型架构，就能称霸榜单；谁能在ImageNet、GLUE、MMLU等benchmark上显著提升，就能写进教材、赢得引用。

5/6/2025 12:00:55 AM

ICLR 2025 | 无需训练加速20倍，清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

论文有两位共同一作。郑凯文为清华大学计算机系三年级博士生，何冠德为德州大学奥斯汀分校（UT Austin）一年级博士生。扩散模型（Diffusion Models）近年来在生成任务上取得了突破性的进展，不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现，推动了文本到图像、视频生成的技术革新。

4/28/2025 9:00:00 AM 机器之心

告别“AI失忆症”！新型SD-LoRA算法实现终身学习｜ICLR 2025

彻底摆脱传统方法对旧数据存储的依赖！哈佛团队联手香港城大、西安交大最新发布的SD-LoRA技术，通过固定已学习任务的方向参数，仅调整幅度权重，完全避免了历史数据的存储需求。能够在减少50%以上参数存储的同时保持最高准确率，并且在不增加推理开销的前提下显著缓解了灾难性遗忘问题。

4/24/2025 9:30:00 AM 量子位

3D高斯泼溅算法大漏洞：数据投毒让GPU显存暴涨70GB，甚至服务器宕机

随着3D Gaussian Splatting（3DGS）成为新一代高效三维建模技术，它的自适应特性却悄然埋下了安全隐患。在本篇 ICLR 2025 Spotlight 论文中，研究者们提出首个专门针对3DGS的攻击方法——Poison-Splat，通过对输入图像加入扰动，即可显著拖慢训练速度、暴涨显存占用，甚至导致系统宕机。这一攻击不仅隐蔽、可迁移，还在现实平台中具备可行性，揭示了当前主流3D重建系统中一个未被重视的安全盲区。

4/23/2025 8:50:00 AM 量子位

半马变翻车现场！宇树科技最新回应：G1开跑即摔倒系未使用原生算法！天工换三次电池夺冠——但也非独立智能！

出品 | 51CTO技术栈（微信号：blog51cto）宇树科技回应了机器人半马“开跑即摔倒”争议！昨日，北京亦庄科技园举办了一场别开生面的赛事：全球首场人形机器人半程马拉松。 21台机器人被安排在专属跑道上与数千名人类选手同时出发，试图完成21公里的挑战。

4/21/2025 7:41:41 AM

改变世界的十大算法

在当今这个数字化时代，算法已经成为推动世界运转的核心力量。它们如同隐藏在幕后的魔术师，用精密的逻辑和数学原理塑造了现代生活的方方面面。从我们每天使用的智能手机，到支撑全球金融体系的复杂网络，算法无处不在。

4/8/2025 1:11:00 AM 大道至简

两位华人76页论文解决量子领域核心问题：首次证明伪随机性真实存在

量子领域的一个核心开放问题，就这样被两位华人研究员解决了？事情是这样的。一直以来，量子的随机性在计算和密码学中极为有用。

4/2/2025 9:40:00 AM 量子位

一个算法让LLM创新能力暴增，原来是AI学会了进化

如果你让当今的 LLM 给你生成一个创意时钟设计，使用提示词「a creative time display」，它可能会给出这样的结果：或许我们能在其中看到一些创新点，但整体来说这些设计并无特别出彩之处，依然还在预期之内。但近日的一项研究成果却可以让 LLM 设计出下面这些让人眼前一亮的时钟，而使用的提示词却和上面的一样：这是怎么做到的呢？简而言之：一种基于 LLM 的进化算法。

3/20/2025 2:18:57 PM 机器之心

通俗讲解DeepSeek中的GRPO：强化学习里的神奇算法

在人工智能快速发展的时代，强化学习是其中的关键技术，它让机器能够像人一样，在不断尝试中学习怎么做是最好的。今天要讲的 GRPO（Group Relative Policy Optimization），也就是群体相对策略优化算法，是强化学习里非常厉害的存在。接下来，就带大家走进deepseek（Paper Review: DeepSeek-R1——强化学习驱动的大语言模型推理能力提升） GRPO 的奇妙世界，看看它到底是怎么回事。

3/11/2025 1:00:00 AM 大模型之路

问同一个问题 DeepSeek-r1 / Grok-3 / Gemini 2.0 / ChatGPT 的结果出乎意料...

最近在写 TS ，希望实现一个类似 .gitignore 的功能，已有代码如下：复制在 JS 层面使用正则匹配，显然不是什么好方案。于是整理代码和报错信息，找了四个免费的模型，问问思路。先说结论：DeepSeek-r1 思考了 298 秒，我一度以为其陷入了死循环，但最后其在第一轮给出的方案，被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。

3/3/2025 12:00:00 AM piperliu

算法系列之搜索算法-深度优先搜索DFS

随着每年"金三银四"招聘季的到来，许多求职者开始积极备战面试。在众多面试环节中，机试往往是不可或缺的一环，而算法能力更是机试考核的重点。为此，我们特别推出算法系列文章，帮助大家系统复习算法知识。

2/26/2025 5:00:00 AM 修己xj

LeCun力荐！进化算法淘汰77%低质数据：RIP方法让模型性能狂飙60%

在LLM的开发中，推动模型进步的主要驱动力是精心挑选高质量的训练示例。虽然Scaling Law的确能实现「力大砖飞」，但仅仅增加数据量并不能保证模型性能的提升，数据的质量才是关键。低质量的数据可能会引入噪声，影响模型的训练效果。

2/25/2025 9:17:47 AM 新智元

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文反驳涌现

复刻DeepSeek的神话，还在继续。之前，UC伯克利的博士只用30美元，就复刻了DeepSeek中的顿悟时刻，震惊圈内。这一次，来自荷兰阿姆斯特丹的研究人员Raz，再次打破纪录，把复刻成本降到了史上最低——只要10美元，就能复现DeepSeek顿悟时刻！

2/24/2025 9:00:00 AM 新智元

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版） AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 GGUF 是什么？一文看懂大模型里最火的模型格式后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 大语言模型字节跳动 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉