算法
重磅!谷歌DeepMind发布AlphaEvolve:AI界的“算法设计进化大师”诞生
谷歌DeepMind刚刚又往前拱了一大步,宣布推出 AlphaEvolve智能体 ,目标直指更上游,用于通用算法的设计发现和优化简单说,AlphaEvolve就像个AI界的“算法育种大师”。 它把自家Gemini大模型(Gemini Flash负责广撒网,洞察力强的Gemini Pro负责深挖)和一套“自动化考官”(负责验证算法靠不靠谱、效率高不高)结合起来,再套上一个“进化论”的框架,让好算法能一代更比一代强AlphaEvolve工作流程:工程师设定框架,AI通过“提示采样器”给LLM喂招,LLM出新招(程序),“考官”打分,好招进“兵器谱”,并用来启发下一轮出招。 去年DeepMind就秀过肌肉,证明LLM能生成代码函数来搞定科学问题。
5/15/2025 9:17:00 AM
破解300年数学难题,智能体大突破!谷歌发布超强AI Agent
今天凌晨,谷歌Deepmind在官网发布了,用于设计高级算法的编程AI Agent——AlphaEvolve。 AlphaEvolve与谷歌的大模型Gemini实现深度集成,用于自动评估通用算法的发现与优化,可以帮助开发人员快速设计出最好、高效的矩阵算法。 简单来说,大模型擅长生成各种想法和算法,但是没人知道这些到底行不行,而AlphaEvolve相当于“质检员”,能够按照特定标准来衡量这些想法是否可行。
5/15/2025 9:08:00 AM
RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力
多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。 尽管近期强化学习(RL)在传统视觉任务和多模态推理任务中取得了显著进展,但其在奖励建模中的应用仍然受到挑战,尤其是如何通过强化学习对奖励模型引入长期推理能力。 来自快手、中科院、清华、南大的研究团队发现,直接把现有的 RL 算法(比如 Reinforce )用到训练 MRM 上,会遇到很多问题,比如训练过程很不稳定,甚至直接崩掉。
5/12/2025 2:23:42 PM
OpenAI 姚顺雨:“算法为王”终结,欢迎来到“产品思维”时代
回顾过去几十年,AI的发展几乎就是一部“顶级模型与新方法”迭代史。 从DeepBlue击败象棋世界冠军、AlphaGo征服围棋、GPT-4刷爆各类考试榜单,到o1、R1等新一代模型横扫数学、编程、写作、操作等任务,每一次历史性突破的背后,都是训练方法、模型架构的根本性创新。 这时候的游戏规则很简单:谁能发明更强的训练方法、模型架构,就能称霸榜单;谁能在ImageNet、GLUE、MMLU等benchmark上显著提升,就能写进教材、赢得引用。
5/6/2025 12:00:55 AM
ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM
论文有两位共同一作。 郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。 扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、视频生成的技术革新。
4/28/2025 9:00:00 AM
机器之心
告别“AI失忆症”!新型SD-LoRA算法实现终身学习|ICLR 2025
彻底摆脱传统方法对旧数据存储的依赖! 哈佛团队联手香港城大、西安交大最新发布的SD-LoRA技术,通过固定已学习任务的方向参数,仅调整幅度权重,完全避免了历史数据的存储需求。 能够在减少50%以上参数存储的同时保持最高准确率,并且在不增加推理开销的前提下显著缓解了灾难性遗忘问题。
4/24/2025 9:30:00 AM
量子位
3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机
随着3D Gaussian Splatting(3DGS)成为新一代高效三维建模技术,它的自适应特性却悄然埋下了安全隐患。 在本篇 ICLR 2025 Spotlight 论文中,研究者们提出首个专门针对3DGS的攻击方法——Poison-Splat,通过对输入图像加入扰动,即可显著拖慢训练速度、暴涨显存占用,甚至导致系统宕机。 这一攻击不仅隐蔽、可迁移,还在现实平台中具备可行性,揭示了当前主流3D重建系统中一个未被重视的安全盲区。
4/23/2025 8:50:00 AM
量子位
半马变翻车现场!宇树科技最新回应:G1开跑即摔倒系未使用原生算法!天工换三次电池夺冠——但也非独立智能!
出品 | 51CTO技术栈(微信号:blog51cto)宇树科技回应了机器人半马“开跑即摔倒”争议! 昨日,北京亦庄科技园举办了一场别开生面的赛事:全球首场人形机器人半程马拉松。 21台机器人被安排在专属跑道上与数千名人类选手同时出发,试图完成21公里的挑战。
4/21/2025 7:41:41 AM
改变世界的十大算法
在当今这个数字化时代,算法已经成为推动世界运转的核心力量。 它们如同隐藏在幕后的魔术师,用精密的逻辑和数学原理塑造了现代生活的方方面面。 从我们每天使用的智能手机,到支撑全球金融体系的复杂网络,算法无处不在。
4/8/2025 1:11:00 AM
大道至简
两位华人76页论文解决量子领域核心问题:首次证明伪随机性真实存在
量子领域的一个核心开放问题,就这样被两位华人研究员解决了? 事情是这样的。 一直以来,量子的随机性在计算和密码学中极为有用。
4/2/2025 9:40:00 AM
量子位
一个算法让LLM创新能力暴增,原来是AI学会了进化
如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:或许我们能在其中看到一些创新点,但整体来说这些设计并无特别出彩之处,依然还在预期之内。 但近日的一项研究成果却可以让 LLM 设计出下面这些让人眼前一亮的时钟,而使用的提示词却和上面的一样:这是怎么做到的呢? 简而言之:一种基于 LLM 的进化算法。
3/20/2025 2:18:57 PM
机器之心
通俗讲解DeepSeek中的GRPO:强化学习里的神奇算法
在人工智能快速发展的时代,强化学习是其中的关键技术,它让机器能够像人一样,在不断尝试中学习怎么做是最好的。 今天要讲的 GRPO(Group Relative Policy Optimization),也就是群体相对策略优化算法,是强化学习里非常厉害的存在。 接下来,就带大家走进deepseek(Paper Review: DeepSeek-R1——强化学习驱动的大语言模型推理能力提升) GRPO 的奇妙世界,看看它到底是怎么回事。
3/11/2025 1:00:00 AM
大模型之路
问同一个问题 DeepSeek-r1 / Grok-3 / Gemini 2.0 / ChatGPT 的结果出乎意料...
最近在写 TS ,希望实现一个类似 .gitignore 的功能,已有代码如下:复制在 JS 层面使用正则匹配,显然不是什么好方案。 于是整理代码和报错信息,找了四个免费的模型,问问思路。 先说结论:DeepSeek-r1 思考了 298 秒,我一度以为其陷入了死循环,但最后其在第一轮给出的方案,被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。
3/3/2025 12:00:00 AM
piperliu
算法系列之搜索算法-深度优先搜索DFS
随着每年"金三银四"招聘季的到来,许多求职者开始积极备战面试。 在众多面试环节中,机试往往是不可或缺的一环,而算法能力更是机试考核的重点。 为此,我们特别推出算法系列文章,帮助大家系统复习算法知识。
2/26/2025 5:00:00 AM
修己xj
LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%
在LLM的开发中,推动模型进步的主要驱动力是精心挑选高质量的训练示例。 虽然Scaling Law的确能实现「力大砖飞」,但仅仅增加数据量并不能保证模型性能的提升,数据的质量才是关键。 低质量的数据可能会引入噪声,影响模型的训练效果。
2/25/2025 9:17:47 AM
新智元
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文反驳涌现
复刻DeepSeek的神话,还在继续。 之前,UC伯克利的博士只用30美元,就复刻了DeepSeek中的顿悟时刻,震惊圈内。 这一次,来自荷兰阿姆斯特丹的研究人员Raz,再次打破纪录,把复刻成本降到了史上最低——只要10美元,就能复现DeepSeek顿悟时刻!
2/24/2025 9:00:00 AM
新智元
终于把卷积神经网络算法搞懂了!!!
大家好,我是小寒今天给大家分享一个强大的算法模型,卷积神经网络算法卷积神经网络算法(CNN)是一种专门用于处理具有网格结构数据(如图像)的深度学习模型,广泛应用于图像分类、目标检测、语义分割等任务。 CNN 的核心思想是通过模拟生物视觉皮层处理视觉信息的方式,能够自动从图像中提取特征,从而进行分类、检测等任务。 卷积神经网络的基本组成CNN 主要包括卷积层、池化层和全连接层。
2/21/2025 8:29:07 AM
程序员小寒
简单示例提升DeepSeek-R1美国数学邀请赛AIME分数:以步骤为粒度对齐上下文学习与推理
仅需简单提示,满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。 上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度,大幅提升上下文学习性能,突破少样本学习上限。 图片大语言模型使用多步推理解决复杂数学问题,即先将复杂问题分解为多个步骤并逐步进行推理。
2/20/2025 12:09:22 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
开发者
xAI
具身智能
生成式
神经网络
机器学习
3D
人形机器人
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
生成式AI
视频生成
场景
DeepMind
特斯拉
深度学习
AI模型
架构
亚马逊
Transformer
MCP
编程
视觉
预测