算法

3D高斯泼溅算法大漏洞：数据投毒让GPU显存暴涨70GB，甚至服务器宕机

随着3D Gaussian Splatting（3DGS）成为新一代高效三维建模技术，它的自适应特性却悄然埋下了安全隐患。在本篇 ICLR 2025 Spotlight 论文中，研究者们提出首个专门针对3DGS的攻击方法——Poison-Splat，通过对输入图像加入扰动，即可显著拖慢训练速度、暴涨显存占用，甚至导致系统宕机。这一攻击不仅隐蔽、可迁移，还在现实平台中具备可行性，揭示了当前主流3D重建系统中一个未被重视的安全盲区。

4/23/2025 8:50:00 AM

量子位

半马变翻车现场！宇树科技最新回应：G1开跑即摔倒系未使用原生算法！天工换三次电池夺冠——但也非独立智能！

出品 | 51CTO技术栈（微信号：blog51cto）宇树科技回应了机器人半马“开跑即摔倒”争议！昨日，北京亦庄科技园举办了一场别开生面的赛事：全球首场人形机器人半程马拉松。 21台机器人被安排在专属跑道上与数千名人类选手同时出发，试图完成21公里的挑战。

4/21/2025 7:41:41 AM

改变世界的十大算法

在当今这个数字化时代，算法已经成为推动世界运转的核心力量。它们如同隐藏在幕后的魔术师，用精密的逻辑和数学原理塑造了现代生活的方方面面。从我们每天使用的智能手机，到支撑全球金融体系的复杂网络，算法无处不在。

4/8/2025 1:11:00 AM

大道至简

两位华人76页论文解决量子领域核心问题：首次证明伪随机性真实存在

量子领域的一个核心开放问题，就这样被两位华人研究员解决了？事情是这样的。一直以来，量子的随机性在计算和密码学中极为有用。

4/2/2025 9:40:00 AM

量子位

一个算法让LLM创新能力暴增，原来是AI学会了进化

如果你让当今的 LLM 给你生成一个创意时钟设计，使用提示词「a creative time display」，它可能会给出这样的结果：或许我们能在其中看到一些创新点，但整体来说这些设计并无特别出彩之处，依然还在预期之内。但近日的一项研究成果却可以让 LLM 设计出下面这些让人眼前一亮的时钟，而使用的提示词却和上面的一样：这是怎么做到的呢？简而言之：一种基于 LLM 的进化算法。

3/20/2025 2:18:57 PM

机器之心

通俗讲解DeepSeek中的GRPO：强化学习里的神奇算法

在人工智能快速发展的时代，强化学习是其中的关键技术，它让机器能够像人一样，在不断尝试中学习怎么做是最好的。今天要讲的 GRPO（Group Relative Policy Optimization），也就是群体相对策略优化算法，是强化学习里非常厉害的存在。接下来，就带大家走进deepseek（Paper Review: DeepSeek-R1——强化学习驱动的大语言模型推理能力提升） GRPO 的奇妙世界，看看它到底是怎么回事。

3/11/2025 1:00:00 AM

大模型之路

问同一个问题 DeepSeek-r1 / Grok-3 / Gemini 2.0 / ChatGPT 的结果出乎意料...

最近在写 TS ，希望实现一个类似 .gitignore 的功能，已有代码如下：复制在 JS 层面使用正则匹配，显然不是什么好方案。于是整理代码和报错信息，找了四个免费的模型，问问思路。先说结论：DeepSeek-r1 思考了 298 秒，我一度以为其陷入了死循环，但最后其在第一轮给出的方案，被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。

3/3/2025 12:00:00 AM

piperliu

算法系列之搜索算法-深度优先搜索DFS

随着每年"金三银四"招聘季的到来，许多求职者开始积极备战面试。在众多面试环节中，机试往往是不可或缺的一环，而算法能力更是机试考核的重点。为此，我们特别推出算法系列文章，帮助大家系统复习算法知识。

2/26/2025 5:00:00 AM

修己xj

LeCun力荐！进化算法淘汰77%低质数据：RIP方法让模型性能狂飙60%

在LLM的开发中，推动模型进步的主要驱动力是精心挑选高质量的训练示例。虽然Scaling Law的确能实现「力大砖飞」，但仅仅增加数据量并不能保证模型性能的提升，数据的质量才是关键。低质量的数据可能会引入噪声，影响模型的训练效果。

2/25/2025 9:17:47 AM

新智元

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文反驳涌现

复刻DeepSeek的神话，还在继续。之前，UC伯克利的博士只用30美元，就复刻了DeepSeek中的顿悟时刻，震惊圈内。这一次，来自荷兰阿姆斯特丹的研究人员Raz，再次打破纪录，把复刻成本降到了史上最低——只要10美元，就能复现DeepSeek顿悟时刻！

2/24/2025 9:00:00 AM

新智元

终于把卷积神经网络算法搞懂了！！！

大家好，我是小寒今天给大家分享一个强大的算法模型，卷积神经网络算法卷积神经网络算法（CNN）是一种专门用于处理具有网格结构数据（如图像）的深度学习模型，广泛应用于图像分类、目标检测、语义分割等任务。 CNN 的核心思想是通过模拟生物视觉皮层处理视觉信息的方式，能够自动从图像中提取特征，从而进行分类、检测等任务。卷积神经网络的基本组成CNN 主要包括卷积层、池化层和全连接层。

2/21/2025 8:29:07 AM

程序员小寒

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

仅需简单提示，满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度，大幅提升上下文学习性能，突破少样本学习上限。图片大语言模型使用多步推理解决复杂数学问题，即先将复杂问题分解为多个步骤并逐步进行推理。

2/20/2025 12:09:22 PM

老友记搬沙发难题终结，60年数学谜题破解！119页论文惊人证明：有最优解

臭名昭著的「搬沙发」难题，已经困扰了数学家们60年。《老友记》经典的一幕，就是Ross找人帮忙搬新沙发时，无论如何也无法使沙发顺利通过拐角。 Ross大喊「Pivot！

2/18/2025 9:20:00 AM

新智元

免手术AI读心术新突破！Meta脑机接口研究惊呆网友：能边睡边玩手机发帖了？？

新年伊始，Meta脑机接口研究传来新进展——语言模型加持下，无需动脑部手术，脑机接口实现了当前非侵入式方式（MEG）最准确的结果。简单来说，仅利用AI模型Brain2Qwerty，他们实现了对脑电图（EEG）或脑磁图（MEG）电信号的高度解析。具体效果如何呢？

2/17/2025 10:08:00 AM

量子位

本科生推翻姚期智40年前猜想！CS顶会论文刷新哈希表传统认知

因为证明了弱化版的「孪生素数猜想」，当年58岁的张益唐一鸣惊人，蜚声全球。据说，在证明发表之前，相关领域的顶尖数学家，召开了研讨会，讨论后失望的认为：目前的技术无法进一步推动「孪生素数猜想」取得实质性进展。而当时，几乎在学术界「透明」的张益唐，甚至都不知道研讨会何时何地召开过。

2/17/2025 9:42:00 AM

新智元

不蒸馏R1也能超越DeepSeek，上海 AI Lab 用RL突破数学推理极限

仅通过强化学习，就能超越DeepSeek！上海AI Lab提出了基于结果奖励的强化学习新范式——从Qwen2.5-32B-Base模型出发，仅通过微调和基于结果反馈的强化学习，在不蒸馏超大模型如DeepSeek-R1的情况下，就能超越DeepSeek-R1-Distill-Qwen32B和OpenAI-O1系列的超强数学推理性能。团队发现，当前大模型数学推理任务面临”三重门”困局：稀疏奖励困境：最终答案对错的二元反馈，使复杂推理的优化变得困难局部正确陷阱：长思维链中部分正确步骤反而可能误导模型学习规模依赖魔咒：传统蒸馏方法迫使研究者陷入”参数规模军备竞赛”因此，研究团队重新审视了当前基于结果奖励的强化学习算法，经过严格的理论推导与证明，重新设计了一个新的结果奖励强化学习算法，并在这个过程中得出了三点重要结论：对于正样本：在二元反馈环境下，通过最佳轨迹采样（BoN）的行为克隆即可学习最优策略对于负样本：需要使用奖励重塑来维护策略优化目标的一致性对于长序列：不同的序列部分对结果的贡献不同，因此需要更细粒度的奖励分配函数，这个函数可以通过结果奖励习得通俗来说，就是通过对正确样本模仿学习，错误样本偏好学习，关键步骤重点学习，无需依赖超大规模的模型（例如DeepSeek-R1）进行蒸馏，仅通过强化学习即可达到惊人的效果。

2/17/2025 9:33:00 AM

量子位