理论

我的小网站被"薅秃"了，用 Trae 五分钟给网站增加日志功能，揪出爬虫！

最近我发现自己用 Express 搭建的网站突然响应变慢，服务器负载莫名其妙地升高。一开始我还以为是代码优化问题，但看了几天后隐约感觉不对劲——流量突然暴增，但 uv 并没有明显增长。这种情况显然是遭遇了异常访问，要么是人为高频刷新，要么是爬虫抓取。

4/25/2025 9:54:26 AM story

RL真让大模型更会推理？清华新研究：其能力边界或仍被基座「锁死」

近年来，RLVR（可验证奖励的强化学习）训练大模型在数学、代码等各项任务中表现惊艳，大模型的推理能力快速提升，强化学习因而被视为重要的推手。然而，其中直指核心的重要问题却悬而未决：强化学习真的能让大模型获得超越基础模型的新推理能力吗？清华大学LeapLab团队联合上海交通大学开展的最新实证研究，通过实验现象揭示了一个值得关注的问题：当前的 RLVR 方法似乎尚未突破基座模型的能力上限。

4/25/2025 9:22:44 AM 机器之心

无需数据标注！测试时强化学习，模型数学能力暴增 | 清华&上海AI Lab

无需数据标注，在测试时做强化学习，模型数学能力暴增159%！清华和上海AI Lab周伯文团队用这样的方法，对模型进行了强化——结果模型在多个数据集上的成绩均大幅提升，尤其是Qwen-2.5-Math-7B，它做AIME 2024竞赛题的成绩直接提高了159%。实验过程中，强化学习的数据均由被训练的模型自身生成。

4/25/2025 9:20:00 AM

机器人也会挤牙膏？ManipTrans：高效迁移人类双手操作技能至灵巧手

研究团队由来自北京通用人工智能研究院（BIGAI）、清华大学和北京大学的跨专业研究者组成，致力于具身智能领域的前沿研究。团队成员在开发高效、智能的通用机器人技术，特别是机械灵巧手操作方面，拥有丰富的研究经验。一作为北京通用人工智能研究院研究员李恺林，其它作者为清华大学博士生李浦豪、北京通用人工智能研究院研究员刘腾宇、北京大学博士生李宇飏；通讯作者为北京通用人工智能研究院研究员黄思远。

4/25/2025 9:17:00 AM 机器之心

北大团队引领3D生成与对齐革新：OctGPT打破扩散模型垄断

近年来，智能三维形状生成（3D AIGC）技术迅速崛起，正成为推动数字内容创作革新的关键力量，特别是在游戏、影视、虚拟现实和工业设计等领域表现出巨大的应用潜力。随着技术的不断进步，三维内容的生成质量与效率持续提升，成为业界与学界广泛关注的焦点。最近，北京大学陈宝权教授带领团队在三维形状生成和三维数据对齐方面取得新的突破。

4/25/2025 9:15:00 AM 量子位

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

在大语言模型（LLMs）竞争日趋白热化的今天，「推理能力」已成为评判模型优劣的关键指标。 OpenAI 的 o 系列、Anthropic 的 Claude 和 DeepSeek-R1 等模型的惊艳表现背后，测试时缩放（TTS）技术功不可没。测试时缩放（TTS，Test-Time Scaling）是一种提升大语言模型推理能力的新兴策略，通过在测试阶段优化推理过程（如多数投票、蒙特卡洛树搜索等）提升大型语言模型（LLMs）的性能，而无需修改模型参数。

4/25/2025 9:12:00 AM 机器之心

UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成！

首次在统一框架内实现理解与生成的“双优表现”，打破了多模态统一建模的僵局！复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案，在一个框架内兼顾了图文理解与图像生成任务，并在多个权威评测中取得了领先的性能表现。 UniToken通过融合连续和离散视觉表征，有效缓解了以往方法中“任务干扰”和“表示割裂”的问题，为多模态统一建模提供了新的范式。

4/25/2025 9:10:00 AM

突发！OpenAI免费开放Deep research，超强AI Agent

今天凌晨4点30，OpenAI推出轻量级版本的Deep research功能提高当前的速率限制，以扩大Plus、Team和Pro用户的使用范围。值得一提的是，从今天开始免费ChatGPT用户可以使用Deep research，并且支持最新的o4-mini模型。下面「AIGC开放社区」就用免费版为大家展示一下Deep research的免费功能。

4/25/2025 9:09:00 AM AIGC开放社区

从模型原理到代码实践，深入浅出上手 Transformer，叩开大模型世界的大门

作者 | Plus一、序言作为非算法同学，最近被Cursor、DeepSeek搞的有点焦虑，同时也非常好奇这里的原理，所以花了大量业余时间自学了Transformer并做了完整的工程实践。希望自己心得和理解可以帮到大家~如有错漏，欢迎指出~本文都会以用Transformer做中英翻译的具体实例进行阐述。二、从宏观逻辑看Transformer让我们先从宏观角度解释一下这个架构。

4/25/2025 9:00:00 AM 腾讯技术工程

微软重磅官宣：「AI智能体」同事连夜上线！预言25年人类同事成稀有物种

就在刚刚，微软宣布：AI同事真来了！ CEO纳德拉亲自种草，激动表示：今天，对Microsoft 365 Copilot来说是个大日子。 Copilot的界面，已经完全AI化。

4/25/2025 8:55:00 AM 新智元

DeepResearch轻量版今日面向免费用户开放，实测一波，秒生成，太快了！

刚刚3个小时前，OpenAI推出轻量级版本的Deep research功能提高当前的速率限制，以扩大Plus、Team和Pro用户的使用范围。值得一提的是，从今天开始免费ChatGPT用户可以使用DeepResearch，并且支持最新的o4-mini模型。我这里实测了一下，中美两国人形机器人的市场现状和趋势分析，要求生成一份深度分析报告。

4/25/2025 8:44:04 AM

AI语音革命新纪元：Sesame模型让聊天AI“活”出表情包式情绪声线

译者 | 朱先忠审校 | 重楼Sesame使用一种名为残差向量量化的深度学习技术对语音进行编码最近，Sesame人工智能公司发布了他们最新的语音转语音（Speech-to-Speech）模型的演示。这是一个非常擅长说话的对话式人工智能代理，它们能够提供相关的答案，并带有表情地说话，而且说实话，它们非常有趣，互动性很强。请注意，有关这方面的系统的技术论文尚未发布，但他们确实发布了一篇简短的博客文章，并提供了有关他们使用的技术和他们所构建的先前算法的大量信息。

4/25/2025 8:19:05 AM 朱先忠

企业中最常用的十种GenAI工具

从AI聊天机器人和虚拟助手，到音频和视频生成器，这些都是当今最前沿的GenAI工具。自OpenAI于2022年推出ChatGPT以来，GenAI已大规模进入企业领域。根据Precedence Research的数据，2024年全球GenAI市场规模已超过250亿美元，并预计到2033年将达到惊人的8030亿美元。

4/25/2025 7:10:00 AM Thor Olavsrud

CISO仍未遏制影子AI飙升的数据风险

GenAI带来了诸多益处，但同时也伴随着数据安全风险，这主要通过影子AI的使用和敏感信息的泄露来实现。在企业中，这些风险正在加剧，因为员工经常使用私人GenAI账户来处理敏感数据。根据Netskope的一项研究，尽管大多数企业(90%)都提供了官方批准的GenAI应用，甚至更多(98%)的企业为用户提供了包含AI功能的应用，但企业中未经授权的AI服务使用仍在激增。

4/25/2025 7:05:00 AM John

机械臂+大模型+多模态：打造人机协作具身智能体

在人工智能快速发展的浪潮中，多模态大模型已成为技术前沿，使AI能够同时理解文本、图像、音频等多种信息。这一突破为具身智能体开辟了新天地。最近我在github中就找到了一个这样好玩的项目vlm_arm，其将机械臂与多模态大模型结合，打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。

4/25/2025 2:30:00 AM 贝塔街的万事屋

基于MiniO存储的RAGFlow+Dify图片处理方案

上篇文章中介绍了如何基于 RAGFlow 知识库，通过 Dify 的 HTTP 请求获取映射 Code 节点替换，将占位符解析为最终的 img 标签，来稳定的实现问答中图片正常显示问题。 Dify RAGFLow：基于占位符的图片问答升级方案（最佳实践）其中的"占位符"和"实际图片访问 URL"映射关系的存储使用了阿里云的 OSS 存储服务。初期选择阿里云 OSS 作为存储，主要是方便大家快速验证和迭代 RAG 应用的核心逻辑，避免过早陷入基础设施的维护细节。

4/25/2025 1:30:00 AM 韦东东

智能体的五大商业用例

AI的下一代已经到来，它具有自主性。智能体与聊天机器人由相同的AI系统提供支持，但可以独立行动、协作以实现更大的目标，并接管整个业务流程，这项技术相对较新，但所有主要参与者都已经加入。去年10月，微软宣布包括标准银行、路透社、Virgin Money和苏黎世保险在内的10万家组织正在使用Copilot .

4/25/2025 1:10:00 AM Maria

DeepSeek在数据领域的30个应用场景

在这个数据AI的时代，DeepSeek作为新一代AI模型正在改变我们处理、分析和理解数据的方式。本文为您揭秘DeepSeek在数据领域的30个颠覆性应用场景，带大家一窥AI如何重塑数据价值链。一、数据获取与处理篇1.

4/25/2025 12:50:00 AM 大数据AI智能圈

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

我的小网站被"薅秃"了，用 Trae 五 分钟给网站增加日志功能，揪出爬虫！

RL真让大模型更会推理？清华新研究：其能力边界或仍被基座「锁死」

无需数据标注！测试时强化学习，模型数学能力暴增 | 清华&上海AI Lab

机器人也会挤牙膏？ManipTrans：高效迁移人类双手操作技能至灵巧手

北大团队引领3D生成与对齐革新：OctGPT打破扩散模型垄断

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成！

突发！OpenAI免费开放Deep research，超强AI Agent

从模型原理到代码实践，深入浅出上手 Transformer，叩开大模型世界的大门

微软重磅官宣：「AI智能体」同事连夜上线！预言25年人类同事成稀有物种

DeepResearch轻量版今日面向免费用户开放，实测一波，秒生成，太快了！

AI语音革命新纪元：Sesame模型让聊天AI“活”出表情包式情绪声线

企业中最常用的十种GenAI工具

CISO仍未遏制影子AI飙升的数据风险

机械臂+大模型+多模态：打造人机协作具身智能体

基于MiniO存储的RAGFlow+Dify图片处理方案

智能体的五大商业用例

DeepSeek在数据领域的30个应用场景

我的小网站被"薅秃"了，用 Trae 五分钟给网站增加日志功能，揪出爬虫！