模型

刚刚，OpenAI推出「轻量级」Deep Research，免费用户也能薅羊毛！

刚刚，OpenAI 宣布推出「轻量级」版本的 Deep Research，免费用户也可以使用！轻量级版本由 OpenAI 的 o4-mini 模型提供支持，而之前的 Deep Research 使用的是更强大的 o3 模型（或其变体）。 OpenAI 表示，虽然响应通常会更简短，但仍能够维持您所期待的深度和质量。

4/25/2025 10:26:19 AM 机器之心

RL真让大模型更会推理？清华新研究：其能力边界或仍被基座「锁死」

近年来，RLVR（可验证奖励的强化学习）训练大模型在数学、代码等各项任务中表现惊艳，大模型的推理能力快速提升，强化学习因而被视为重要的推手。然而，其中直指核心的重要问题却悬而未决：强化学习真的能让大模型获得超越基础模型的新推理能力吗？清华大学LeapLab团队联合上海交通大学开展的最新实证研究，通过实验现象揭示了一个值得关注的问题：当前的 RLVR 方法似乎尚未突破基座模型的能力上限。

4/25/2025 9:22:44 AM 机器之心

无需数据标注！测试时强化学习，模型数学能力暴增 | 清华&上海AI Lab

无需数据标注，在测试时做强化学习，模型数学能力暴增159%！清华和上海AI Lab周伯文团队用这样的方法，对模型进行了强化——结果模型在多个数据集上的成绩均大幅提升，尤其是Qwen-2.5-Math-7B，它做AIME 2024竞赛题的成绩直接提高了159%。实验过程中，强化学习的数据均由被训练的模型自身生成。

4/25/2025 9:20:00 AM

北大团队引领3D生成与对齐革新：OctGPT打破扩散模型垄断

近年来，智能三维形状生成（3D AIGC）技术迅速崛起，正成为推动数字内容创作革新的关键力量，特别是在游戏、影视、虚拟现实和工业设计等领域表现出巨大的应用潜力。随着技术的不断进步，三维内容的生成质量与效率持续提升，成为业界与学界广泛关注的焦点。最近，北京大学陈宝权教授带领团队在三维形状生成和三维数据对齐方面取得新的突破。

4/25/2025 9:15:00 AM 量子位

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

在大语言模型（LLMs）竞争日趋白热化的今天，「推理能力」已成为评判模型优劣的关键指标。 OpenAI 的 o 系列、Anthropic 的 Claude 和 DeepSeek-R1 等模型的惊艳表现背后，测试时缩放（TTS）技术功不可没。测试时缩放（TTS，Test-Time Scaling）是一种提升大语言模型推理能力的新兴策略，通过在测试阶段优化推理过程（如多数投票、蒙特卡洛树搜索等）提升大型语言模型（LLMs）的性能，而无需修改模型参数。

4/25/2025 9:12:00 AM 机器之心

突发！OpenAI免费开放Deep research，超强AI Agent

今天凌晨4点30，OpenAI推出轻量级版本的Deep research功能提高当前的速率限制，以扩大Plus、Team和Pro用户的使用范围。值得一提的是，从今天开始免费ChatGPT用户可以使用Deep research，并且支持最新的o4-mini模型。下面「AIGC开放社区」就用免费版为大家展示一下Deep research的免费功能。

4/25/2025 9:09:00 AM AIGC开放社区

从模型原理到代码实践，深入浅出上手 Transformer，叩开大模型世界的大门

作者 | Plus一、序言作为非算法同学，最近被Cursor、DeepSeek搞的有点焦虑，同时也非常好奇这里的原理，所以花了大量业余时间自学了Transformer并做了完整的工程实践。希望自己心得和理解可以帮到大家~如有错漏，欢迎指出~本文都会以用Transformer做中英翻译的具体实例进行阐述。二、从宏观逻辑看Transformer让我们先从宏观角度解释一下这个架构。

4/25/2025 9:00:00 AM 腾讯技术工程

DeepResearch轻量版今日面向免费用户开放，实测一波，秒生成，太快了！

刚刚3个小时前，OpenAI推出轻量级版本的Deep research功能提高当前的速率限制，以扩大Plus、Team和Pro用户的使用范围。值得一提的是，从今天开始免费ChatGPT用户可以使用DeepResearch，并且支持最新的o4-mini模型。我这里实测了一下，中美两国人形机器人的市场现状和趋势分析，要求生成一份深度分析报告。

4/25/2025 8:44:04 AM

英伟达推 DAM-3B 模型：突破局部描述难题，让 AI 看懂图像 / 视频每一个角落

4/24/2025 1:40:26 PM 故渊

LLM 推理引擎之争：Ollama or vLLM ?

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型推理框架。在人工智能领域，模型的推理能力是衡量其性能的核心指标之一，直接影响其在复杂任务中的表现。随着自然语言处理（NLP）和大规模语言模型（LLM）技术的迅猛发展，众多创新模型不断涌现，为开发者提供了多样化的选择。

4/24/2025 10:26:40 AM Luga Lee

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

上个月，OpenAI 在 ChatGPT 中引入了图像生成功能，广受欢迎：仅在第一周，全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚，OpenAI 又宣布了一个好消息：他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1，让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。这也意味着，从今天开始，全世界的开发人员都可以使用 ChatGPT 强大的图像生成功能了。

4/24/2025 9:38:56 AM 机器之心

扩散模型还原被遮挡物体，几张稀疏照片也能"脑补"完整重建交互式3D场景｜CVPR'25

你是否设想过，仅凭几张随手拍摄的照片，就能重建出一个完整、细节丰富且可自由交互的3D场景？在传统方法中，这几乎是不可能完成的任务，稀少的拍摄视角往往导致模型无法还原被遮挡的区域，生成的场景要么残缺不全，要么细节模糊。更令人困扰的是，传统的重建算法无法解耦场景中的独立物体，重建结果无法交互，严重限制了在具身智能、元宇宙和影视游戏等领域的应用前景。

4/24/2025 9:38:00 AM

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

GPT-4o带火的漫画风角色生成，现在有了开源版啦！腾讯混元携手InstantX团队合作打破次元壁，开源定制化角色生成插件——InstantCharacter。以往针对角色驱动的图像生成方法，都存在一定的缺陷。

4/24/2025 9:35:00 AM

告别“AI失忆症”！新型SD-LoRA算法实现终身学习｜ICLR 2025

彻底摆脱传统方法对旧数据存储的依赖！哈佛团队联手香港城大、西安交大最新发布的SD-LoRA技术，通过固定已学习任务的方向参数，仅调整幅度权重，完全避免了历史数据的存储需求。能够在减少50%以上参数存储的同时保持最高准确率，并且在不增加推理开销的前提下显著缓解了灾难性遗忘问题。

4/24/2025 9:30:00 AM 量子位

挤爆字节服务器的Agent到底啥水平？一手实测来了

“字节版Manus”有多能打？量子位实测在此。 △扣子智能体生成的活动介绍网页我们用光了一天的对话额度，考验了扣子空间（Coze Space）的信息整理、任务执行、工具调用等多项技能。

4/24/2025 9:27:00 AM 量子位

ICLR 2025 Oral | 训练LLM，不只是多喂数据，PDS框架给出最优控制理论选择

本文第一作者顾煜贤（）为清华大学计算机系四年级直博生，师从黄民烈教授，研究方向为语言模型的高效训练与推理方法。他曾在 ACL，EMNLP，ICLR 等会议和期刊上发表近 20 篇论文，多次进行口头报告，Google Scholar 引用数 2600 ，曾获 2025 年苹果学者奖学金。本篇论文为他在微软亚洲研究院实习期间所完成。

4/24/2025 9:25:00 AM 机器之心

一天拿下3.4k star，这个1.6B开源模型火了，合成对话超逼真

如果不提前告诉你，你可能很难相信这段视频里的语音全部是 AI 生成的：这些声音来自 Dia-1.6B——一个刚刚在 𝕏、GitHub 等平台上走红的开源语音模型。它不仅能生成说话的声音、对话，同时也能合成真实感非常强的笑声、喷嚏声和吸鼻子声等表达情绪的声音。由于效果过于逼真，它在 GitHub 上线后不到 24 小时就收获了超过 3.4k star，现在的 star 数更是已经达到了 5.4k。

4/24/2025 9:21:00 AM 机器之心

Adam获时间检验奖！清华揭示保辛动力学本质，提出全新RAD优化器

ICLR（国际学习表征会议）是机器学习领域三大顶会之一，以推动深度学习基础理论和技术创新著称。每年，ICLR时间检验奖都会授予近十年对深度学习领域产生深远影响的里程碑式论文。今年这一殊荣花落Adam优化器（Adaptive Moment Estimation），该算法于2014年由OpenAI工程师Diederik Kingma和University of Toronto研究生Jimmy Ba提出。

4/24/2025 9:16:00 AM 新智元

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉