模型

论文党狂喜！alphaXiv推出Deep Research一秒搜遍arXiv，研究效率直接爆表

刚刚，alphaXiv 推出了新功能「Deep Research for arXiv」，该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读，显著提升文献检索及研究效率。体验链接：，当用户输入「Can you help me do a lit review for self-supervised learning. with relevant applications?」时，系统迅速生成了一篇内容完整、结构清晰的文献综述，并提供了 arXiv 链接。

4/9/2025 12:48:13 PM 机器之心

Llama 4五大疑点曝光，逐层扒皮！全球AI进步停滞，NYU教授称Scaling彻底结束

令人失望的Llama 4，只是前奏而已。接下来我们恐将看到——全球局势的改变，将彻底阻止AI进步！最近，一位AI CEO做出长视频，逐级对Llama 4身上的六大疑点进行了扒皮。

4/9/2025 10:11:57 AM 新智元

20人创业神话，老黄数亿刀收购！AI大牛贾扬清、白俊杰被曝入职英伟达

靴子落地，创立两年的Lepton AI被英伟达收入囊中！据The Information报道，英伟达斥资数亿美元，完成了对AI大牛贾扬清创企Lepton AI的收购。目前，Lepton AI的联创贾扬清（下图左）和白俊杰（下图右），均已入职英伟达。

4/9/2025 9:51:43 AM 新智元

AI危险检测再进化！三层级解析长视频异常，各种时序粒度均有明显优势 | CVPR HighLight

多模态视频异常理解任务，又有新突破！ “异常理解”是指在视频监控、自动驾驶等场景中，利用模型发现视频中的异常内容，从而预判危险，以便及时做出决策。来自华中科大等机构的研究人员，提出了新的视频异常理解模型Holmes-VAU，以及相关数据集。

4/9/2025 9:25:00 AM 量子位

生图加入CoT，性能提升80%！微软港中文打造天才画手

AI绘画火爆的当下，大家都有过这样的体验：满心欢喜地输入一段描述，满心期待着生成超酷炫的图像，结果AI给出的作品却差强人意，不是没get到重点，就是细节各种「翻车」。今天要介绍的ImageGen-CoT技术，就像是给AI绘画开了「外挂」，让它变得超智能，创作更轻松！来自微软和港中文的华人研究者提出了ImageGen-CoT，用思维链（CoT）推理提升文本到图像上下文学习能力。

4/9/2025 9:10:00 AM 新智元

三个LLM顶一个OpenAI？2亿条性能记录加持，路由n个「小」模型逆袭

当前大模型研究面临三大困境：算力垄断（顶尖成果集中于大厂）、成本壁垒（单次训练成本高，可能需要数千GPU小时）以及技术路径单一化（过度依赖单一模型的规模扩展）。为突破这些限制，路由LLM（Routing LLM）范式应运而生——通过智能调度实现多个开源小模型的协同增效，以「组合创新」替代「规模竞赛」。代码：: ： level的MoE（Mixture-of-Experts），传统MoE通过在模型内部扩展专家网络（如稀疏激活的FFN层）提升性能，而路由LLM将完整LLM视为独立「专家」，通过预训练Router动态分配任务输入。

4/9/2025 9:00:00 AM 新智元

Llama 4在测试集上训练？内部员工、官方下场澄清，LeCun转发

Llama 4 这么大的节奏，Meta 终于绷不住了。本周二凌晨，Meta Gen AI 团队负责人发表了一份澄清说明（针对外界质疑「在测试集上训练」等问题），大佬 Yann LeCun 也进行了转发。很高兴能让大家用上 Llama 4，我们已经听说人们使用这些模型取得了很多出色的成果。

4/8/2025 1:12:49 PM 机器之心

Meta坐不住了！高管辟谣：Llama4没刷榜！训练没有使用测试集！模型稳定实现需要时间，bug正在修

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）Meta的辟谣来了！ ——没刷榜、模型稳定部署需要时间。昨日，Llama 4收到许多网友实测后的“差评”，加之自称内部员工的人在国内论坛上爆料Meta作弊，一时间流言四起。

4/8/2025 12:57:02 PM 伊风

首次引入强化学习！火山引擎Q-Insight让画质理解迈向深度思考

从 GPT-4o 吉卜力风、即梦的 3D 动画、再到苹果 Vision Pro，AI 视觉创作正迎来生产力大爆炸。一个重要问题随之浮现：如何评估机器生成的画质符合人眼审美？人眼能瞬间辨别图像优劣，但教会机器理解「好看」却充满挑战。

4/8/2025 9:50:00 AM 机器之心

2025 CSRankings排名出炉！上交大、清华北大、浙大霸榜全球AI TOP 10

就在刚刚，2025 CSRankings全球计算机科学排名发布！地址：，CMU再次霸榜，UIUC曾连续多年稳坐全球第二，如今跌至第6。中国高校/机构继续包揽多个席位，其中清华排名第2，上交大/浙大并列第3，北大第5。

4/8/2025 9:42:00 AM 新智元

奥特曼最新访谈认可“套壳”：多数改变世界的公司，最初都是这样的

4/8/2025 9:27:00 AM 量子位

清华耶鲁推理模型新范式：动态推理实现高效测试时扩展，大大节省Token消耗

推理性能提升的同时，还大大减少Token消耗！清华、耶鲁团队提出推理模型新范式：动态推理实现高效测试时扩展。测试时扩展（test-time scaling）技术加速推动了大语言模型在复杂推理领域的突破。

4/8/2025 9:16:00 AM 量子位

首个个性化对齐大模型问世！可精准识别用户内在动机和偏好，还有百万用户画像开源数据集 | 蚂蚁&人大

如何让大模型更懂「人」？虽然现有大模型经过了人类价值观对齐训练，但其对齐效果往往会让少数群体的声音被系统性淹没。那随之而来的问题是，当大模型服务全球用户，标准化对齐范式是否正在制造新的数字鸿沟？

4/8/2025 9:12:00 AM 量子位

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

最近AI圈最火的模型非GPT-4o莫属，各种风格图片持续火爆全网。如此强悍的图片生成能力，得益于GPT-4o本身是一个原生多模态模型。从最新发布的LLM来看，多模态已经成为绝对的主流。

4/8/2025 9:10:00 AM 新智元

中科大ICLR2025：特定领域仅用5%训练数据，知识准确率提升14%

让大语言模型更懂特定领域知识，有新招了！来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架——知识图谱驱动的监督微调（KG-SFT），该框架通过引入知识图谱（KG）来提升大语言模型（LLMs）在特定领域的知识理解和处理能力。实验结果表明，其在多个领域和多种语言的数据集上取得了显著的效果，成功入选ICLR 2025。

4/8/2025 9:00:00 AM 量子位

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Meta前脚刚发Llama 4，后脚就有大佬请辞了！一亩三分地的爆料贴称，经过反复训练后，Llama 4未能取得SOTA，甚至与顶尖大模型实力悬殊。为了蒙混过关，高层甚至建议：在后训练阶段中，将多个benchmark测试集混入训练数据。

4/7/2025 1:24:52 PM 新智元

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo，一种用于立体深度估计的基础模型，旨在实现强大的零样本泛化能力。通过构建大规模（100 万立体图像对）合成训练数据集，结合自动自筛选流程去除模糊样本，并设计了网络架构组件（如侧调谐特征主干和远程上下文推理）来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度，为零样本立体深度估计设立了新标准。

4/7/2025 9:45:00 AM 机器之心

AI也有人格面具，竟会讨好人类？大模型的「小心思」正在影响人类判断

你是否想过，LLM也有着自己的小心思？最新研究揭示了一个有趣的现象：LLM在被研究人员测试时，会有意识地改变自己的行为。在面对那些旨在评估人格特质的问题时，它们给出的答案会尽可能地讨人喜欢，符合社会期望。

4/7/2025 9:31:00 AM 新智元

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉