理论

谷歌暗讽OpenAI：GPU在熔化，TPU火上浇油！Canvas免费开放，实测惊人

Gemini 2.5 Pro的Canvas，向所有人开放了！ AI大战，再次升级。奥特曼表示用户太热情，GPU在融化，在线求饶，团队要休息。

4/7/2025 8:39:00 AM 新智元

刚刚，特朗普扼杀全美GPU供应链？科技大厂核心AI算力告急，硅谷陷巨大恐慌

关税大棒一出，连全美的GPU供应链也危在旦夕了？昨夜，美股经历了5年未遇的史诗级暴跌，更可怕的是，AI界已经被特朗普的关税政策，搞得乱成一锅粥了！今天，纳斯达克综合指数直接跌超了近6%，与近一年来的新低仅一步之遥。

4/7/2025 8:38:00 AM 新智元

GenAI红队：将LLM置于网络安全测试中的技巧和技术

译者 | 晶颜审校 | 重楼从头构建一个GenAI红队，或者让现有的红队适应新技术是一个复杂的过程，OWASP在其最新指南中帮助阐释了这一过程。红队是测试和支持网络安全系统的一种有效方法，但它仍需适应技术的发展而不断完善。近年来，生成式人工智能（GenAI）和大型语言模型（LLM）的爆炸式增长正迫使红队世界适应。

4/7/2025 8:33:49 AM 晶颜

DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊

有点意思。这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛，引得大家纷纷联想是不是R2马上要来了。然鹅……奥特曼这边却发了一条“变卦”的消息：计划改变：我们可能在几周之后先发布o3和o4-mini。

4/7/2025 8:15:00 AM 量子位

大模型除了聊天还能做什么？关于大模型的分类和应用

大模型技术发展到今天，其功能可以说是日新月异；并且很多企业已经在探索大模型的应用场景和技术实现；但是很多人到现在对大模型的了解仅仅只限于能聊个天，问个问题。但实际上，大模型能够做的事要远比我们想象中的要多的多；因此，今天我们就从用户和技术两个角度来介绍一下大模型的应用。关于大模型的分类和应用问题如果想弄清楚大模型是怎么使用的，首先要知道大模型的分类；不同类型的模型适合不同的应用场景，其功能和实现也各不相同。

4/7/2025 8:15:00 AM DFires

英伟达GPU命名背后：是情怀，也是致敬伟人的智慧！新智元新智元 2025年04月05日 12:17

在上周结束的GTC大会上，老黄用两个多小时向我们介绍了英伟达过去一年的进展。其中，最让人们关注就是「每年一更」的用于未来AI工厂的GPU芯片架构路线图。 2024年，Blackwell GPU发布；2025年上半年，Blackwell GPU已经全面发货；2025年下半年，推出Blackwell Ultra；2026年下半年，将重磅发布Vera Rubin；2027年下半年，推出Rubin Ultra；再往后，就是2028年上市的Feynman。

4/7/2025 8:07:00 AM 新智元

OpenAI新计划！几周后推出o3 和 o4-mini，几个月内推出 GPT-5！

就在刚刚，奥特曼发了一条推文宣布：计划有变！他表示：我们最终将发布o3和o4-mini，可能在几周后，然后在几个月后推出GPT-5。这有很多原因，但最令人兴奋的是，我们将能够使GPT-5 比我们最初设想的更好。

4/7/2025 7:18:48 AM

Llama 4开源王者归来！推理、编码打平DeepSeek V3但参数减一半，一张H100就能跑，还有巨兽2万亿参数模型！

编辑 | 李美涵出品 | 51CTO技术栈（微信号：blog51cto）深夜，Meta如期发布了全新的开源大型模型系列——Llama 4，并未出现任何“跳票”传闻中的推迟情况！图片此次发布也标志着Meta与近来崛起的开源新王 DeepSeek 正面硬钢。 Meta官推更是表示：表示：“今天开启了原生多模态AI创新的新时代”。

4/7/2025 7:00:00 AM 李美涵

Dify+RAGFlow:1+1＞2的混合架构，详细教程+实施案例

企业在落地 RAG 知识库时， Dify 和 RAGFlow 这两个开源框架应该选择哪个？这也是我一直以来做RAG咨询时，经常被企业方问到的问题之一。一般来说，如果需要处理特别复杂的文档和非结构化数据，RAGFlow 是优选。

4/7/2025 7:00:00 AM 韦东东

模态编码器|EVA改进之EVA-02

来自智源曹越团队在EVA的优化改进方面的工作EVA-02，项目地址：：在CV领域，训练、调优和评估非常大的视觉模型需要大量的计算资源，限制了许多研究人员和开发者的参与。因此，本研究主要目的是提供一种高效且性能强大的预训练方法，不仅能够在多种下游任务中展现出色的迁移学习能力，而且还能显著减少参数数量和计算成本。 01、模型架构EVA-02的基础是一个改进版的纯Transformer架构，该架构在原始ViT的基础上进行了若干重要的修改，以更好地适应大规模预训练任务的需求。

4/7/2025 6:30:00 AM Goldma

模态编码器|CLIP技术改进之EVA-CLIP

上一篇看了EVA，趁热打铁，今天来看EVA-CLIP，同样是智源曹越团队的工作，主要研究主题是结合EVA改进CLIP。研究动机：训练CLIP模型面临计算成本高和训练不稳定等挑战，尤其是在扩大模型规模时。因此，这项工作的研究动机是提供一种高效且有效的解决方案，以促进更大规模CLIP模型的训练和发展。

4/7/2025 5:30:00 AM Goldma

一文掌握 MCP 上下文协议：从理论到实践

MCP模型上下文协议（Model Context Protocol，简称 MCP）是一种开放标准，旨在标准化大型语言模型（LLM）与外部数据源和工具之间的交互方式。由 Anthropic 于 2024 年 11 月推出，MCP 通过定义统一的接口，使 AI 应用能够安全、灵活地访问和操作本地及远程数据资源，提升模型的功能性和可扩展性。图片Transports（传输层）在 MCP 协议中，传输层提供了客户端与服务器之间通信的基础，其负责处理消息的发送与接收的底层机制。

4/7/2025 5:01:00 AM 陈明勇

DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI

Deepseek在2025年1月颠覆了全球人工智能模型，但谷歌和OpenAI很快发布了Gemini2 Pro和O3。这就产生了一个问题，应该使用哪种人工智能模型来进行客户服务？为了评估这些模型在客户服务任务上的表现，我们必须更深入地了解它们在各种AI基准上的表现。

4/7/2025 5:00:00 AM 晓晓

模态编码器|EVA探索掩码视觉表征学习的极限

今天来看一篇经典的视觉表征学习的方法EVA，来自智源研究院发表在2023年CVPR的一篇工作。项目地址：：自然语言处理（NLP）领域通过扩展预训练语言模型（PLMs）取得了革命性的成功，作者希望将这种成功从语言领域转移到视觉领域，即扩展一个视觉中心的基础模型，以便于视觉和多模态下游任务。另外，视觉模型预训练和扩展的方法主要依赖于监督或弱监督训练，需要数百万个（通常是不可公开访问的）标注数据。

4/7/2025 4:30:00 AM Goldma

人工智能在物联网中的挑战和局限性

虽然人工智能在物联网中的集成提供了诸多好处，但也带来了一定的挑战和限制。了解并解决这些问题对于确保人工智能在物联网系统中的成功部署和利用非常重要。让我们探讨一些关键挑战：人工智能驱动的物联网系统中的安全和隐私问题人工智能驱动的物联网设备中连接性和数据交换的增加引发了安全和隐私问题。

4/7/2025 4:00:00 AM chris han

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。图片论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 3:44:00 AM 新智元

模态编码器|CLIP详细解读

下面来详细了解一下多模态大模型模态编码器部分。今天首先来看下CLIP，OpenAI发表在2021年ICML上的一篇工作。项目地址：：在自然语言处理（NLP）领域，通过大规模的文本数据预训练模型（如GPT-3）已经取得了显著的成果，但在计算机视觉领域，预训练模型仍然依赖于人工标注的图像数据集，严重影响了其在未见类别上的泛化性和可用性（需要用额外的有标注数据）。

4/7/2025 3:30:00 AM Goldma

DeepMind闭关修炼「我的世界」，自学成才挖钻登Nature！人类玩家瑟瑟发抖

AI又进化了，在没有任何人类数据的参与下，自己玩《我的世界》还能找到钻石！在刚刚登上Nature的论文中，谷歌DeepMind的智能体通过纯·自我学习，顺利完成了收集钻石的任务。图片论文链接：，DeepMind的计算机科学家Danijar Hafner表示：「Dreamer是一个重要的里程碑，标志着AI又朝着通用人工智能前进了一大步。

4/7/2025 3:00:00 AM 新智元

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

谷歌暗讽OpenAI：GPU在熔化，TPU火上浇油！Canvas免费开放，实测惊人

刚刚，特朗普扼杀全美GPU供应链？科技大厂核心AI算力告急，硅谷陷巨大恐慌

GenAI红队：将LLM置于网络安全测试中的技巧和技术

DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊

大模型除了聊天还能做什么？关于大模型的分类和应用

英伟达GPU命名背后：是情怀，也是致敬伟人的智慧！ 新智元 新智元 2025年04月05日 12:17

OpenAI新计划！几周后推出o3 和 o4-mini，几个月内推出 GPT-5！

Llama 4开源王者归来！推理、编码打平DeepSeek V3但参数减一半，一张H100就能跑，还有巨兽2万亿参数模型！

Dify+RAGFlow:1+1＞2的混合架构，详细教程+实施案例

模态编码器|EVA改进之EVA-02

模态编码器|CLIP技术改进之EVA-CLIP

一文掌握 MCP 上下文协议：从理论到实践

DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI

模态编码器|EVA探索掩码视觉表征学习的极限

人工智能在物联网中的挑战和局限性

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

模态编码器|CLIP详细解读

DeepMind闭关修炼「我的世界」，自学成才挖钻登Nature！人类玩家瑟瑟发抖

英伟达GPU命名背后：是情怀，也是致敬伟人的智慧！新智元新智元 2025年04月05日 12:17