模型

陶哲轩DeepMind梦幻联动，最强通用科学Agent来了！一口气解决芯片设计、矩阵乘法和300年几何难题

Nature：「令人惊叹」的通用科学人工智能来了！谷歌DeepMind再次甩出一颗重磅炸弹：与陶哲轩等一众顶尖科学家一起共同打造AlphaEvolve。它可以设计出更快的矩阵乘法算法，可以改进芯片设计、提高数据中心、AI训练的效率，已经在谷歌内部用上了。

5/15/2025 11:01:58 AM

OpenAI发布全新GPT-4.1模型，编程任务更得心应手

在人工智能领域的持续创新中，OpenAI 近日宣布对其 ChatGPT 聊天机器人进行重大升级，推出了最新的 GPT-4.1模型。该模型从5月14日开始正式向用户开放，为 Pro、Plus 和 Team 用户提供了新的选择。与此同时，Enterprise 和 Edu 用户也将于未来几周内陆续获得访问权限，确保更多用户能够体验这一先进技术。

5/15/2025 11:01:55 AM AI在线

全球首个女性肿瘤 AI 大模型 “木兰” 上线，手机端免费服务！

近日，华中科技大学宣布，全球首个女性肿瘤人工智能大模型 “木兰” 已正式进入临床应用阶段。这一重要的医疗技术是由华中科技大学同济医学院附属同济医院国家妇产疾病临床医学研究中心与多家机构联合研发，旨在提升女性肿瘤的筛查和治疗水平。 “木兰” 模型以近20年的高质量病例数据为基础，结合国内外权威的女性肿瘤医疗指南及专家共识，特别适合中国女性的健康需求。

5/15/2025 11:01:54 AM AI在线

回应开发者！GPT 4.1正式上线ChatGPT，4o mini将退役默认模型！实测：非常快，半分钟跑出小游戏demo！

OpenAI表示：为了响应群众的呼声，原本API专供的GPT 4.1系列已经加入ChatGPT中。 GPT-4.1，将首先开放给 ChatGPT Plus、Pro 和 Team 的付费用户使用。同时，GPT-4o mini也将“退役”，由GPT-4.1 mini接棒成为所有 ChatGPT 用户（包括免费用户）的默认模型。

5/15/2025 10:50:46 AM

重磅！谷歌DeepMind发布AlphaEvolve：AI界的“算法设计进化大师”诞生

谷歌DeepMind刚刚又往前拱了一大步，宣布推出 AlphaEvolve智能体，目标直指更上游，用于通用算法的设计发现和优化简单说，AlphaEvolve就像个AI界的“算法育种大师”。它把自家Gemini大模型（Gemini Flash负责广撒网，洞察力强的Gemini Pro负责深挖）和一套“自动化考官”（负责验证算法靠不靠谱、效率高不高）结合起来，再套上一个“进化论”的框架，让好算法能一代更比一代强AlphaEvolve工作流程：工程师设定框架，AI通过“提示采样器”给LLM喂招，LLM出新招（程序），“考官”打分，好招进“兵器谱”，并用来启发下一轮出招。去年DeepMind就秀过肌肉，证明LLM能生成代码函数来搞定科学问题。

5/15/2025 9:17:00 AM

刚刚，OpenAI开放GPT-4.1，100万上下文、代码能力超强

今天凌晨1点30，OpenAI宣布开放GPT-4.1，从今天开始可以在ChatGPT中使用。 GPT-4.1是一款专门针对编码任务和指令执行的模型，推理效率非常高，对于日常编码需求来说，是替代o3和o4-mini非常好的选择。 GPT-4.1是OpenAI发布的最新模型，其最大亮点之一就是支持100万tokens上下文，这也是OpenAI首次发布长窗口模型。

5/15/2025 9:16:00 AM

GPT-4o不敌Qwen，无一模型及格！UC伯克利/港大等联合团队提出多模态新基准：考察多视图理解能力

多视图理解推理有新的评判标准了！什么是多视图理解？也就是从不同视角整合视觉信息进而实现理解决策。

5/15/2025 9:10:00 AM

破解300年数学难题，智能体大突破！谷歌发布超强AI Agent

今天凌晨，谷歌Deepmind在官网发布了，用于设计高级算法的编程AI Agent——AlphaEvolve。 AlphaEvolve与谷歌的大模型Gemini实现深度集成，用于自动评估通用算法的发现与优化，可以帮助开发人员快速设计出最好、高效的矩阵算法。简单来说，大模型擅长生成各种想法和算法，但是没人知道这些到底行不行，而AlphaEvolve相当于“质检员”，能够按照特定标准来衡量这些想法是否可行。

5/15/2025 9:08:00 AM

陶哲轩携AI再战数学！o4-mini秒怂弃赛，Claude 20分钟通关

3天后，陶哲轩YouTube视频二更来了。上一次，他使用GitHub Copilot（基于GPT-4），成功在33分钟内完成一页非形式化证明。这次，他尝试了一种更短、更概念化的证明版本，并测试Claude、o4-mini能否基于之前的非形式和形式证明，生成类似的形式化代码。

5/15/2025 8:52:00 AM

看图猜位置不输o3！字节发布Seed1.5-VL多模态推理模型，在60个主流基准测试中拿下38项第一

在60个主流基准测试中拿下38项第一！字节发布轻量级多模态推理模型Seed1.5-VL，仅用532M视觉编码器 200亿活跃参数就能与一众规模更大的顶尖模型掰手腕，还是能带图深度思考的那种。相关技术报告也第一时间公开了。

5/15/2025 8:30:00 AM

AI日报：腾讯AI智能编程插件CodeBuddy；字节推Seed1.5-VL多模态模型；Manus母公司否认15亿美元融资传闻

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:、中国版Cursor!腾讯推出 AI 编程助手 CodeBuddy腾讯推出CodeBuddy3.0插件，与微信小程序开发工具深度整合，支持代码补全、智能提示等功能，提升开发效率。【AiBase提要:】🌐 CodeBuddy3.0助力微信小程序开发，提升开发灵活性。

5/14/2025 5:00:52 PM AI在线

AI自我进化神器！Self-Refine让GPT-4输出飙升20%，无需训练即可搞定！

Self-Refine方法因其通过自我批评与反思显著提升大语言模型（LLM）输出质量，再度成为AI研究热点()。这一创新框架让单一LLM通过生成、反馈、优化的循环，自主迭代输出，无需额外训练或外部工具即可实现约20%的性能提升。 AIbase观察到，Self-Refine对包括GPT-4在内的先进模型均有效，引发了开发者与研究者的广泛讨论。

5/14/2025 5:00:52 PM AI在线

阶跃星辰开源 3D 大模型 Step1X-3D

阶跃星辰正式发布并开源了3D大模型Step1X-3D。这一模型的推出，标志着阶跃星辰在多模态方向上的最新成果，继图像、视频、语音、音乐等模态后，进一步拓展了AI技术的应用边界。 Step1X-3D模型总参数量达4.8B，其中几何模块1.3B，纹理模块3.5B。

5/14/2025 5:00:52 PM AI在线

Poe 发布 AI 模型报告：GPT-4o 独占鳌头，Gemini 推理异军突起，快手可灵黑马搅局！

AI 模型市场，就像一场不停撤掉椅子的游戏，玩家们争抢着位置。谁坐得稳，谁被挤下，数据在说话。 Poe 平台拿出了一份报告，打开一个窗口，让我们看看 2025 年 1 月到 5 月，这个市场的风云变幻。

5/14/2025 3:06:28 PM

字节最强多模态模型登陆火山引擎！Seed1.5-VL靠20B激活参数狂揽38项SOTA

5 月 13 日，火山引擎在上海搞了场 FORCE LINK AI 创新巡展，一股脑发布了 5 款模型和产品，包括豆包・视频生成模型 Seedance 1.0 lite、升级后的豆包 1.5・视觉深度思考模型，以及新版豆包・音乐模型。同时，Data Agent 和 Trae 等产品也有了新进展。其中，全场最吸睛的就是豆包 1.5・视觉深度思考模型（以下称 Seed 1.5-VL）。

5/14/2025 3:05:21 PM

首个，专攻点云上下文学习自适应采样！支持点级、提示级｜CVPR 2025

3D点云处理（PCP）涉及多种任务，如分割、去噪、配准、重建等，传统方法通常是为每个任务设计专用模型，导致过程繁杂、成本高昂。虽然多任务学习（MTL）能缓解模型数量问题，但在任务冲突、参数调优方面仍存在挑战。近年来兴起的In-Context Learning（ICL，上下文学习）技术，是指大型语言模型在不进行显式参数更新的情况下，仅通过输入中的示例（即上下文信息）来完成新的任务。

5/14/2025 3:03:45 PM

Anthropic 全新 AI 模型 Claude Neptune 即将亮相，竞逐市场巨头

科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。目前，这一新 AI 模型已进入内部安全测试阶段，预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。根据博文的介绍，Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。

5/14/2025 3:00:52 PM AI在线

ICML 2025 | 如何在合成文本数据时避免模型崩溃？

随着生成式人工智能技术的飞速发展，合成数据正日益成为大模型训练的重要组成部分。未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。然而，这一趋势也带来了严峻挑战：合成数据如果不加控制地使用，可能引发 “模型崩溃”（Model Collapse）问题。

5/14/2025 1:23:19 PM

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

模型

陶哲轩DeepMind梦幻联动，最强通用科学Agent来了！一口气解决芯片设计、矩阵乘法和300年几何难题

OpenAI发布全新GPT-4.1模型，编程任务更得心应手

全球首个女性肿瘤 AI 大模型 “木兰” 上线，手机端免费服务！

回应开发者！GPT 4.1正式上线ChatGPT，4o mini将退役默认模型！实测：非常快，半分钟跑出小游戏demo！

重磅！谷歌DeepMind发布AlphaEvolve：AI界的“算法设计进化大师”诞生

刚刚，OpenAI开放GPT-4.1，100万上下文、代码能力超强

GPT-4o不敌Qwen，无一模型及格！UC伯克利/港大等联合团队提出多模态新基准：考察多视图理解能力

破解300年数学难题，智能体大突破！谷歌发布超强AI Agent

陶哲轩携AI再战数学！o4-mini秒怂弃赛，Claude 20分钟通关

看图猜位置不输o3！字节发布Seed1.5-VL多模态推理模型，在60个主流基准测试中拿下38项第一

AI日报：腾讯AI智能编程插件CodeBuddy；字节推Seed1.5-VL多模态模型；Manus母公司否认15亿美元融资传闻

AI自我进化神器！Self-Refine让GPT-4输出飙升20%，无需训练即可搞定！

阶跃星辰开源 3D 大模型 Step1X-3D

Poe 发布 AI 模型报告：GPT-4o 独占鳌头，Gemini 推理异军突起，快手可灵黑马搅局！

字节最强多模态模型登陆火山引擎！Seed1.5-VL靠20B激活参数狂揽38项SOTA

首个，专攻点云上下文学习自适应采样！支持点级、提示级｜CVPR 2025

​Anthropic 全新 AI 模型 Claude Neptune 即将亮相，竞逐市场巨头

ICML 2025 | 如何在合成文本数据时避免模型崩溃？

Anthropic 全新 AI 模型 Claude Neptune 即将亮相，竞逐市场巨头