理论

OpenAI诈骗？GPT-4.1正式上线ChatGPT，网友实测却大呼失望

就在刚刚，OpenAI官宣：GPT-4.1，今天起直接在ChatGPT中可用。这个模型擅长编码任务和遵循指令，是o3和o4-mini的绝佳替代品。图片一个月前，GPT-4.1刚推出的时候，仅通过API向开发者开放。

5/15/2025 11:54:11 AM 新智元

陶哲轩DeepMind梦幻联动，最强通用科学Agent来了！一口气解决芯片设计、矩阵乘法和300年几何难题

Nature：「令人惊叹」的通用科学人工智能来了！谷歌DeepMind再次甩出一颗重磅炸弹：与陶哲轩等一众顶尖科学家一起共同打造AlphaEvolve。它可以设计出更快的矩阵乘法算法，可以改进芯片设计、提高数据中心、AI训练的效率，已经在谷歌内部用上了。

5/15/2025 11:01:58 AM

回应开发者！GPT 4.1正式上线ChatGPT，4o mini将退役默认模型！实测：非常快，半分钟跑出小游戏demo！

OpenAI表示：为了响应群众的呼声，原本API专供的GPT 4.1系列已经加入ChatGPT中。 GPT-4.1，将首先开放给 ChatGPT Plus、Pro 和 Team 的付费用户使用。同时，GPT-4o mini也将“退役”，由GPT-4.1 mini接棒成为所有 ChatGPT 用户（包括免费用户）的默认模型。

5/15/2025 10:50:46 AM

AI+数据智能体的三大支点：数据治理、知识库和大模型

当销售部喊出"业绩增长15%"，财务部却坚称"只有8%"。会议室里争论不休，时间流逝，竞争对手已经抢占先机。你不禁自问：明明砸了千万建设数据系统，为何企业依然深陷数据内耗？

5/15/2025 9:56:32 AM 大数据AI智能圈

今天起全员免费！GPT-4.1上线ChatGPT，首波实测：又快又听话，油腻感没了

今天凌晨开始，GPT-4.1可以直接在ChatGPT中使用了！而且是不管付费的没付费的，所有用户均可使用那种～官方介绍，GPT-4.1是一款专门针对编码任务和指令执行的模型，推理效率非常高。看看这张网友们自制的表格，它的能力一目了然：这家伙一个月前被OpenAI公开，当时声明专供API使用。

5/15/2025 9:34:39 AM

重磅！谷歌DeepMind发布AlphaEvolve：AI界的“算法设计进化大师”诞生

谷歌DeepMind刚刚又往前拱了一大步，宣布推出 AlphaEvolve智能体，目标直指更上游，用于通用算法的设计发现和优化简单说，AlphaEvolve就像个AI界的“算法育种大师”。它把自家Gemini大模型（Gemini Flash负责广撒网，洞察力强的Gemini Pro负责深挖）和一套“自动化考官”（负责验证算法靠不靠谱、效率高不高）结合起来，再套上一个“进化论”的框架，让好算法能一代更比一代强AlphaEvolve工作流程：工程师设定框架，AI通过“提示采样器”给LLM喂招，LLM出新招（程序），“考官”打分，好招进“兵器谱”，并用来启发下一轮出招。去年DeepMind就秀过肌肉，证明LLM能生成代码函数来搞定科学问题。

5/15/2025 9:17:00 AM

刚刚，OpenAI开放GPT-4.1，100万上下文、代码能力超强

今天凌晨1点30，OpenAI宣布开放GPT-4.1，从今天开始可以在ChatGPT中使用。 GPT-4.1是一款专门针对编码任务和指令执行的模型，推理效率非常高，对于日常编码需求来说，是替代o3和o4-mini非常好的选择。 GPT-4.1是OpenAI发布的最新模型，其最大亮点之一就是支持100万tokens上下文，这也是OpenAI首次发布长窗口模型。

5/15/2025 9:16:00 AM

GPT-4o不敌Qwen，无一模型及格！UC伯克利/港大等联合团队提出多模态新基准：考察多视图理解能力

多视图理解推理有新的评判标准了！什么是多视图理解？也就是从不同视角整合视觉信息进而实现理解决策。

5/15/2025 9:10:00 AM

破解300年数学难题，智能体大突破！谷歌发布超强AI Agent

今天凌晨，谷歌Deepmind在官网发布了，用于设计高级算法的编程AI Agent——AlphaEvolve。 AlphaEvolve与谷歌的大模型Gemini实现深度集成，用于自动评估通用算法的发现与优化，可以帮助开发人员快速设计出最好、高效的矩阵算法。简单来说，大模型擅长生成各种想法和算法，但是没人知道这些到底行不行，而AlphaEvolve相当于“质检员”，能够按照特定标准来衡量这些想法是否可行。

5/15/2025 9:08:00 AM

ICML25 | 让耳朵「看见」方向！仅依靠360°全景视频，就能生成3D空间音频

空间音频，作为一种能够模拟真实听觉环境的技术，正逐渐成为提升沉浸式体验的关键。然而，现有的技术大多基于固定的视角视频，缺乏对360°全景视频中空间信息的充分利用。在这样的背景下，一项在空间音频生成领域具有里程碑意义的研究应运而生——OmniAudio：它能够直接从360°视频生成空间音频，为虚拟现实和沉浸式娱乐带来了全新的可能性。

5/15/2025 9:05:00 AM

DanceGRPO：首个统一视觉生成的强化学习框架

本文由字节跳动 Seed 和香港大学联合完成。第一作者薛泽岳为香港大学 MMLab@HKU 在读博士生，在 CVPR、NeurIPS 等国际顶级会议上发表多篇研究成果。项目通讯作者为黄伟林博士和罗平教授。

5/15/2025 9:04:00 AM

25岁MIT辍学天才一战成名！3年成为90亿美金公司CEO

硅谷又出现了一位新的天才。 AI浪潮中，一位年仅25岁的远见者正以惊人的速度改写着软件开发的未来，他就是Michael Truell，AI代码编辑器Cursor背后的母公司Anysphere的CEO。 Cursor仅仅用了12个月，ARR就达到了一亿美元，多篇业内分析认定Cursor是「SaaS史上最快到$100M ARR的初创公司」。

5/15/2025 9:02:00 AM

陶哲轩携AI再战数学！o4-mini秒怂弃赛，Claude 20分钟通关

3天后，陶哲轩YouTube视频二更来了。上一次，他使用GitHub Copilot（基于GPT-4），成功在33分钟内完成一页非形式化证明。这次，他尝试了一种更短、更概念化的证明版本，并测试Claude、o4-mini能否基于之前的非形式和形式证明，生成类似的形式化代码。

5/15/2025 8:52:00 AM

所有AI工具共享记忆！MCP协议杀疯了：100%本地运行，Cursor、Claude都能用

聊完就忘？当下多数AI助手和开发工具各自独立运行，会话结束上下文即消失，严重影响了使用体验和效率。 OpenMemory MCP，一款可以解决AI工具记忆痛点，并且实现不同工具之间共享上下文信息的开源工具，他来了！

5/15/2025 8:35:00 AM

看图猜位置不输o3！字节发布Seed1.5-VL多模态推理模型，在60个主流基准测试中拿下38项第一

在60个主流基准测试中拿下38项第一！字节发布轻量级多模态推理模型Seed1.5-VL，仅用532M视觉编码器 200亿活跃参数就能与一众规模更大的顶尖模型掰手腕，还是能带图深度思考的那种。相关技术报告也第一时间公开了。

5/15/2025 8:30:00 AM

代理式AI的五级式综合教程：从基础快速响应到全自主代码生成与执行

译者 | 核子可乐审校 | 重楼在本教程中，我们将讲解代理式架构的五个级别，从最简单的语言模型调用到完全自主的代码生成和执行系统。本教程专为在Google Colab上无缝运行而设计。从一个简单的“处理器”开始（仅回显模型输出），你将逐步构建路由逻辑、集成外部工具、编排多步骤工作流，并最终使模型能够规划、验证、优化并执行自己的Python代码。

5/15/2025 8:29:52 AM 核子可乐

EasyDub 配音视频生成平台：SpringBoot + Thymeleaf + Spring AI 实战开发

本项目旨在构建一个 Web 端一键生成 AI 配音视频的系统，提供从“上传视频 → 提取语音 → 翻译 → 合成音频 → 合成字幕与数字人 → 下载结果”的完整流程。后端基于 SpringBoot，前端使用 Thymeleaf Bootstrap，结合 Redis 实现异步任务状态跟踪与进度轮询，支持多用户并发任务处理。功能亮点🔁 全流程：上传原视频 → 翻译 → 配音合成 → 视频输出💬 Spring AI：调用 AI 模型实现翻译、合成🎞️ Web UI：Thymeleaf Bootstrap 实现进度轮询🔧 Redis Spring Task 实现异步任务与进度管理💡 实际 DEMO：上传 original_video.mp4 → 下载 linly_dubbing.mp4项目结构复制SpringBoot 构建 REST 接口视频上传与任务创建接口复制Spring Task Redis 实现任务调度配置异步线程池复制后台任务处理服务复制Redis 进度服务封装复制Web 前端 Thymeleaf Bootstrapindex.html复制本地 DEMO 流程启动 SpringBoot 应用浏览器打开 http://localhost:8080上传 original_video.mp4等待进度提示，后台完成：视频 → 音频提取 → Whisper识别 → 翻译 → 合成配音 → 视频合成下载生成的 linly_dubbing.mp4结语通过整合 Spring Boot、Thymeleaf、Redis、FFmpeg 与 AI 模型接口（Whisper、XTTSv2 等），我们构建了一个功能强大且易用的 EasyDub Web 配音系统，支持异步处理、状态轮询、数字人合成与完整视频输出。

5/15/2025 8:21:16 AM 编程疏影

AI促进智能劳动力协作的六种方式

制造业的未来并非在于取代人类工人，而是让他们工作得更聪明，AI是人类专业知识的延伸。制造业和供应链是以人为本的行业，建立在人与人之间的联系之上。牢固的关系是它们的基础，然而，如今这两个行业正面临着由快速技术进步和熟练工人需求增长所驱动的重大前线变革，随着合格员工日益稀缺，这种需求变得更加紧迫。

5/15/2025 7:15:00 AM Chris Kuntz

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉