理论

AI强化的人性化多模态视觉辅助系统，上交大开发智能便捷的穿戴设备，登Nature

4/17/2025 12:40:00 PM ScienceAI

齐心集团于斌平：在大模型时代，软件应用开发开发范式从“代码驱动”转向“模型能力优先”

作者 | 于斌平编辑 | 云昭在大模型时代，软件应用开发范式正在发生深刻变革。传统的开发模式以代码为核心，注重如何用代码实现功能及用户的交互体验；而大模型时代的开发则以模型能力为核心，强调智能交互设计和业务场景创新。本文将从新范式的关键特征、软件工程模式和开发理念的变革、建议与实践三个方面展开讨论，旨在为企业在大模型落地过程中提供全面的技术和方法指引。

4/17/2025 10:17:29 AM 云昭

OpenAI开源超火Agent，五小时破5000颗星，霸榜Github

在今天凌晨1点的产品发布中，OpenAI还开源了一个终端轻量级代码Agent智能体——Codex CLI。从凌晨到现在只用了5小时左右，Codex CLI直接破5000星霸榜Github，估计今天能破1万颗星，将成为一款明星级Agent。 OpenAI联合创始人兼总裁Greg Brockman表示，Codex CLI只是第一款代码工具，未来还将继续开源Agent产品。

4/17/2025 9:58:32 AM AIGC开放社区

谷歌提出Transformer架构中，表示崩塌、过度压缩的五个解决方法

Transformer架构的出现极大推动了生成式AI的发展，在此基础之上开发出了ChatGPT、Copilot、讯飞星火、文心一言、Midjourney等一大批知名产品。但Transformer架构并非完美还存在不少问题，例如，在执行需要计数或复制输入序列元素的任务经常会出错。而这些操作是推理的基本组件，对于解决日常任务至关重要。

4/17/2025 9:53:49 AM AIGC开放社区

智能体版《苦涩的教训》，图灵奖得主Sutton、谷歌RL大佬Silver新作：超人智能靠经验

人类生成的数据推动了人工智能的惊人进步，但接下来会怎样呢？几天前，Google DeepMind 强化学习副总裁 David Silver 参与了一场播客访谈节目，探讨了如何从依赖人类数据的时代迈向自主学习的时代。与此同时，David Silver 和他的老师、2024 年图灵奖得主 Richard Sutton 合作撰写的论文《Welcome to the Era of Experience》称人们正站在人工智能新时代的门槛上，并有望达到前所未有的水平；同时展望了新一代智能体，认为它们将主要通过经验来学习，获得超越人类的能力。

4/17/2025 9:10:00 AM 机器之心

刚刚，OpenAI发布最强推理模型o3！图像深度思考首秀，开源编程智能体已揽5k+star

深夜，OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。该系列模型经过训练，会在响应之前进行更长时间的思考。 OpenAI 表示，这是他们迄今为止发布的最智能模型，也标志着 ChatGPT 能力的巨大飞跃。

4/17/2025 9:02:00 AM 机器之心

揭秘大模型的魔法：从零开始你的AI冒险

你好，我是写代码的中年人！你有没有想过，那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事？它们其实是“大型语言模型”（Large Language Models，简称 LLM）的产物。

4/17/2025 9:00:00 AM 写代码的中年人

OpenAI深夜发布满血o3和o4mini: 两个没想到

4/17/2025 8:59:59 AM AI寒武纪

围绕多智能体黑箱非凸优化共识难题，华南理工大学团队发表系列研究

多智能体系统分布式共识优化的一系列研究来了！在智能城市、智能电网、无人系统等前沿应用不断扩展的今天，多智能体系统（Multi-Agent Systems, MAS）作为新一代智能协同的技术基础，正迎来前所未有的发展机遇。在这些系统中，多个具备计算与通信能力的智能体需要在没有中心协调、通信受限的条件下实现任务协作、资源共享与一致性决策。

4/17/2025 8:55:24 AM 量子位

全网最全「吉卜力」AI神器总结！只要2分钟，照片秒变吉卜力

创建吉卜力风格的图像，现在很流行。甚至还可以根据图像，生成吉卜力动画：「神秘的微笑」蒙娜丽莎，都会主动和你打招呼！但是，97%的人可能不知道如何创建它们。

4/17/2025 8:51:20 AM 新智元

开发者值得关注的六大AI调试工具

译者 | 核子可乐审校 | 重楼AI驱动的调试工具正在颠覆开发者识别、诊断和修复代码问题的方式。这些工具利用机器学习和AI技术自动化传统调试流程，节省时间并提高代码质量。本文将带大家了解六大最受欢迎的AI调试工具及其核心功能、所需技能和比较优势。

4/17/2025 8:36:30 AM 核子可乐

ChatGPT首次带图深度思考：OpenAI连发o3/o4 mini，比前代性能更强价格更低

仅隔一天，OpenAI再次突然放大招：一口气，o3和o4 mini同步上线。图片依然是最热门推理模型，并且这一次，它们终于能够调用ChatGPT里的各种工具了，包括网络搜索、Python、图像分析、文件解释和图像生成。也就是说，你现在可以也用o3来生成吉卜力风格的奥特曼抱子图了（doge）。

4/17/2025 7:23:10 AM

五个强大的AI提示词，可助力任何商业创意

你已经有了一个很棒的商业想法，这是一个开始，但要将它付诸实践还有大量工作要做。幸运的是，在这个领域，GenAI可以发挥极大的帮助作用，它虽然不会为你提供万无一失的策略，但它可以帮助你进行商业计划的头脑风暴、研究市场和微调营销内容和信息。不过，这并不是简单地将你的指令输入ChatGPT，然后指望它为你完成所有艰苦的工作。

4/17/2025 7:00:00 AM Bernard Marr

大半精锐尽出！o1下线！满血o3之后，模型本身就是Manus，最大卖点：替代人干真活！OpenAI自家多模态推理技术思路也公开了

编辑｜云昭4月17日凌晨1点，一半OpenAI的模型精锐都出来秀肌肉了！凌晨一点，OpenAI派出了8位新老大将齐聚今晚的直播间，一起解说OpenAI新发布的目前OpenAI最为强大、最为智能的模型：满血o3和o4-mini！可以说这次发布的重点和卖点就是：实用价值（真能代替你干活）！

4/17/2025 6:36:29 AM 云昭

OpenAI震撼发布o3/o4-mini，直逼视觉推理巅峰！首用图像思考，十倍算力爆表

不出所料，满血版o3真的来了。刚刚，OpenAI联创Greg Brockman和首席研究官Mark Chen带队，开启了20分钟线上直播。这次不仅有o3，还有下一代推理模型o4-mini。

4/17/2025 6:10:57 AM 新智元

奥特曼出席TED 2025：年度最令人不安且最重要的AI采访

“我从未见过任何公司有这样的增长，无论是我参与过的还是没有参与过的，”奥特曼在与TED大会主持人克里斯·安德森(Chris . Anderson)的台上对话中表示。 “ChatGPT的增长——真的很有趣，我深感荣幸，但经历这一切也很疯狂，我们的团队已经筋疲力尽，压力重重。

4/17/2025 5:00:00 AM Michael

多模态生成框架新SOTA：文本+空间+图像随意组合，20W+数据开源，复旦腾讯优图出品

能处理任意条件组合的新生成框架来了！复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine，一种基于DiT的多条件可控生成框架，能够处理包括但不限于文本提示、空间映射和主体图像在内的任意控制条件的任意组合，并保持高度的一致性和出色的和谐性。具体效果be like：图片据了解，现有的多条件可控生成框架或是只能处理单一种类的多个条件，或是只适用于某种特定的多类别组合，从而普遍缺乏通用性的多类别多条件的组合式生成能力。

4/17/2025 2:55:00 AM

Dify+RAGFLow：基于占位符的图片问答升级方案

4/2 号时写了一篇 RAGFlow 实现图片问答的原理解析，后续在知识星球内有星友陆续反馈在使用我提供的源码复现时，会出现知识库中能渲染图片，但回答中图片无法正常加载的问题。知识库预览和引用文件部分是直接展示原始数据或进行简单渲染，它们能正确显示图片，证明原始上传的增强文本中的 URL 是正确的，并且图片服务器和网络配置是通的，问题出在聊天内容生成这个环节。我当时提供了三种选择选择，分别是：更强的 prompt 指令、更强的 LLM 和”占位符后处理“的方案，鉴于后续大家反馈前两种效果依然不够稳定，这篇我来系统的分享下如何实现第三种更符合实际生产场景的 RAG 富文本处理方案。

4/17/2025 1:00:00 AM 韦东东

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉