AI在线 AI在线

理论

揭秘大模型的魔法:从零开始你的AI冒险

你好,我是写代码的中年人! 你有没有想过,那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事? 它们其实是“大型语言模型”(Large Language Models,简称 LLM)的产物。
4/17/2025 9:00:00 AM
写代码的中年人

OpenAI深夜发布满血o3和o4mini: 两个没想到

OpenAI刚刚宣布推出其最新的o系列模型:o3和o4-mini,与以往模型不同,o3和o4-mini被设计为真正的AI系统,模型甚至能连续调用超过600次工具来完成一项艰巨任务,它们在理解和导航大型代码库(比如OpenAI自己的代码库)方面,超越了人类工程师,极大地提高了开发效率这次发布会我有两个没想到:一是没想到o系列模型变成了一个融合的模型,另外一个是引入图像推理“Thinking with Images”,下面第一时间给大家划个重点全面工具访问与推理能力o3和o4-mini最显著的特点是首次实现了对ChatGPT内所有工具的智能使用和组合能力。 它们可以搜索网络、分析上传的文件、处理视觉输入、生成图像,并且能够智能地判断何时以及如何使用这些工具来解决复杂问题。 这些模型经过专门训练,能够在大约一分钟内提供详细且经过深思熟虑的答案,以适当的输出格式解决多方面的问题o3,o4mini性能OpenAI o3是目前最强大的推理模型,在编程、数学、科学、视觉感知等领域推动了技术边界。
4/17/2025 8:59:59 AM
AI寒武纪

围绕多智能体黑箱非凸优化共识难题,华南理工大学团队发表系列研究

多智能体系统分布式共识优化的一系列研究来了! 在智能城市、智能电网、无人系统等前沿应用不断扩展的今天,多智能体系统(Multi-Agent Systems, MAS)作为新一代智能协同的技术基础,正迎来前所未有的发展机遇。 在这些系统中,多个具备计算与通信能力的智能体需要在没有中心协调、通信受限的条件下实现任务协作、资源共享与一致性决策。
4/17/2025 8:55:24 AM
量子位

全网最全「吉卜力」AI神器总结!只要2分钟,照片秒变吉卜力

创建吉卜力风格的图像,现在很流行。 甚至还可以根据图像,生成吉卜力动画:「神秘的微笑」蒙娜丽莎,都会主动和你打招呼! 但是,97%的人可能不知道如何创建它们。
4/17/2025 8:51:20 AM
新智元

开发者值得关注的六大AI调试工具

译者 | 核子可乐审校 | 重楼AI驱动的调试工具正在颠覆开发者识别、诊断和修复代码问题的方式。 这些工具利用机器学习和AI技术自动化传统调试流程,节省时间并提高代码质量。 本文将带大家了解六大最受欢迎的AI调试工具及其核心功能、所需技能和比较优势。
4/17/2025 8:36:30 AM
核子可乐

ChatGPT首次带图深度思考:OpenAI连发o3/o4 mini,比前代性能更强价格更低

仅隔一天,OpenAI再次突然放大招:一口气,o3和o4 mini同步上线。 图片依然是最热门推理模型,并且这一次,它们终于能够调用ChatGPT里的各种工具了,包括网络搜索、Python、图像分析、文件解释和图像生成。 也就是说,你现在可以也用o3来生成吉卜力风格的奥特曼抱子图了(doge)。
4/17/2025 7:23:10 AM

五个强大的AI提示词,可助力任何商业创意

你已经有了一个很棒的商业想法,这是一个开始,但要将它付诸实践还有大量工作要做。 幸运的是,在这个领域,GenAI可以发挥极大的帮助作用,它虽然不会为你提供万无一失的策略,但它可以帮助你进行商业计划的头脑风暴、研究市场和微调营销内容和信息。 不过,这并不是简单地将你的指令输入ChatGPT,然后指望它为你完成所有艰苦的工作。
4/17/2025 7:00:00 AM
Bernard Marr

大半精锐尽出!o1下线!满血o3之后,模型本身就是Manus,最大卖点:替代人干真活!OpenAI自家多模态推理技术思路也公开了

编辑 | 云昭4月17日凌晨1点,一半OpenAI的模型精锐都出来秀肌肉了! 凌晨一点,OpenAI派出了8位新老大将齐聚今晚的直播间,一起解说OpenAI新发布的目前OpenAI最为强大、最为智能的模型:满血o3和o4-mini! 可以说这次发布的重点和卖点就是:实用价值(真能代替你干活)!
4/17/2025 6:36:29 AM
云昭

OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表

不出所料,满血版o3真的来了。 刚刚,OpenAI联创Greg Brockman和首席研究官Mark Chen带队,开启了20分钟线上直播。 这次不仅有o3,还有下一代推理模型o4-mini。
4/17/2025 6:10:57 AM
新智元

奥特曼出席TED 2025:年度最令人不安且最重要的AI采访

“我从未见过任何公司有这样的增长,无论是我参与过的还是没有参与过的,”奥特曼在与TED大会主持人克里斯·安德森(Chris . Anderson)的台上对话中表示。 “ChatGPT的增长——真的很有趣,我深感荣幸,但经历这一切也很疯狂,我们的团队已经筋疲力尽,压力重重。
4/17/2025 5:00:00 AM
Michael

多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品

能处理任意条件组合的新生成框架来了! 复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine,一种基于DiT的多条件可控生成框架,能够处理包括但不限于文本提示、空间映射和主体图像在内的任意控制条件的任意组合,并保持高度的一致性和出色的和谐性。 具体效果be like:图片据了解,现有的多条件可控生成框架或是只能处理单一种类的多个条件,或是只适用于某种特定的多类别组合,从而普遍缺乏通用性的多类别 多条件的组合式生成能力。
4/17/2025 2:55:00 AM

Dify+RAGFLow:基于占位符的图片问答升级方案

4/2 号时写了一篇 RAGFlow 实现图片问答的原理解析,后续在知识星球内有星友陆续反馈在使用我提供的源码复现时,会出现知识库中能渲染图片,但回答中图片无法正常加载的问题。 知识库预览和引用文件部分是直接展示原始数据或进行简单渲染,它们能正确显示图片,证明原始上传的增强文本中的 URL 是正确的,并且图片服务器和网络配置是通的,问题出在聊天内容生成这个环节。 我当时提供了三种选择选择,分别是:更强的 prompt 指令、更强的 LLM 和”占位符 后处理“的方案,鉴于后续大家反馈前两种效果依然不够稳定,这篇我来系统的分享下如何实现第三种更符合实际生产场景的 RAG 富文本处理方案。
4/17/2025 1:00:00 AM
韦东东

突然的大招!刚刚,腾讯元宝直接成为微信好友,腾讯找到了新希望!

继微信接入 DeepSeek 之后,刚刚腾讯再次放出流量大招,用户可以加微信好友“元宝”。 你可以和他对话,也可以发链接、文件给他;元宝可以无缝与用户对话,路径更短。 你甚至可以把它置顶。
4/16/2025 10:17:33 PM

突发!字节AI Lab将整体并入Seed团队!字节AI Lab消亡史全梳理:比达摩院更早,曾撑起抖音推荐神话,如今彻底退出舞台

编辑 | 李美涵出品 | 51CTO技术栈(微信号:blog51cto)据《AI科技评论》报道,字节跳动 AI Lab 将整体并入 Seed 团队,标志着这个成立已久的老牌研究院式组织,正在被一种更“扁平化”的新型研发模式彻底取代。 自 2025 年 2 月原 Google DeepMind 副总裁吴永辉加入字节以来,字节的 AI 业务陆续迎来一系列组织架构和人事上的重大调整。 原本由朱文佳独立负责的 Seed 部门,如今逐步演变为吴永辉与朱文佳分工协作的双负责人机制:朱文佳主抓模型应用方向,吴永辉则掌舵 AI 基础研究。
4/16/2025 4:45:52 PM
李美涵

AI驱动内容分享!传OpenAI和Kimi都在探索打造新型社交网络

在人工智能飞速发展的今天,AI 技术正在不断重塑我们的社交和内容分享方式。 最近,有消息称 OpenAI 正在研发一款全新的社交平台,而 Kimi 所属的月之暗面也有类似的计划。 这不仅引发了科技界的广泛关注,也为未来的社交网络发展带来了新的可能性。
4/16/2025 3:31:14 PM

视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1

语言模型的推理刚火完,视频AI也开始「卷」起来了。 这次出手的是港中文 清华组合,直接把强化学习里的R1玩法搬到了视频领域,整出了全球首个视频版R1模型:Video-R1。 别看它只有7B参数,但它在李飞飞提出的VSI-Bench基准中,竟然超越了GPT-4o!
4/16/2025 3:28:31 PM
新智元

MIT惊人神作:AI独立提出哈密顿物理!0先验知识,一天破译人类百年理论

充满想象力的MIT大牛团队,又有新作了! 大佬Max Tegmark、Ziming Liu等人在一项新研究中发现,AI能够在没有任何先验知识的情况下,能够完全独立地提出哈密顿物理量。 论文地址:,这里的AI是LNN,而非LLM。
4/16/2025 3:28:01 PM
新智元

Manus平替方案:用DeepSeek+MCP Server构建AI自主工作流

前言在AI技术日新月异的今天,我们正见证着LLM(大语言模型)从"能说会道"向"能工巧匠"的进化。 当Anthropic推出Model Context Protocol(MCP)时,它像一道闪电划破夜空——这个被称作AI界的USB-C的协议,正在重新定义人机协作的边界。 作为一个沉迷于技术探索的开发者,我始终在寻找让AI真正"落地"的方法。
4/16/2025 3:22:51 PM
后端小肥肠