理论
揭秘大模型的魔法:从零开始你的AI冒险
你好,我是写代码的中年人! 你有没有想过,那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事? 它们其实是“大型语言模型”(Large Language Models,简称 LLM)的产物。
4/17/2025 9:00:00 AM
写代码的中年人
OpenAI深夜发布满血o3和o4mini: 两个没想到
OpenAI刚刚宣布推出其最新的o系列模型:o3和o4-mini,与以往模型不同,o3和o4-mini被设计为真正的AI系统,模型甚至能连续调用超过600次工具来完成一项艰巨任务,它们在理解和导航大型代码库(比如OpenAI自己的代码库)方面,超越了人类工程师,极大地提高了开发效率这次发布会我有两个没想到:一是没想到o系列模型变成了一个融合的模型,另外一个是引入图像推理“Thinking with Images”,下面第一时间给大家划个重点全面工具访问与推理能力o3和o4-mini最显著的特点是首次实现了对ChatGPT内所有工具的智能使用和组合能力。 它们可以搜索网络、分析上传的文件、处理视觉输入、生成图像,并且能够智能地判断何时以及如何使用这些工具来解决复杂问题。 这些模型经过专门训练,能够在大约一分钟内提供详细且经过深思熟虑的答案,以适当的输出格式解决多方面的问题o3,o4mini性能OpenAI o3是目前最强大的推理模型,在编程、数学、科学、视觉感知等领域推动了技术边界。
4/17/2025 8:59:59 AM
AI寒武纪
围绕多智能体黑箱非凸优化共识难题,华南理工大学团队发表系列研究
多智能体系统分布式共识优化的一系列研究来了! 在智能城市、智能电网、无人系统等前沿应用不断扩展的今天,多智能体系统(Multi-Agent Systems, MAS)作为新一代智能协同的技术基础,正迎来前所未有的发展机遇。 在这些系统中,多个具备计算与通信能力的智能体需要在没有中心协调、通信受限的条件下实现任务协作、资源共享与一致性决策。
4/17/2025 8:55:24 AM
量子位
全网最全「吉卜力」AI神器总结!只要2分钟,照片秒变吉卜力
创建吉卜力风格的图像,现在很流行。 甚至还可以根据图像,生成吉卜力动画:「神秘的微笑」蒙娜丽莎,都会主动和你打招呼! 但是,97%的人可能不知道如何创建它们。
4/17/2025 8:51:20 AM
新智元
开发者值得关注的六大AI调试工具
译者 | 核子可乐审校 | 重楼AI驱动的调试工具正在颠覆开发者识别、诊断和修复代码问题的方式。 这些工具利用机器学习和AI技术自动化传统调试流程,节省时间并提高代码质量。 本文将带大家了解六大最受欢迎的AI调试工具及其核心功能、所需技能和比较优势。
4/17/2025 8:36:30 AM
核子可乐
ChatGPT首次带图深度思考:OpenAI连发o3/o4 mini,比前代性能更强价格更低
仅隔一天,OpenAI再次突然放大招:一口气,o3和o4 mini同步上线。 图片依然是最热门推理模型,并且这一次,它们终于能够调用ChatGPT里的各种工具了,包括网络搜索、Python、图像分析、文件解释和图像生成。 也就是说,你现在可以也用o3来生成吉卜力风格的奥特曼抱子图了(doge)。
4/17/2025 7:23:10 AM
五个强大的AI提示词,可助力任何商业创意
你已经有了一个很棒的商业想法,这是一个开始,但要将它付诸实践还有大量工作要做。 幸运的是,在这个领域,GenAI可以发挥极大的帮助作用,它虽然不会为你提供万无一失的策略,但它可以帮助你进行商业计划的头脑风暴、研究市场和微调营销内容和信息。 不过,这并不是简单地将你的指令输入ChatGPT,然后指望它为你完成所有艰苦的工作。
4/17/2025 7:00:00 AM
Bernard Marr
大半精锐尽出!o1下线!满血o3之后,模型本身就是Manus,最大卖点:替代人干真活!OpenAI自家多模态推理技术思路也公开了
编辑 | 云昭4月17日凌晨1点,一半OpenAI的模型精锐都出来秀肌肉了! 凌晨一点,OpenAI派出了8位新老大将齐聚今晚的直播间,一起解说OpenAI新发布的目前OpenAI最为强大、最为智能的模型:满血o3和o4-mini! 可以说这次发布的重点和卖点就是:实用价值(真能代替你干活)!
4/17/2025 6:36:29 AM
云昭
OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表
不出所料,满血版o3真的来了。 刚刚,OpenAI联创Greg Brockman和首席研究官Mark Chen带队,开启了20分钟线上直播。 这次不仅有o3,还有下一代推理模型o4-mini。
4/17/2025 6:10:57 AM
新智元
奥特曼出席TED 2025:年度最令人不安且最重要的AI采访
“我从未见过任何公司有这样的增长,无论是我参与过的还是没有参与过的,”奥特曼在与TED大会主持人克里斯·安德森(Chris . Anderson)的台上对话中表示。 “ChatGPT的增长——真的很有趣,我深感荣幸,但经历这一切也很疯狂,我们的团队已经筋疲力尽,压力重重。
4/17/2025 5:00:00 AM
Michael
多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
能处理任意条件组合的新生成框架来了! 复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine,一种基于DiT的多条件可控生成框架,能够处理包括但不限于文本提示、空间映射和主体图像在内的任意控制条件的任意组合,并保持高度的一致性和出色的和谐性。 具体效果be like:图片据了解,现有的多条件可控生成框架或是只能处理单一种类的多个条件,或是只适用于某种特定的多类别组合,从而普遍缺乏通用性的多类别 多条件的组合式生成能力。
4/17/2025 2:55:00 AM
Dify+RAGFLow:基于占位符的图片问答升级方案
4/2 号时写了一篇 RAGFlow 实现图片问答的原理解析,后续在知识星球内有星友陆续反馈在使用我提供的源码复现时,会出现知识库中能渲染图片,但回答中图片无法正常加载的问题。 知识库预览和引用文件部分是直接展示原始数据或进行简单渲染,它们能正确显示图片,证明原始上传的增强文本中的 URL 是正确的,并且图片服务器和网络配置是通的,问题出在聊天内容生成这个环节。 我当时提供了三种选择选择,分别是:更强的 prompt 指令、更强的 LLM 和”占位符 后处理“的方案,鉴于后续大家反馈前两种效果依然不够稳定,这篇我来系统的分享下如何实现第三种更符合实际生产场景的 RAG 富文本处理方案。
4/17/2025 1:00:00 AM
韦东东
突然的大招!刚刚,腾讯元宝直接成为微信好友,腾讯找到了新希望!
继微信接入 DeepSeek 之后,刚刚腾讯再次放出流量大招,用户可以加微信好友“元宝”。 你可以和他对话,也可以发链接、文件给他;元宝可以无缝与用户对话,路径更短。 你甚至可以把它置顶。
4/16/2025 10:17:33 PM
突发!字节AI Lab将整体并入Seed团队!字节AI Lab消亡史全梳理:比达摩院更早,曾撑起抖音推荐神话,如今彻底退出舞台
编辑 | 李美涵出品 | 51CTO技术栈(微信号:blog51cto)据《AI科技评论》报道,字节跳动 AI Lab 将整体并入 Seed 团队,标志着这个成立已久的老牌研究院式组织,正在被一种更“扁平化”的新型研发模式彻底取代。 自 2025 年 2 月原 Google DeepMind 副总裁吴永辉加入字节以来,字节的 AI 业务陆续迎来一系列组织架构和人事上的重大调整。 原本由朱文佳独立负责的 Seed 部门,如今逐步演变为吴永辉与朱文佳分工协作的双负责人机制:朱文佳主抓模型应用方向,吴永辉则掌舵 AI 基础研究。
4/16/2025 4:45:52 PM
李美涵
AI驱动内容分享!传OpenAI和Kimi都在探索打造新型社交网络
在人工智能飞速发展的今天,AI 技术正在不断重塑我们的社交和内容分享方式。 最近,有消息称 OpenAI 正在研发一款全新的社交平台,而 Kimi 所属的月之暗面也有类似的计划。 这不仅引发了科技界的广泛关注,也为未来的社交网络发展带来了新的可能性。
4/16/2025 3:31:14 PM
视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1
语言模型的推理刚火完,视频AI也开始「卷」起来了。 这次出手的是港中文 清华组合,直接把强化学习里的R1玩法搬到了视频领域,整出了全球首个视频版R1模型:Video-R1。 别看它只有7B参数,但它在李飞飞提出的VSI-Bench基准中,竟然超越了GPT-4o!
4/16/2025 3:28:31 PM
新智元
MIT惊人神作:AI独立提出哈密顿物理!0先验知识,一天破译人类百年理论
充满想象力的MIT大牛团队,又有新作了! 大佬Max Tegmark、Ziming Liu等人在一项新研究中发现,AI能够在没有任何先验知识的情况下,能够完全独立地提出哈密顿物理量。 论文地址:,这里的AI是LNN,而非LLM。
4/16/2025 3:28:01 PM
新智元
Manus平替方案:用DeepSeek+MCP Server构建AI自主工作流
前言在AI技术日新月异的今天,我们正见证着LLM(大语言模型)从"能说会道"向"能工巧匠"的进化。 当Anthropic推出Model Context Protocol(MCP)时,它像一道闪电划破夜空——这个被称作AI界的USB-C的协议,正在重新定义人机协作的边界。 作为一个沉迷于技术探索的开发者,我始终在寻找让AI真正"落地"的方法。
4/16/2025 3:22:51 PM
后端小肥肠
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind