理论
自回归模型杀回图像生成!实现像素级精准控制,比Diffusion更高效可控
当下的AI图像生成领域,Diffusion模型无疑是绝对的王者,但在精准控制上却常常“心有余而力不足”。 在精确视觉控制、平衡多模态输入以及高昂的训练成本方面仍面临挑战。 有没有一种更高效、控制更精准的范式?
7/30/2025 1:00:00 AM
“AI搭子”是否会替代传统组织形式,AI Agent原生是否会成为企业新的存在的方式?
十年前互联网变革时《浪潮之巅》《必然》《个体崛起》的启示还记忆犹新,今天,网红搭子、直播带货、短视频,就已经切切实实地在生活中常态化了。 可以看到,这些新兴产业形态背后,是一个个为了同一目标,动态组队的个体。 这也刚好印证了《个体崛起》一书的预言:互联网时代,个人正在从组织中分裂出来,未来社会经济的基本单元不再是企业,而是个体。
7/30/2025 12:02:00 AM
GMI Cloud 于 WAIC 2025 展现全栈 AI 基建实力,破解出海成本与效率难题
2025 年世界人工智能大会(WAIC)于 7 月 26 日至 29 日在上海世博展览馆盛大开展,全球领先的 AI Native Cloud 服务商 GMI Cloud 在此次大会上精彩亮相。 作为全球六大 Reference Platform NVIDIA Cloud Partner 之一,GMI Cloud 携全栈产品矩阵、创新工具及前沿技术成果,在 H1 核心技术馆 A122 展位及 H4 FUTURE TECH 创新企业展区,通过产品展示、技术体验、专家分享、跨界互动等多元形式,与全球开发者、AI 企业及生态伙伴共探 AI 算力新未来,成为展会焦点之一。 在本次大会上,GMI Cloud 集中展示了三大核心产品,为观众打造了沉浸式的 AI 基础设施交互体验。
7/29/2025 6:07:22 PM
云昭
又一国产最强!GLM4.5正式开源,真实测,全栈开发能力封神,免费可玩。对话刘昊然:南京照相馆PPT着实震撼!智谱背后技术公开了
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)今天凌晨,智谱新开源了自家的最强模型 GLM 4.5。 从官方发布了的博客看,这次发布聚焦在了三项能力:推理、coding 和 Agentic 任务。 圈里一些朋友反馈看,说它拿下了新一轮的卷王宝座,小编反而觉得 GLM 这次发布没那么简单,有几项新的功能,可以说市面上仅此一家。
7/29/2025 4:01:45 PM
云昭
掌控 AI 智能体自主性:五级框架下的人机协作之道
大家好,我是肆〇柒,在AI飞速发展的时代,AI 智能体自主性已成为一个备受瞩目的焦点。 一方面,它能够为我们带来前所未有的创新应用,极大提升工作效率和生活便利性;另一方面,若不当使用,也可能引发一系列难以预料的风险。 随着大型语言模型(LLM)等前沿 AI 技术的飞速进步,AI 智能体的自主性不再是停留在科幻小说中的情节,它已逐渐走进现实,引起了大家的广泛关注和深入探讨。
7/29/2025 9:24:21 AM
肆零柒
30,000个AI代理同时在线!清华团队开源社会模拟项目,速度超越现实时间
一个明显的趋势是,AI正在从单一的对话工具,演化成能够模拟整个社会的复杂系统。 昨天看到清华大学团队发布的AgentSociety项目,我承认被震撼了。 30,000个AI代理同时在线,互相聊天、工作、社交、恋爱,甚至还会产生社会极化现象。
7/29/2025 9:20:45 AM
阿丸笔记
AI智能问答背后的工程,从一句问题到精准回答的全流程揭秘
周末晚上,我对着家里的智能音箱说:"小爱,明天深圳的天气怎么样? " 小爱立刻回答:"明天深圳台风天,气温25到28度,建议您带件薄外套。 " 这个过程看似简单,实则暗藏玄机。
7/29/2025 9:12:38 AM
阿里开源电影级AI视频模型!MoE架构,5B版本消费级显卡可跑
电影级视频生成模型来了。 来自阿里,来自通义——通义万相Wan2.2。 并且率先将MoE架构实现到了视频生成扩散模型中,能够实现电影级效果。
7/29/2025 9:12:00 AM
抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025
在人工智能模型规模持续扩大的今天,数据集蒸馏(Dataset Distillation,DD)方法能够通过使用更少的数据,达到接近完整数据的训练效果,提升模型训练效率,降低训练成本。 但是,通过数据集蒸馏训练的模型,要在安全性要求比较高的任务中(如医疗诊断、自动驾驶),实现不受干扰并保持性能效果,还有一定难度。 来自北京航空航天大学、上海人工智能实验室和英国利物浦大学的研究团队,提出了名为ROME的新方法,这是首次将信息瓶颈理论引入数据集蒸馏任务。
7/29/2025 9:10:00 AM
毕树超入职Meta后首发声:十年前怀疑AGI,如今深信AGI已至!
加入Meta超级智能实验室后,毕树超首次发声:大多数人可能低估了AI的影响! 十年前,他非常怀疑AGI,但在过去十年中,他逐渐接受了AGI,日渐笃定,甚至宣称:2025,AGI已来。 上个月,他在哥伦比亚大学和哈佛大学就人工智能发表了两次演讲。
7/29/2025 9:07:00 AM
Spring AI 框架中如何集成 MCP?
SpringAI MCP介绍Spring AI MCP 为模型上下文协议提供 Java 和Spring 框架集成、它使 SpringAI 应用程序能够通过标准化的接口与不同的数据源和工是进行交互,支持同步和异步通信模式。 整体架构如下:图片Spring Al 通过以下 Spring Boot 启动器提供 MCP 集成:客户端启动器spring-ai-starter-mcp-client 核心启动器提供 STDIO 和基于 HTTP 的 SSE 支持。
7/29/2025 9:06:29 AM
Seven
自主式AI如何颠覆营销技术决策规则
要点概述:• 旧规则失效。 传统的基于规则的系统缺乏学习或适应能力,限制了实时营销中的决策制定。 • 分析技术陷入瓶颈。
7/29/2025 7:07:00 AM
Jonathan
UPS运用数据与AI技术革新航空货运业务的实战经验
数字资产追踪和先进通信技术正助力全球航运公司UPS在其全球航空枢纽Worldport利用AI和机器学习技术,以降低成本、提升准时率、增强运营安全性,并提供更优质的客户体验。 UPS的全球航空枢纽Worldport,使肯塔基州路易斯维尔市的路易斯维尔·穆罕默德·阿里国际机场成为美国第三繁忙的货运机场,这座占地520万平方英尺的设施拥有逾2万名员工、580架飞机(其中290架为大型UPS喷气式货机),每小时可处理约41.6万件包裹。 “这里的运营强度非常大。
7/29/2025 7:00:00 AM
Thor Olavsrud
人类在被大语言模型“反向图灵测试”
2018 年,我曾在《深度学习》一书中,讲述了人工智能从逻辑运算模型向类脑计算模型转变的历程。 回想 20 世纪 80 年代深度学习算法刚被发明时,计算机性能仅及今日的百万分之一。 那时的我们无法预知,当这些算法随着规模扩大和数据增加会具备怎样的能力。
7/29/2025 2:55:00 AM
只需一次指令微调,大模型变身全能专家天团,8B模型性能反超全微调基线 | ACL25 Oral
只需一次指令微调,即可让普通大模型变身“全能专家天团”? 改造位置自动定位专家协作动态平衡8B模型性能反超全微调基线1.6%,安全指标暴涨10%,推理内存直降30%! 图片当前预训练语言大模型(LLM)虽具备通用能力,但适应专业领域需高昂的指令微调成本;稀疏混合专家(SMoE)架构作为可扩展的性能-效率平衡框架,虽能提升推理效率并灵活扩展模型容量,但其从头训练消耗巨大资源,因此复用密集大模型参数的升级改造(LLM Upcycling)成为更具成本效益的替代方案。
7/29/2025 2:12:00 AM
LLM记忆终极指南:从上下文窗口到高级智能体记忆系统
当你向聊天机器人报上姓名,片刻后它却再次询问"你叫什么"时,这种数字失忆现象暴露出人工智能的关键短板:大型语言模型(LLMs)本质上是无状态的。 它们像金鱼一样"记不住"过去的对话,每次交互都被视为全新事件。 ChatGPT等应用展现的记忆能力,实则是通过在每轮对话中强行插入历史记录制造的 illusion(假象)。
7/29/2025 12:00:00 AM
大模型之路
GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞
传闻称,GPT-5的发布时间提前了,预计在本月底面世。 图片网友爆料,GPT-5共有4个版本:GPT-5-pro(zenith) GPT-5-high(summit) GPT-5-mini GPT-5-nano(starfish)图片周六,网友们提前放出了一些,OpenAI开源模型——代号为「lobster」的实测。 图片今天,更多关于GPT-5多个版本惊艳demo公开了。
7/28/2025 6:07:12 PM
新智元
拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star
搞Agent开发也有开源一条龙了! 这不,扣子的两款子产品已于近期正式开源:扣子开发平台(Coze Studio)和扣子罗盘(Coze Loop)。 才过了一个周末,两个项目就拿下了9K Star~再加上此前已经开源的开发框架Eino,扣子这是把Agent从开发、评测到运维的完整链路,全都打包开源了,堪称一步到位。
7/28/2025 6:06:04 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉