应用
反超Nano Banana!OpenAI旗舰图像生成模型上线
Jay 发自 凹非寺量子位 | 公众号 QbitAIOpenAI的红色预警,还在发力。 憋了大半年的图像生成模型——GPT-Image-1.5,终于发布。 官方表示,本次更新主要有四个亮点:更严谨的指令遵循;.
Apple Music 将与 ChatGPT 实现全新集成,用户可轻松创建歌单!
近日,OpenAI 宣布,Apple Music 即将加入与 ChatGPT 的合作阵营,用户将能够通过自然语言指令,轻松创建音乐歌单。 OpenAI 的应用业务首席执行官菲吉・西莫在一篇 Substack 帖子中透露了这一消息,表示这一集成功能很快就会推出。 在过去的一年中,OpenAI 已经与多个平台进行了成功的集成,包括 Spotify、Booking.com 等。
终结AI图像“变脸”噩梦:OpenAI推出GPT Image1.5,主打精准编辑与视觉一致性
OpenAI 正在推出新一代图像生成模型 GPT Image1.5,以抗衡谷歌在人工智能领域的强势崛起。 据 AIbase 报道,这款新模型承诺带来显著的性能提升,包括更精确的指令遵循、更细致的编辑控制以及高达四倍的图像生成速度。 速度与精度升级:GPT Image1.5全面对抗谷歌GPT Image1.5已于本周二面向所有 ChatGPT 用户和 API 用户开放。
OpenAI 推出全新图像生成模型 GPT Image 1.5,性能显著提升!
OpenAI 于正式发布了其最新的图像生成模型 GPT Image1.5,标志着 ChatGPT 在视觉创作能力上的重大突破。 这一新模型不仅能够生成高保真的图像,还在理解用户指令方面表现优异,具备极强的提示词遵循能力。 新版本的 GPT Image1.5能够从零开始创作图像,或者在用户上传的照片基础上进行编辑,同时保留原图的核心要素,准确执行用户的各种指令。
微软确认:Win11 AI 智能体访问用户文件前会先请求许可
AI在线 12 月 17 日消息,微软证实,在允许人工智能智能体访问存储于六个常用文件夹(包括桌面、文档、下载、音乐、图片和视频)的文件前,Windows 11 会先征求用户的同意。 用户也可为每个智能体单独自定义文件访问权限。 外界对微软大力推进人工智能智能体深度融入 Windows 系统的担忧日益加剧。
Adobe Firefly 更新:说句话就能修改视频元素、镜头角度
AI在线 12 月 17 日消息,Adobe 正在为其人工智能视频生成应用 Firefly 推送更新,新增一款支持基于文本指令精准编辑的视频编辑器,同时引入多款用于图像和视频生成的第三方模型,其中包括 Black Forest Labs 的 FLUX.2 以及 Topaz Labs 的 Astra 模型。 在此之前,Firefly 仅支持基于文本指令的视频生成功能,若视频中某部分效果不符合预期,用户只能重新生成整个片段。 而借助这款全新的编辑器,用户可以通过文本指令对视频元素、色彩及镜头角度进行修改;同时,应用还新增了时间轴视图,便于用户轻松调整画面帧、音频及其他视频属性。
免费用:OpenAI 最强 AI 生图模型登场,奥尔特曼变身性感消防员
AI在线 12 月 17 日消息,OpenAI 昨日(12 月 16 日)发布博文,推出“全新旗舰 ChatGPT 图像生成模型”GPT Image 1.5,并罕见公开了该项目背后的庞大研发团队名单,并同步在 ChatGPT 中推出了专用的“Images”(图像)标签页。 此次更新被视为 ChatGPT 图像生成能力的重大飞跃,新模型不仅能生成高保真图像,更在“听懂人话”方面表现出色,即具备极强的提示词遵循能力。 无论是从零创作还是基于上传照片进行编辑,GPT Image 1.5 都能在保留原图核心要素的同时,精准执行用户的指令。
OpenAI 宣布:苹果 Apple Music 即将与 ChatGPT 集成
AI在线 12 月 17 日消息,很快用户就能让 ChatGPT 快速创建 Apple Music 歌单,以及完成其他各类操作了。 在今日早些时候发布的一篇 Substack 帖子中,OpenAI 应用业务首席执行官菲吉・西莫表示,Apple Music 将加入即将与 ChatGPT 实现集成的合作伙伴阵营。 AI在线注意到,去年 10 月,OpenAI 在 ChatGPT 中正式推出应用功能,首批合作与集成的平台包括 Spotify、Booking.com、Canva、Coursera、Figma、Expedia 和 Zillow。
设计师会被 AI 取代?看懂这个“人机协同”工作流,你的焦虑减半!
前言. 当AI能一键生成界面、自动分析数据,设计师的核心工作是会被取代,还是被重新定义? 我们认为,真正的变化并非替代,而是分工的进化。
资讯/神器/素材全都有!2025年12月设计素材周刊第三波
往期回顾:一、设计资讯. Figma 新增「图像功能」. 最近 Figma 上线了全新的 AI 图像编辑工具,全部集中在一个上下文工具栏中扩展图像— 将图像扩展到其原始边界之外.
小米网页 AI 聊天服务上线,MiMo-V2-Flash 模型官宣“代码能力超过所有开源模型”
AI在线 12 月 16 日消息,小米今日发布 Xiaomi MiMo-V2-Flash 开源 MoE 模型,总参数量 309B,活跃参数量 15B,专为智能体 AI 设计,专注于快。 小米官方介绍称,这是一个专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型,通过 Hybrid 注意力架构创新及多层 MTP 推理加速,在多个 Agent 测评基准上保持进入全球开源模型 Top 2;代码能力超过所有开源模型,比肩标杆闭源模型 Claude 4.5 Sonnet,但推理成本仅为其 2.5%,生成速度提升 2 倍。 Xiaomi MiMo-V2-Flash 采用 1:5 的 Global Attention 与 Sliding Window Attention (SWA) 混合结构,128 窗口大小,原生 32K 外扩 256K 训练。
豆包手机:首批货源已售罄,此前行业内传闻的备货数量均不准确
AI在线 12 月 16 日消息,豆包手机助手官方今日发布声明称,豆包手机助手发布后,受到了社会各界的广泛关注,大家的热情超乎我们的想象。 原本我们合作方 nubia 基于技术预览少量备货生产的 nubia M153 手机,目前已经完全无法满足已申请的 F 码需求。 官方表示,F 码的申请已经停止,已经领取到 F 码的朋友请在有效期内尽快完成下单,我们会尽快协调发货。
字节跳动发布 Seedance 1.5 pro 模型,支持音视频联合生成
AI在线 12 月 16 日消息,字节跳动 Seed 今日发布了新一代音视频创作模型 Seedance 1.5 pro。 Seedance 1.5 pro 支持音视频联合生成,它能够执行多种任务,包括从文本到音视频的合成以及图像引导的音视频生成等。 至此,Seedance 视频生成不再局限于视觉维度,而是自然融合了声音。
QQ音乐你变了,竟能免费在AI PC上原创一首《大东北》
金磊 发自 凹非寺. 量子位 | 公众号 QbitAI你的QQ音乐还是只能用来听歌吗? 请注意,它现在已经有了另一种“打开方式”——AI作歌。
企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了
衡宇 发自 凹非寺. 量子位 | 公众号 QbitAI最近和几家公司的技术负责人闲聊,兜兜转转都会聊到Agent话题。 给出的反馈几乎一致:智能体确实已经嵌进了不少工作流,但实际水平,最好也就是个实习生水平。
豆包 AI 手机恢复销售,重启 F 码候补申请通道
AI在线 12 月 16 日消息,根据中兴商城官网显示,豆包手机助手及合作机型 nubia M153 目前已重启 F 码候补申请通道,正式恢复产品购买资格。 据 nubiaM153 F 码发放前置信息收集表显示,此次开放的为 F 码排队候补申请,仅有少量名额且无扩大生产计划,将优先面向此前未购买到该机型的爱好者。 需注意的是,已购买产品、已申领 F 码未下单、取消订单或办理退货的用户不可重复申领,且候补申请不承诺必然获得 F 码,后续将根据问卷填写情况筛选发放。
50万个AI生成的应用,正在赚钱
西风 发自 凹非寺. 量子位 | 公众号 QbitAI用零手写代码、零成本、零部署压力的“三无”AI生成应用,把Prompt换成真金白银的第一批“野生开发者”已经出现了。 而且这样的创作者还真不少,他们甚至已经造出了50万个商业应用,覆盖教育、商业、内容生产、企业服务等200多个细分领域,累计服务超1000万用户,撬动经济与效率价值超50亿元。
全球首个情感交互人形机器人“爱湫-AIQ”亮相,全国首创 3D 超短焦投影面部
AI在线 12 月 16 日消息,四川具身人形机器人科技有限公司今日公布了全球首个主打情感交互的人形机器人“爱湫-AIQ”。 该机器人采用基于西南特有保护物种龙蜥设计的机器人独特外形,依托四川省人形机器人训练场,研发全球首个“情感-语言-动作”大模型(AI在线注:ELA,Emotion-Language-Action),并将结合自研多模态情感计算引擎,构建情绪感知与交互决策能力。 该系统可综合感知语音、表情等多维信号,识别交流对象的情绪变化,并生成相匹配的语言与肢体回应,面向真实场景中的人际沟通需求,提升交互理解的准确性、回应的适配性以及长期陪伴的稳定性。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉