资讯列表
不再滚动翻找:ChatGPT AI 可置顶聊天,让重要信息触手可及
AI在线 12 月 19 日消息,OpenAI 公司今天(12 月 19 日)发布推文,宣布 iOS、Android 及网页端 AI 聊天机器人 ChatGPT 即日起上线“聊天置顶”(Pinned Chats)功能,目前已陆续向全球用户推送。 ChatGPT 此前虽然具备根据对话内容自动生成标题的智能标记功能,但在实际使用场景中,随着对话数量的不断累积,旧有的重要对话很容易被淹没在无穷无尽的新对话流中。 用户往往需要花费大量时间滚动屏幕,才能找回之前的关键讨论。
苹果全能视觉 AI 模型 UniGen 1.5 亮相,看图、修图、绘图三合一
AI在线 12 月 19 日消息,科技媒体 9to5Mac 昨日(12 月 18 日)发布博文,报道称苹果研究团队近日发布多模态 AI 模型 UniGen 1.5,成功在单一系统中集成了图像理解、生成与编辑三大核心功能。 与主要依赖不同模型分别处理任务的传统方案不同,UniGen 1.5 最大的突破在于构建了一个统一的框架,仅凭一个模型即可同时完成图像理解、图像生成以及图像编辑任务。 研究人员认为,这种统一架构能让模型利用强大的图像理解能力反哺生成效果,从而实现更精准的视觉输出。
OpenAI 最强智能体编程模型 GPT-5.2-Codex 登场:AI 写代码新巅峰,优化 Win11 原生环境
AI在线 12 月 19 日消息,OpenAI 今天(12 月 19 日)发布公告,宣布推出 GPT-5.2-Codex,是其迄今最前沿、最先进的智能体编程 AI 模型,专为解决复杂的现实软件工程问题训练设计。 该模型在 GPT-5.2 的通用智能基础上,融合了 GPT-5.1-Codex-Max 的终端操作能力,其核心突破在于引入了“上下文压缩”技术,让其在处理代码重构、迁移等长程任务时效率倍增。 针对开发者的实际工作环境,GPT-5.2-Codex 显著增强了在 Windows 10、Windows 11 原生环境下的智能体编码可靠性。
封神还是踩坑?设计师实测 Nano/即梦/豆包3个常用生图平台
作为设计师,每天都在和各种 AI 绘图工具打交道。 最近看到讨论最多的就是:“Nano Banana Pro 商用真的稳不翻车? 即梦 AI 的光影效果到底神不神?
实测阿里万相 2.6:一张图生成15秒分镜大片,还有角色扮演功能!
更多实测:嗨大家好! 我是阿真! 抢到首发了!
150分钟,有关AGI的一切,柴天佑院士、何小鹏给出答案
2025年,人工智能领域迎来一系列密集突破。 1月,DeepSeek R1横空出世,以高效推理和开源策略引爆全球关注;春节期间,宇树机器人亮相央视春晚,将具身智能推向公众视野;3 月前后,一些中国公司在智能体方向集中引发关注:AI 智能体 Manus 走热,Lovart 等创作型智能体进入设计工作流,智能体开始被视为具备结果交付能力的生产力。 下半年的发展节奏也进一步提速:Claude 4、Gemini 3相继刷新能力边界, Nano Banana和Sora 2 上线并迅速出圈,生成式图片和视频创作领域迎来集中爆发。
被指在 AI 训练中滥用盗版书籍,Adobe 面临集体诉讼
AI在线 12 月 18 日消息,据外媒 TechCrunch 今日报道,一项由作家 Elizabeth Lyon 发起的集体诉讼对 Adobe 发出新的指控,称对方在训练 SlimLM 语言模型时,使用了包括 Lyon 本人的作品在内的大量盗版书籍。 Lyon 来自俄勒冈州,长期从事非虚构写作,并出版多本写作指导类书籍。 Adobe 方面介绍,SlimLM 是一套面向移动设备文档辅助场景的小语言模型,其预训练基础为 SlimPajama-627B 数据集。
不卖「工具」卖「生产力」,百融云创如何用「硅基员工」打破AI落地僵局?
编辑|Youli年初,围绕着 2025 年将是「大模型落地应用元年」「AI Agent 元年」的共识,业界开始了大规模持续探索。 如今临近年尾,回过头来看,从高度标准化的客服对话、代码生成到流程化文档处理,Agent 在越来越多的企业中成功完成从概念验证到初步部署的落地实践。 这不仅证明了技术的可行性,也展现了 AI 在提升效率、优化流程的价值所在。
与Physical Intelligence同日发声:深度机智亮出「情境数采」杀手锏,具身智能的通用性天花板要被捅破了?
机器之心发布具身智能通往通用性的征途,正被 “数据荒漠” 所阻隔。 当模型在模拟器中刷出高分,却在现实复杂场景中频频 “炸机” 时,行业开始反思:我们喂给机器人的数据,是否真的包含人类操作的精髓? 近日,深度机智在以人类第一视角为代表的真实情境数据,筑牢物理智能基座,解决具身智能通用性难题的道路上又有重要举措。
SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人
在计算机图形学、三维视觉、虚拟人、XR 领域,SIGGRAPH 是毫无争议的 “天花板级会议”。 SIGGRAPH Asia 作为 SIGGRAPH 系列两大主会之一,每年只接收全球最顶尖研究团队的成果稿件,代表着学术与工业界的最高研究水平与最前沿技术趋势。 我们是淘宝技术 - Meta 技术团队,在 3D、XR、3D 真人数字人和三维重建等方向拥有深厚的技术积累和业务沉淀,我们自研了专业的多视角拍摄影棚,在今年 CVPR 2025 会议上作为 Highlight Paper 发表了 TaoAvatar ,并在淘宝未来旗舰店中实现了业内首个 3D 真人导购体验,下面视频展示了杭州西溪园区 C 区淘宝未来旗舰店的精彩瞬间,欢迎大家到来访园区进行体验。
火山引擎相关人士回应“豆包比价”是否会提高字节产品权重:不会
AI在线 12 月 18 日消息,据搜狐科技,在今天的火山引擎 FORCE 原动力大会后,火山引擎相关人士对“豆包大模型在调用 App 的时候是否会提高字节产品权重”作出回应:“不会提高字节产品权重,AI 完全基于用户指令执行任务。 ”这名相关人士以豆包手机的演示 demo 为例解释说:“豆包手机助手的发布视频中,比价结果选择的是拼多多。 都是 AI 比出来的,没有人为干预。
火山引擎总裁谭待:大模型市场未来将迎十倍增长
在 FORCE 原动力大会上,火山引擎总裁谭待在接受媒体采访时,对公司旗下豆包大模型的表现做出了积极评价。 他指出,尽管在国内市场上,豆包大模型的成绩相对明显,但在全球范围内,如 OpenAI 和 Gemini 等竞争对手的表现同样突出。 因此,火山引擎在这一领域还有很多努力的空间,尤其是在全球市场的拓展上,谭待提到公司旗下的 Seedance 和 Seedream 在国际市场上的表现也不错。
工业具身新标杆:人形机器人“小墨”规模化入驻宁德时代产线
近日具身智能领域迎来重大里程碑:全球首条实现人形机器人规模化落地的新能源动力电池 PACK 生产线,在宁德时代中州基地正式投运。 由宁德时代生态企业 千寻智能 研发的人形机器人“小墨”已批量上岗,专门负责电池包下线前最具挑战性的 EOL(最终功能测试)与 DCR(直流内阻测试)工序。 这一环节长期以来因涉及数百伏高压插接操作、环境复杂且柔性要求极高而高度依赖人工,而“小墨”的引入不仅彻底消除了高压打火带来的安全风险,更将单日工作量提升了三倍,插接成功率稳定在99% 以上。
国产大模型集体冲刺IPO!MiniMax、智谱、壁仞科技均通过港交所聆讯,资本市场迎来“AI六小龙”上市潮
国产大模型企业正加速迈入资本市场的聚光灯下。 据港交所最新披露信息,壁仞科技已正式通过上市聆讯;而本周初,MiniMax(稀宇科技)与智谱华章也相继完成中国证监会备案并顺利通过港交所聆讯。 这意味着,“大模型六小龙”中的多家头部企业已实质性进入IPO倒计时,中国AI产业正式迎来资本化关键拐点。
Google Labs 放大招!AI 助理 CC 正式亮相:每天早上自动发邮件,帮你把 Gmail、Calendar、Drive 全盘打理好!
Google Labs 今日低调推出了一款代号为“CC”的全新 AI 邮件助理(实验性功能),它不是简单的 Gmail 智能回复,而是真正能在 Gmail、日历(Calendar)和云端硬盘(Drive)之间自由穿梭的“全能生活助理”。 每天早上自动为你写一封“人生提醒信” CC 最吸睛的特性是:每天早晨,你打开 Gmail 收件箱,就能看到一封来自 CC 的个性化早间邮件,内容堪称“懂你到骨子里”:- 今天上午10点有一个重要会议 - 下午需要回复某位客户的邮件 - Drive 里的项目报告还差你的签字 - 昨天那封没回的邮件我已经整理好,随时回复……一封邮件搞定全天待办,再也不用打开十几个标签页、翻遍备忘录、来回切换 App。 核心能力:跨应用深度理解与主动提醒 - 自动梳理待办:实时扫描日历事件、未读邮件、Drive 文件修改记录,精准提炼出“今天最重要的事”。
亚马逊任命长期 AWS 高管彼得・德桑提斯领导新 AI 组织
在亚马逊公司最新的消息中,首席执行官安迪・贾西宣布,长期担任 AWS 高管的彼得・德桑提斯将负责公司新成立的人工智能(AI)组织。 这个新的组织将专注于亚马逊的 AI 模型,如 Nova,以及硅片开发和量子计算,旨在提升 AI 工具的速度和效率。 彼得・德桑提斯在亚马逊工作了27年,其中有8年担任 AWS 的高级副总裁。
美团开源虚拟人视频生成模型 LongCat-Video-Avatar:号称“不说话”时都像人
AI在线 12 月 18 日消息,据“龙猫 LongCat”公众号今晚的推文,美团 LongCat 团队正式发布并开源 SOTA 级虚拟人视频生成模型 ——LongCat-Video-Avatar。 该模型基于 LongCat-Video 基座打造,延续“一个模型支持多任务”的核心设计,原生支持 Audio-Text-to-Video、Audio-Text-Image-to-Video 及视频续写等核心功能,同时在底层架构上全面升级,实现动作拟真度、长视频稳定性与身份一致性三大维度的突破。 据官方介绍,该模型具备如下技术亮点。
图片一键变身高精度 3D 模型,微软开源最新 AI 工具 TRELLIS.2
AI在线 12 月 18 日消息,日前,微软开源了最新的 AI 工具 ——TRELLIS.2,根据页面介绍,TRELLIS.2 是一个大型 3D 生成模型,具备 40 亿参数,专为高保真图像到 3D 生成而设计。 其构建于原生 3D VAE 之上,可生成高达 1536³ PBR 纹理资产,具有 16 倍空间压缩,可实现高效、可扩展、高保真资产生成。 AI在线从介绍获悉,该模型利用一种被称为 O-Voxel 的全新“无场”稀疏体素结构,,来重建和生成具有复杂拓扑、锐利特征和完整 PBR 材质的任意 3D 资产。