AI在线 AI在线

重磅消息回顾!2025年11月值得关注的8条AI资讯

往期回顾:一、AI秒级生成3D场景! 厦大x腾讯开源FlashWorld. 近日,AI为3D内容生成领域又迎来了一项突破性进展。

重磅消息回顾!2025年11月值得关注的8条AI资讯

往期回顾:

一、AI秒级生成3D场景!厦大x腾讯开源FlashWorld

近日,AI为3D内容生成领域又迎来了一项突破性进展。厦门大学与腾讯联合研发的FlashWorld模型横空出世,仅凭单张图片或一段文字,就能在5-10秒内生成高质量3D场景,速度较以往提升10到100倍,同时渲染质量更加惊艳。

这项研究的问世,或许意味着我们离那个“人人都能快速创造3D世界”的时代又近了一步。

开源地址:https://imlixinyang.github.io/FlashWorld-Project-Page/

重磅消息回顾!2025年11月值得关注的8条AI资讯

二、南洋理工&腾讯ARC:分钟级实时生成突破

近日,南洋理工大学&腾讯ARC实验室:合作研发RollingForcing技术,通过联合去噪、注意力池、高效训练策略,单GPU实现分钟级实时长视频生成,解决误差累积问题,生成视频质量高。Rolling Forcing成功突破了实时长视频生成的不可能三角,在保持16 fps实时生成速度的同时,显著降低了长序列生成中的误差累积,实现了分钟级别的高质量视频流生成,为交互式世界模型、神经游戏引擎等应用提供了基础。

官方介绍:https://github.com/TencentARC/RollingForcing

重磅消息回顾!2025年11月值得关注的8条AI资讯

三、Lovart平台上线“编辑元素”新功能

近日,针对海外市场的AI设计平台Lovart宣布上线新功能“编辑元素”,能够将图片中的不同元素自动分离独立图层,并灵活调整细节。

这一更新也解决了AI生图“难以局部修改”的常见痛点,Lovart的“编辑元素”功能,能够像PS分图层一样,自动识别生成图片中的各个元素,并将其拆分为独立图层。每个图层均可单独编辑并保存,且修改某一元素时不会干扰其他部分,大大提升了控制的精细度。

重磅消息回顾!2025年11月值得关注的8条AI资讯

四、OpenAI发布GPT-5.1,智商情商双提升

11月12日,OpenAl正式官宣推出新一代旗舰模型GPT-5.1系列,官方表示此次升级旨在“让ChatGPT更智能,对话体验更有趣”。

此次发布距上一代GPT-5仅数月时间,此前GPT-5因缺乏“人味”、“刻板而缺乏创造力”引发用户争议,而GPT-5.1则实现了智能水平与沟通风格的双重升级。

OpenAI公司CEO萨姆•奥尔特曼表示,GPT-5.1升级给力,尤其是指令遵循和自适应思考的改进,整体的智力和沟通风格提升也很显著。

重磅消息回顾!2025年11月值得关注的8条AI资讯

五、谷歌“嵌套学习”突破LLM遗忘瓶颈

近日,谷歌推出了一种全新的用于持续学习的机器学习范式——嵌套学习,模型不再采用静态的训练周期,而是以不同的更新速度在嵌套层中进行学习,即将模型视为一系列嵌套问题的堆叠,使其能够不断学习新技能,同时又不会遗忘旧技能。

这或将标志着人工智能朝着「真正像大脑一样进化的方向」迈出了一大步。嵌套学习代表了谷歌对深度学习理解迈进了新阶段,通过将架构与优化视为统一的、层次化的优化系统,打开了一个全新的设计维度。

重磅消息回顾!2025年11月值得关注的8条AI资讯

六、英伟达发布OmniVinci全模态大模型

近日,英伟达(NVIDIA)开源了OmniVinci,一款能理解多模态世界的全模态大语言模型(Omni-Modal LLM)。

该模型实现了视觉、音频、语言在同一潜空间 (latent space)中的统一理解,让AI不仅能识别图像、听懂语音,还能推理、对话、生成内容。

这个9B的视觉-语音理解全模态模型刚上线就爆火,Huggingface模型权重目前已经有超过10000次下载量!

开源地址:https://github.com/NVlabs/OmniVinci

重磅消息回顾!2025年11月值得关注的8条AI资讯

七、Meta开源1600语言语音识别系统

近日,Meta基础人工智能研究(FAIR)团队推出了“全语种自动语音识别系统”(Omnilingual ASR),该系统可支持1600多种语言的语音转写,大幅拓展了当前语音识别技术的语言覆盖范围。

据Meta介绍,在其支持的1600种语言中,有500种系首次被任何AI系统所覆盖。FAIR团队将该系统视为迈向“通用语音转写系统”的重要一步,有望助力打破全球语言壁垒,促进跨语言沟通与信息可及性。

重磅消息回顾!2025年11月值得关注的8条AI资讯

八、Utopai Studios发布影视专用AI模型与工作流

近日,AI原生影视工作室Utopai Studios宣布推出专为电影与电视制作而设计的AI模型和工作流。

与目前主流的通用视频模型不同,Utopai的AI模型并非为了生成短视频或视觉效果,而是专为影视创作而生,具备“理解剧本、解析故事,并协助导演规划镜头和生成场景”的能力。

将这些环节整合为一体后,系统可以强化故事结构、表演呈现与镜头连贯性——这些都是专业影视制作的关键能力。

重磅消息回顾!2025年11月值得关注的8条AI资讯

相关资讯

00后以1.1亿美金「掀桌」,硅谷AI将书写影视新传奇 终结制片旧时代

最年轻的工程师,和团队一起将产品卖给 Fortune 500 的客户,从 0 带到 10。 她,22 岁,成立自己的公司 —— Cybever, 以「用 AI 生成高精度 3D 虚拟环境」技术闻名,并卖服务给游戏和影视行业。 她,24 岁,接到了美国五大影视公司的一个电话,他们告诉她,不要再卖工具了,是不是也可以考虑下虚拟制片这个方向。
9/6/2025 9:21:00 PM
机器之心

世界模型可单GPU秒级生成了?腾讯开源FlashWorld,效果惊艳、免费体验

厦门大学和腾讯合作的最新论文《FlashWorld: High-quality 3D Scene Generation within Seconds》获得了海内外的广泛关注,在当日 Huggingface Daily Paper 榜单位列第一,并在 X 上获得 AK、Midjourney 创始人、SuperSplat 创始人等 AI 大佬点赞转发。 FlashWorld 不仅将三维场景的生成在单卡上做到了 5~10 秒(相比之前方法提速百倍),更统一支持了单张图片或文本输入,生成的场景可以在网页用户端实时渲染,同时质量还胜过其他同类闭源模型。 主页 :: Demo::,作者们还提供了 Huggingface 上的免费 Demo 可以试玩。
10/30/2025 5:07:00 PM
机器之心

Utopai联手LG、中东主权基金加码韩娱,新模型颠覆AI视频格局!

当 Sora 2、Google Veo 3 还在卷短视频逼真度,AI 影视的下一站该是长片叙事了? 在 AI 视频生成技术日新月异的今天,主流模型如 Sora 2、Google Veo 3 等已能生成视觉惊艳的短视频片段,但想要创作长视频甚至是影视作品时,AI 模型似乎开始变得力不从心。 然而,在好莱坞,一家 AI 影视公司却已经拔地而起,开始将 AI 影视生成技术从模型验证推向大规模产业化。
11/8/2025 2:02:00 PM
机器之心