视频模型

当“骆驼打包行李”难倒AI：ImagerySearch如何让视频模型学会想象？

当“骆驼打包行李”难倒AI：ImagerySearch如何让视频模型学会想象？

大家好，我是肆〇柒。今天我们一起阅读一篇来自中国科学院大学（UCAS）、阿里巴巴高德地图（AMAP）与中科院智能系统与工程研究中心（CRISE）联合团队的最新工作——《ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints》。这项研究直面当前视频生成模型在“想象力任务”中的系统性失效，提出了一种无需额外训练、仅靠测试时自适应策略即可显著提升长距离语义生成能力的新范式。

10/30/2025 9:18:59 AM 肆零柒

仅50天！百度蒸汽机视频生成大模型升级2.0版本，价格低至行业70%，百万级特效降至“百元”

仅50天！百度蒸汽机视频生成大模型升级2.0版本，价格低至行业70%，百万级特效降至“百元”

8月21日，百度蒸汽机（MuseSteamer）音视频一体化模型完成重大升级，Turbo版、Lite版、Pro版，及有声版全面开放，在行业内首次实现多人有声音视频一体化生成。百度蒸汽机通过五大技术突破实现“需求即成片”，在生成电影级高清视频画面的同时，实现逼真环境音效、自然人物语音的同步输出。即日起，用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验，企业用户可在千帆平台享受高性能视频生成服务。

8/21/2025 6:17:21 PM 云昭

B站团队开源动漫视频生成模型 AniSora，一键创建不同风格片段

B站团队开源动漫视频生成模型 AniSora，一键创建不同风格片段

AniSora 能够一键创建多种动漫风格的视频片段，包括系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫 PV 和鬼畜动画等。

5/18/2025 10:07:54 AM 汪淼

一张图出大片！内置50多种运镜的AI视频模型Higgsfield AI

一张图出大片！内置50多种运镜的AI视频模型Higgsfield AI

大家好，我是言川。最近，AI 视频领域迎来了一款重磅模型：Higgsfield AI。与可灵 AI、Sora 等模型主要依赖文本提示生成视频不同，Higgsfield AI 独辟蹊径，采用预设的运镜模板，轻松实现电影级镜头控制。

4/16/2025 1:21:55 AM 言川Artie

昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1

昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1

昆仑万维官方介绍称，SkyReels-V1 针对表演细节做了打标，还对情绪、场景、表演诉求等进行处理，利用“千万级别、高质量”的好莱坞级别数据进行训练微调。

2/18/2025 10:28:48 AM 汪淼

腾讯出手了！开源最大AI视频模型，130亿参数，性能媲美闭源，击败Runway Gen-3、Luma 1.6

腾讯出手了！开源最大AI视频模型，130亿参数，性能媲美闭源，击败Runway Gen-3、Luma 1.6

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）AI视频领域持续不断有新玩家入局！ 12月3日，腾讯出手了，不仅在元宝APP里上线AI视频功能，还直接开源了混元视频模型！图片（打开元宝APP，若没有找到入口的话，可以检查是否更新到了最新版本，目前可能会有排队时间。

12/4/2024 1:34:22 PM 伊风

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉