视频模型
当“骆驼打包行李”难倒AI:ImagerySearch如何让视频模型学会想象?
大家好,我是肆〇柒。 今天我们一起阅读一篇来自中国科学院大学(UCAS)、阿里巴巴高德地图(AMAP)与中科院智能系统与工程研究中心(CRISE) 联合团队的最新工作——《ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints》。 这项研究直面当前视频生成模型在“想象力任务”中的系统性失效,提出了一种无需额外训练、仅靠测试时自适应策略即可显著提升长距离语义生成能力的新范式。
10/30/2025 9:18:59 AM
肆零柒
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%,百万级特效降至“百元”
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
8/21/2025 6:17:21 PM
云昭
B站团队开源动漫视频生成模型 AniSora,一键创建不同风格片段
AniSora 能够一键创建多种动漫风格的视频片段,包括系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫 PV 和鬼畜动画等。
5/18/2025 10:07:54 AM
汪淼
一张图出大片!内置50多种运镜的AI视频模型Higgsfield AI
大家好,我是言川。 最近,AI 视频领域迎来了一款重磅模型:Higgsfield AI。 与可灵 AI、Sora 等模型主要依赖文本提示生成视频不同,Higgsfield AI 独辟蹊径,采用预设的运镜模板,轻松实现电影级镜头控制。
4/16/2025 1:21:55 AM
言川Artie
昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1
昆仑万维官方介绍称,SkyReels-V1 针对表演细节做了打标,还对情绪、场景、表演诉求等进行处理,利用“千万级别、高质量”的好莱坞级别数据进行训练微调。
2/18/2025 10:28:48 AM
汪淼
腾讯出手了!开源最大AI视频模型,130亿参数,性能媲美闭源,击败Runway Gen-3、Luma 1.6
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)AI视频领域持续不断有新玩家入局! 12月3日,腾讯出手了,不仅在元宝APP里上线AI视频功能,还直接开源了混元视频模型! 图片(打开元宝APP,若没有找到入口的话,可以检查是否更新到了最新版本,目前可能会有排队时间。
12/4/2024 1:34:22 PM
伊风
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
AI for Science
苹果
Agent
腾讯
Claude
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
亚马逊
特斯拉
场景
深度学习
架构
Transformer
MCP
Copilot
编程
视觉