视频模型
当“骆驼打包行李”难倒AI:ImagerySearch如何让视频模型学会想象?
大家好,我是肆〇柒。 今天我们一起阅读一篇来自中国科学院大学(UCAS)、阿里巴巴高德地图(AMAP)与中科院智能系统与工程研究中心(CRISE) 联合团队的最新工作——《ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints》。 这项研究直面当前视频生成模型在“想象力任务”中的系统性失效,提出了一种无需额外训练、仅靠测试时自适应策略即可显著提升长距离语义生成能力的新范式。
10/30/2025 9:18:59 AM
肆零柒
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%,百万级特效降至“百元”
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
8/21/2025 6:17:21 PM
云昭
B站团队开源动漫视频生成模型 AniSora,一键创建不同风格片段
AniSora 能够一键创建多种动漫风格的视频片段,包括系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫 PV 和鬼畜动画等。
5/18/2025 10:07:54 AM
汪淼
一张图出大片!内置50多种运镜的AI视频模型Higgsfield AI
大家好,我是言川。 最近,AI 视频领域迎来了一款重磅模型:Higgsfield AI。 与可灵 AI、Sora 等模型主要依赖文本提示生成视频不同,Higgsfield AI 独辟蹊径,采用预设的运镜模板,轻松实现电影级镜头控制。
4/16/2025 1:21:55 AM
言川Artie
昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1
昆仑万维官方介绍称,SkyReels-V1 针对表演细节做了打标,还对情绪、场景、表演诉求等进行处理,利用“千万级别、高质量”的好莱坞级别数据进行训练微调。
2/18/2025 10:28:48 AM
汪淼
腾讯出手了!开源最大AI视频模型,130亿参数,性能媲美闭源,击败Runway Gen-3、Luma 1.6
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)AI视频领域持续不断有新玩家入局! 12月3日,腾讯出手了,不仅在元宝APP里上线AI视频功能,还直接开源了混元视频模型! 图片(打开元宝APP,若没有找到入口的话,可以检查是否更新到了最新版本,目前可能会有排队时间。
12/4/2024 1:34:22 PM
伊风
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Stable Diffusion
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
生成
大语言模型
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
DeepMind
架构
生成式AI
编程
视觉
Transformer
预测
AI模型
伟达
亚马逊
MCP