全乱套了!华妃骑野猪、曹操唱《APT.》,AI魔改老剧名场面,一个比一个癫
AI好好用报道编辑:杨文AI魔改剧又土又嗨! 小作坊下料就是猛。 近日,有网友用 AI 爆改国产剧,那画面一个比一个癫。- 977
- 0
谷歌领跑 AI 视频生成赛道:抢先 OpenAI Sora 推出 Veo 模型,可生成 1080P 高清视频
谷歌公司昨日(12 月 4 日)发布博文,宣布在 Vertex AI 平台上,以私测预览版的形式,面向企业开放最新的生成式 AI 视频模型 Veo,助力企业内容创作流程。- 972
- 0
经典卡尔曼滤波器改进视频版「分割一切」,网友:好优雅的方法
Meta的视频版分割一切——Segment Anything Model 2(SAM 2),又火了一把。 因为这一次,一个全华人团队,仅仅是用了个经典方法,就把它的能力拔到了一个新高度——任你移动再快,AI跟丢不了一点点! 例如在电影《1917》这段画面里,主角穿梭在众多士兵之中,原先的SAM 2表现是这样的:嗯,当一大群士兵涌入画面的时候,SAM 2把主角给跟丢了。- 971
- 0
视频大模型无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 | NeurIPS
把连续相同的图像块合并成一个token,就能让Transformer的视频处理速度大幅提升。 卡内基梅隆大学提出了视频大模型加速方法Run-Length Tokenization(RLT),被NeurIPS 2024选为Spotlight论文。 在精度几乎没有损失的前提下,RLT可以让模型训练和推理速度双双提升。- 971
- 0
即梦AI首发,字节自研视频生成模型Seaweed开放使用
11月8日,字节跳动旗下的AI内容平台即梦AI宣布,即日起,由字节跳动自研的视频生成模型Seaweed面向平台用户正式开放。 用户登陆后,在“视频生成”功能下,视频模型选择“视频S2.0”即可体验。 图说:即梦AI PC端和App端模型使用入口9月底,字节跳动正式宣布向AI视频领域进军,发布豆包模型家族的两款视频生成模型Seaweed和Pixeldance,并通过即梦AI、火山引擎分别面向创作者和…- 9
- 0
类Sora模型到底懂不懂物理?字节完成系统性实验,图灵奖得主杨立昆赞转!
Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。 近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律,做到“举一反三”。 图灵奖得主、Meta首席AI科学家杨立昆点赞并转发了该研究,表示“结论不令人意外,但很高兴终于有…- 6
- 0
手机秒拍动画大片,高级运镜效果惊人!Runway两弹更新,火得一塌糊涂
前几天,Runway宣布更加灵活逼真的AI摄像头控件上线,开始实现3D化! 该功能Gen-3 Alpha Turbo视频生成模型可用。 而就在一个多星期前,10月23日,Runway还宣布了Gen-3 Alpha的新功能Act-One。- 971
- 0
一张显卡“看懂”一部电影:智源联合高校开源 Video-XL,打破长视频理解极限
长视频理解是多模态大模型的核心能力之一,也是迈向通用人工智能(AGI)的关键一步。 然而,现有的多模态大模型在处理 10 分钟以上的超长视频时,仍然面临性能差和效率低的双重挑战。 对此,智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校,推出了小时级的超长视频理解大模型 Video-XL。- 5
- 0
快手可灵 AI 用户已超 360 万,独立 App 即将上架
据 36 氪报道,在今日举行的 2024 中国计算机大会上,快手副总裁、大模型团队负责人张迪介绍,自今年六月发布以来,可灵 AI 已有超过 360 万用户,累计生成 3700 万个视频和超过一亿张图片。 近期可灵 AI 还将上架独立 App,方便用户使用。 据悉,可灵 AI 将内测视频人脸模型功能,基于创新的 ID 保持能力,支持用户自助训练人脸模型,完成训练后,可使用该模型进行 5s / 10s…- 9
- 0
真·赛博菩萨!最大的开源视频模型来了,我们实测:有点东西,但不多
AI好好用报道编辑:杨文目前发布的最大的开源视频生成模型。 Genmo 当了一回「赛博菩萨」。 昨晚,AI 视频生成公司 Genmo 推出了最新的视频生成模型 Mochi 1 ,并且大手一挥,直接给开源了 。- 15
- 0
首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造 AI 开源模型 Hallo2
复旦大学和百度联合开发了一款名为 Hallo2 的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。Ha…- 14
- 0
火山引擎发布大模型训练视频预处理方案,已应用于豆包视频生成模型
10月15日,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案,助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,“基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长…- 6
- 0
快手联合推出 Pyramid Flow 开源文生视频 AI 模型:最高 10 秒 768P@24fps,创新金字塔流匹配让推理 tokens 降至 1/4
由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等,提供更高效、更灵活的视频生成解决方案,目前已经在 Hugging Face 平台上线,并完全开源。 AI在线查询官方介绍,附…- 7
- 0
Meta 推出革命性 AI 视频工具,让广告创意焕然一新
感谢科技媒体 The Verge 于 10 月 8 日发布博文,报道称 Meta 公司在 Advertising Week 活动中,推出了 Image Animation 和 Video Expansion 两款 AI 工具。Image Animation根据 Meta 公司分享的最新动图,用户可以选择一张静态照片,无需在 Instagram Reels 上使用任何现有的视频素材,就能生成创意视频…- 11
- 0
氛围感拉满:微软新专利探索 Copilot AI 应用,匹配视频等生成音乐
科技媒体 Windows Report 昨日(10 月 4 日)发布博文,报道称微软公司获得了一项新的专利,构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。AI在线注:微软该专利名为《Artificial intelligence model for composing audio scores》,主要探讨了基于输入内容,来创建音乐的方法。该…- 9
- 0
Meta 发布 AI 视频生成器 Movie Gen:可自动生成含声音的高清视频
Meta 公司今天宣布了一款新的 AI 视频生成器 Movie Gen,该工具能够生成带有声音的高清视频。几个月前,其竞争对手 OpenAI 也推出了其文本转视频模型 Sora。输入文本 Movie Gen 就能自动生成视频,还可以编辑现有的视频或静止图像。据《纽约时报》报道,添加到视频中的音频也是 AI 生成的,通过环境噪音、音效和背景音乐与视频相匹配,视频支持不同的纵横比。Meta 表示,Mo…- 22
- 0
快手可灵 AI 新增“对口型”功能:生成人物口型与上传音频同步
感谢快手旗下可灵 AI 官方宣布,新增对口型功能,并面向所有用户开放 API 服务。在可灵 AI 生成人物视频后,上传音频,即可让视频人物口型和音频同步。可灵 1.0 及 1.5 模型生成的视频,只要满足视频画面的人脸条件,均支持对口型(目前仅支持人物类角色(真实 / 3D / 2D)进行对口型,动物类角色对口型暂不支持)。AI在线获悉,可灵 AI 正式面向所有用户开放 API 服务,支持在平台自…- 48
- 0
10 倍速度提升,新版 Dream Machineds 可在 20 秒内极速生成高质量 AI 视频
科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 Luma AI 升级推出 1.6 版 Dream Machine,AI 视频生成速度快 10 倍。Luma AI 简介Luma AI 是一家专注于人工智能技术的公司,主要提供视频生成和 3D 捕捉的解决方案。Dream Machine 简介Dream Machine 是一个先进的文本转视频生成器,用户可以通过输入文本来创建…- 31
- 0
字节跳动发布豆包视频生成模型,这效果让我分不清 AI 与现实
9 月 24 日,火山引擎 AI 创新巡展在深圳举办,带来了豆包大模型的最新进展。豆包大模型家族迎来了新成员。具体来说,火山引擎全新推出了豆包・视频生成模型,以及豆包音乐模型、同声传译模型,同时还升级了通用语言模型、文生图模型、语音模型,不断增强各类模态以及规模化的调用量,让豆包大模型“更强模型、更低价格、更易落地”的优势持续凸显。此外,多家行业客户也在会上分享了大模型应用的实践经验。本次豆包带来…- 36
- 0
视频
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!