音效
谷歌Veo 3强势发布:视频生成迈入音画同步新时代
谷歌最近推出了其最新的视频生成模型 Veo3,标志着 AI 视频技术的一次重大飞跃。 这款新模型实现了音画同步生成功能,能够根据用户的提示词,自动生成包含对白、唇动对齐和环境音效的高质量视频。 这一突破使得 AI 视频制作跨越了多模态的边界,让视频不仅会动,还会说话。
5/22/2025 10:00:56 AM
AI在线
ElevenLabs推可定制音效控制面板工具SB-1 Infinite Soundboard
人工智能音频领域的领军企业ElevenLabs再次掀起行业波澜,于今日正式推出一款基于 AI 的可定制音效控制面板工具——SB-1Infinite Soundboard。 用户可以通过点击按钮播放、组合、循环各种音效,或者可以通过文本提示生成全新的 AI 音效。 技术亮点:文本驱动的无限音效生成SB-1Infinite Soundboard的核心在于其基于Text-to-SFX模型的音效生成能力。
5/16/2025 11:00:55 AM
AI在线
三星One UI Watch 8即将发布:音效升级、图标焕新、引入 Gemini AI
在数字手表界,三星的 One UI Watch8正在悄然崭露头角。 根据最近泄露的信息,三星对这一新系统进行了全面的音效升级,并引入了众多令人期待的变化。 通过网络上的音频文件,我们得以一窥 One UI Watch8的音效细节,这些音效不仅涵盖了相机快门声、充电提示音和低电量提醒音等常见声音,还包括了三星最新版本的经典旋律 “Over the Horizon”。
5/7/2025 9:00:53 AM
AI在线
今年最被低估的AI模型之一,重现李小龙功夫音
AI好好用报道编辑:Sia音频视频的同步生成,是时候开卷了~承认吧,虽然谷歌 Veo2 在视频生成上完虐了 Sora,但生成的还是个默片。 没声音的 AI 视频,说白了就是个半成品。 看看这组数字:谷歌开放的大规模音频数据集 AudioSet 显示,82% 以上的视频都有人声或音乐;去年抖音上传的 100 多亿条视频里,差不多八成都配了背景音乐。
12/24/2024 6:32:00 PM
AI好好用
一句话搞定爆炸音效,ElevenLabs 推出新 AI 工具
ElevenLabs 此前已推出利用人工智能生成人类声音和音乐的工具,现在他们更进一步,推出了可以为播客、电影或游戏创作音效的工具。ElevenLabs 的名为“Sound Effects”的新工具可以根据用户提供的文本描述生成最长 22 秒的音效,并与公司原有的语音和音乐平台结合使用。用户每次使用“Sound Effects”后,可以获得至少四个可下载的音频片段供选择。 ElevenLabs 与素材平台 Shutterstock 合作,利用其庞大的音频素材库训练了生成式模型。据悉,Shutterstock 的内容
6/2/2024 3:20:09 PM
远洋
- 1
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
Google搜索推出AI Mode实验,探索全新智能问答体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
Sora
机器学习
AI设计
AI for Science
苹果
生成
GPU
AI视频
搜索
华为
场景
百度
训练
人形机器人
Claude
预测
伟达
xAI
深度学习
Transformer
大语言模型
智能体
字节跳动
模态
文本
具身智能
神器推荐
Copilot
驾驶
LLaMA
视觉
API
算力
应用
安全
干货合集
Agent
工具
大型语言模型
视频生成