音效
谷歌Veo 3强势发布:视频生成迈入音画同步新时代
谷歌最近推出了其最新的视频生成模型 Veo3,标志着 AI 视频技术的一次重大飞跃。 这款新模型实现了音画同步生成功能,能够根据用户的提示词,自动生成包含对白、唇动对齐和环境音效的高质量视频。 这一突破使得 AI 视频制作跨越了多模态的边界,让视频不仅会动,还会说话。
5/22/2025 10:00:56 AM
AI在线
ElevenLabs推可定制音效控制面板工具SB-1 Infinite Soundboard
人工智能音频领域的领军企业ElevenLabs再次掀起行业波澜,于今日正式推出一款基于 AI 的可定制音效控制面板工具——SB-1Infinite Soundboard。 用户可以通过点击按钮播放、组合、循环各种音效,或者可以通过文本提示生成全新的 AI 音效。 技术亮点:文本驱动的无限音效生成SB-1Infinite Soundboard的核心在于其基于Text-to-SFX模型的音效生成能力。
5/16/2025 11:00:55 AM
AI在线
三星One UI Watch 8即将发布:音效升级、图标焕新、引入 Gemini AI
在数字手表界,三星的 One UI Watch8正在悄然崭露头角。 根据最近泄露的信息,三星对这一新系统进行了全面的音效升级,并引入了众多令人期待的变化。 通过网络上的音频文件,我们得以一窥 One UI Watch8的音效细节,这些音效不仅涵盖了相机快门声、充电提示音和低电量提醒音等常见声音,还包括了三星最新版本的经典旋律 “Over the Horizon”。
5/7/2025 9:00:53 AM
AI在线
今年最被低估的AI模型之一,重现李小龙功夫音
AI好好用报道编辑:Sia音频视频的同步生成,是时候开卷了~承认吧,虽然谷歌 Veo2 在视频生成上完虐了 Sora,但生成的还是个默片。 没声音的 AI 视频,说白了就是个半成品。 看看这组数字:谷歌开放的大规模音频数据集 AudioSet 显示,82% 以上的视频都有人声或音乐;去年抖音上传的 100 多亿条视频里,差不多八成都配了背景音乐。
12/24/2024 6:32:00 PM
AI好好用
一句话搞定爆炸音效,ElevenLabs 推出新 AI 工具
ElevenLabs 此前已推出利用人工智能生成人类声音和音乐的工具,现在他们更进一步,推出了可以为播客、电影或游戏创作音效的工具。ElevenLabs 的名为“Sound Effects”的新工具可以根据用户提供的文本描述生成最长 22 秒的音效,并与公司原有的语音和音乐平台结合使用。用户每次使用“Sound Effects”后,可以获得至少四个可下载的音频片段供选择。 ElevenLabs 与素材平台 Shutterstock 合作,利用其庞大的音频素材库训练了生成式模型。据悉,Shutterstock 的内容
6/2/2024 3:20:09 PM
远洋
- 1
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
奥特曼:我承认GPT-5发布搞砸了
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
7年了,OpenAI官方给出五代GPT对比,网友却怀念起「狂野」初代
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
应用
特斯拉