数字人
讯飞星火多模态交互大模型上线,数字人、语音、视觉支持一键调用
“讯飞开放平台”公众号今天傍晚宣布,讯飞星火多模态交互大模型正式上线,其实现从语音交互拓展到音视频流实时多模交互,新增“多模态、超拟人和个性化”能力,实现语音、视觉、数字人交互三合一。
11/14/2024 6:07:54 PM
清源
完蛋,我被数字同事包围了!小冰AI数字员工再升级,零样本定制,即时上岗
「你好,我在咱们公司刚入职。业务上有什么事儿,就请您多多指教啦!」什么,这些同事竟然都是大模型驱动的 “数字人”?只需 30 秒画面,10 秒音频,10 分钟就能极速定制一个这样和真人无异的 “数字同事”。它可以直接和你实时交互,并且有着通信运营商级别的高质量低延迟的音画传输。就像这样:像这样:这是小冰公司最新上线的 “零样本” 数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技术,依托超千亿大模型基座,新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到
7/19/2024 2:59:00 PM
机器之心
与真人无异!Heygen 5.0数字人又来炸圈了
是的,如今不仅是搬砖人,数字人也加入了“内卷”的行列,就问你怕不怕。从上世纪 90 年代至今,数字人一直在默默发展,而近年来,随着 5G、AI 等技术的进步以及算力平台的迭代,数字人领域取得了显著的成果。
一觉醒来,Heygen 5.0 的最新升级再次让人发狂,他们推出了一款名为 Avatar in Motion 1.0 的新功能,与之前只能坐着或站着口播,做几个重复简单动作讲述的数字人相比,现在的版本可以让数字人动起来了,走动式口播和演示几乎已经与真人无异了,看不出来是数字人了。当视频在手机上无法加载,可前往PC
4/21/2024 2:55:45 AM
团队58UXD
AI医疗应用又有新进展,支付宝开放“AI就医助理”解决方案
AI在医疗场景的应用又有新进展。 4月2日,支付宝发布“AI就医助理”解决方案,利用AI大模型、数字人等技术,助力医疗机构为患者提供覆盖就医前、中、后的“AI陪伴就诊”服务。 据支付宝介绍,“AI就医助理”解决方案为用户提供从诊前、诊中到诊后的全过程智能交互。
4/2/2024 2:16:00 PM
晓楠
全方位盘点!7个常用的数字人 AI 设计神器
数字人 IP 设计是一项复杂而富有挑战性的任务,需要借助各种工具来实现。在这个领域,有许多优秀的工具可供选择,它们可以帮助我们创建出逼真、生动的数字人。本文将介绍一些常用的数字人制作工具,包括 MJ SD、虚幻引擎、Blender/C4D/MAYA、SadTalker、微软 Azure、PIKA 和 runway。这些工具在数字人设计的不同方面都有着独特的优势,我们将逐一探讨它们的功能和特点。通过了解这些工具,你将能够更好地掌握数字人设计的技术,实现你的创意想象。
更多数字人干货:一、形象生成工具
1. MJ SD
1/29/2024 12:17:40 AM
团队58UXD
数字人制作神器 HeyGen 实测 !听说能让视频制作效率提升10倍?
大家好,这里是和你们一起探索 AI 的花生,今天我要来和大家聊聊数字人制作神器HeyGen。
随着数字人技术的出现和发展,相关公司一直都在它的应用边界,德国最近就出现了一个“AI 教堂”,里面主持仪式的不再是现实中的神父,而是屏幕里的“数字人”传教士。活动当日去现场参加的人还不少,不知道未来这种新型礼拜的形式会不会普及。今天要为大家介绍的 HeyGen 就是一款可以制作这种数字人视频的工具。与之前为大家介绍过的 D-ID 相比,它不仅能让数字人说话,还允许用户订制个性化的、符合不同行业需求的视频,并让视频制作的速度
6/14/2023 6:00:52 AM
夏花生
D-ID !数字人视频制作神器,只需5分钟让照片开口说话
大家好,这是和你们聊设计的花生~
大家最近在 B 站、抖音等各大视频平台上有没有看到一种新的视频类型——数字人视频,即视频中为出镜大家介绍内容的并不是真人,而是由 AI 生成的虚拟人物,人物说的话也是由 AI 配音的。这种视频用 AI 代替了真人出镜,省去了读稿、录制等多个步骤,能有效提升我们制作视频的效率。
今天为大家推荐的 D-ID 就是一款能帮助我们迅速制作出数字人视频的神器,只需在里面上传你的人物照片,输入视频介绍文本,就能在几分钟内让图像开口说话,并且人物口型与音频能精准排匹配,真实感极强。
D-ID 官
6/8/2023 1:00:03 AM
夏花生
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用