AI在线 AI在线

数字人

Higgsfield推出Speak功能:一键生成口型精准的数字人视频

AI视觉生成平台 Higgsfield 再推重磅功能——“Speak”,为数字人内容创作者带来前所未有的便捷体验。 用户只需三步:选择预设动作、上传自定义角色并输入语音文本,即可生成具备口型同步与自然动作的数字人视频。 Speak功能支持精确的口型同步技术,确保角色发音自然、对口,并配套 16种内置场景类型,涵盖访谈、讲解、广告、短剧等多样化内容风格,极大提升了创作自由度和内容质量。
6/6/2025 11:00:55 AM
AI在线

腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌

腾讯混元公众号今日发文宣布开源混元语音数字人模型,仅需一张图和一段音频,就能让图中的主角自然地说话、唱歌。
5/28/2025 4:47:54 PM
清源

京东:数字人带货水平超 80% 真人主播

京东数字人直播成本仅为真人1/10,带货成绩却超越80%真人主播,超10,000家商家已使用。京东近期推出高商业可用数字人,支持精品音色微调、精准声唇对齐等功能,今年618还将推出六大行业定制数字人。#京东数字人##AI直播#
5/22/2025 4:53:10 PM
远洋

AI 技术首次亮相美国法庭:家属用“数字人”呈现已故被害人言辞

亚利桑那州一名公路暴力案件的凶手上周被判刑10年半,这一判决背后涉及一起创新的法律程序:受害人通过AI向法庭发表了讲话。官方称,这可能是首次使用该技术的案件。
5/8/2025 5:38:01 PM
清源

百度发布高说服力数字人,可在电商直播领域带来超越真人体验

百度在Create大会上发布高说服力数字人,声形超拟真、互动灵活,能在电商直播等领域带来超越真人的体验。背后依托百度慧播星的“剧本生成”能力和“AI大脑”,实现高度融合的脚本与动作,并实时调整直播策略。#百度数字人# #电商直播#
4/25/2025 10:57:35 AM
远洋

腾讯混元大模型AI阅读助手——企鹅读伴正式上线

4月23日,腾讯在世界读书日当天正式上线了一款名为“企鹅读伴”的AI阅读助手。 这是由腾讯混元大模型和腾讯元器平台提供技术支持的创新产品,由腾讯SSV数字支教实验室主导研发设计,旨在为中小学生带来一场充满科技感与趣味性的阅读新体验。 在产品设计上,“企鹅读伴”能够根据学生的年级、阅读能力以及兴趣偏好,精准推荐适合的阅读书目。
4/23/2025 2:00:42 PM
AI在线

李彦宏将于25日在Create2025百度AI开发者大会发表首场演讲,揭示百度AI新动态

今日,百度创始人李彦宏的25年首场演讲海报正式曝光。 根据海报信息,李彦宏将在4月25日的Create2025百度AI开发者大会上带来一场为期1小时的主题演讲,题为《模型的世界,应用的天下》。 演讲内容将聚焦AI领域的热门议题,包括MCP、智能体、数字人、模型成本等,引发业界广泛关注。
4/17/2025 5:00:48 PM
AI在线

大厂实战案例!百度数字人直播体验改版复盘

前言. 电商直播行业从 2016 年淘宝上线直播历经 8 年增长,供需两端发生变革,越来越多并不擅长直播的商家从幕后走向前台“店播带货”, 消费者购买决策因素逐渐增多的同时,也对直播质量要求越来越高,这促使直播服务商们纷纷开辟出组合数字人主播和数智化直播流程的新直播带货解决方案,百度「慧播星平台」就是其中之一。 百度「慧播星平台」是全栈式的数字人直播解决方案,依托百度自研视觉模型/StyleSync/音频训练/PicGen/文心一言等 AI 技术,实现商家快速开播,带来用户端 7*24 小时不间断、智能专业的超拟真看播体验。
3/22/2025 1:00:51 AM
团队百度MEUX

行业首个:“中国石化 AI 数字员工”上岗,指导车主自助加油付款

中国石化 1 月 18 日在北京举行数字员工发布仪式,正式推出首位“AI 数字员工”,并在广西南宁新阳站等全国 40 余座加能站同步试点上岗。
1/20/2025 5:31:30 PM
汪淼

3D数字人生成来了!南洋理工提出StructLDM:高质量可控3D生成并支持编辑

三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。 传统三维数字人制作往往费时耗力,近年来研究者提出基于三维生成对抗网络(3D GAN)从 2D 图像中学习三维数字人,极大提高了数字人制作效率。 这些方法往往在一维隐向量空间建模数字人,而一维隐向量无法表征人体的几何结构和语义信息,因此限制了其生成质量和编辑能力。
1/14/2025 9:24:46 AM
AIGC Studio

肝了30天,我把2024年最强AI工具整理出来了!

更多盘点:. 工具大盘点! 5款AI视频生成神器优缺点分析(附打分表)24年初,Sora 爆红网络,随之大量的AI视频生成的产品趁势崛起。
1/10/2025 8:40:59 AM
言川Artie

日本罗森便利店将雇佣“海外店员”,以虚拟形象服务深夜顾客

据日经1月1日报道,日本便利店连锁品牌罗森将启用“远程海外员工”模式,通过数字化虚拟形象为深夜顾客提供服务,以应对劳动力短缺问题。
1/2/2025 9:31:54 AM
清源

中国移动联合研发 2D 数字人说话驱动系统:可生成 7 种情绪,用于 5G 新通话、AI 客服等

数字人生成技术上实现了端到端的二阶段 30 FPS 实时生成性能,并支持 512*512 人脸区域生成,同时具备高兴、悲伤等 7 种主流情绪控制生成能力。
12/9/2024 1:04:04 PM
汪淼

松下集团以 AI“复活”松下幸之助,借数字人传承创办者经营理念

松下控股株式会社内部直接接受过创始人熏陶的员工日渐减少,该公司因此决定利用生成式 AI 在集团内部探究和启发松下幸之助的理念,并传递给下一代员工。
11/29/2024 4:26:57 PM
溯波(实习)

讯飞星火多模态交互大模型上线,数字人、语音、视觉支持一键调用

“讯飞开放平台”公众号今天傍晚宣布,讯飞星火多模态交互大模型正式上线,其实现从语音交互拓展到音视频流实时多模交互,新增“多模态、超拟人和个性化”能力,实现语音、视觉、数字人交互三合一。
11/14/2024 6:07:54 PM
清源

完蛋,我被数字同事包围了!小冰AI数字员工再升级,零样本定制,即时上岗

「你好,我在咱们公司刚入职。业务上有什么事儿,就请您多多指教啦!」什么,这些同事竟然都是大模型驱动的 “数字人”?只需 30 秒画面,10 秒音频,10 分钟就能极速定制一个这样和真人无异的 “数字同事”。它可以直接和你实时交互,并且有着通信运营商级别的高质量低延迟的音画传输。就像这样:像这样:这是小冰公司最新上线的 “零样本” 数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技术,依托超千亿大模型基座,新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到
7/19/2024 2:59:00 PM
机器之心

与真人无异!Heygen 5.0数字人又来炸圈了

是的,如今不仅是搬砖人,数字人也加入了“内卷”的行列,就问你怕不怕。从上世纪 90 年代至今,数字人一直在默默发展,而近年来,随着 5G、AI 等技术的进步以及算力平台的迭代,数字人领域取得了显著的成果。 一觉醒来,Heygen 5.0 的最新升级再次让人发狂,他们推出了一款名为 Avatar in Motion 1.0 的新功能,与之前只能坐着或站着口播,做几个重复简单动作讲述的数字人相比,现在的版本可以让数字人动起来了,走动式口播和演示几乎已经与真人无异了,看不出来是数字人了。当视频在手机上无法加载,可前往PC
4/21/2024 2:55:45 AM
团队58UXD

AI医疗应用又有新进展,支付宝开放“AI就医助理”解决方案

AI在医疗场景的应用又有新进展。 4月2日,支付宝发布“AI就医助理”解决方案,利用AI大模型、数字人等技术,助力医疗机构为患者提供覆盖就医前、中、后的“AI陪伴就诊”服务。 据支付宝介绍,“AI就医助理”解决方案为用户提供从诊前、诊中到诊后的全过程智能交互。
4/2/2024 2:16:00 PM
晓楠