数字人
罗永浩数字人百度电商首播告捷:26分钟GMV超真人1小时
备受关注的罗永浩数字人近日在百度电商平台首次开启直播,并取得了显著的成绩。 据报道,数字人直播间仅开播26分钟,其商品交易总额(GMV)便超越了罗永浩真人1小时的带货金额,展现出数字人直播带货的巨大潜力。 百度方面介绍,此次罗永浩数字人的成功首秀,主要得益于百度在高说服力数字人等关键技术上的突破。
6/16/2025 10:09:58 AM
AI在线
Higgsfield推出Speak功能:一键生成口型精准的数字人视频
AI视觉生成平台 Higgsfield 再推重磅功能——“Speak”,为数字人内容创作者带来前所未有的便捷体验。 用户只需三步:选择预设动作、上传自定义角色并输入语音文本,即可生成具备口型同步与自然动作的数字人视频。 Speak功能支持精确的口型同步技术,确保角色发音自然、对口,并配套 16种内置场景类型,涵盖访谈、讲解、广告、短剧等多样化内容风格,极大提升了创作自由度和内容质量。
6/6/2025 11:00:55 AM
AI在线
腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌
腾讯混元公众号今日发文宣布开源混元语音数字人模型,仅需一张图和一段音频,就能让图中的主角自然地说话、唱歌。
5/28/2025 4:47:54 PM
清源
京东:数字人带货水平超 80% 真人主播
京东数字人直播成本仅为真人1/10,带货成绩却超越80%真人主播,超10,000家商家已使用。京东近期推出高商业可用数字人,支持精品音色微调、精准声唇对齐等功能,今年618还将推出六大行业定制数字人。#京东数字人##AI直播#
5/22/2025 4:53:10 PM
远洋
AI 技术首次亮相美国法庭:家属用“数字人”呈现已故被害人言辞
亚利桑那州一名公路暴力案件的凶手上周被判刑10年半,这一判决背后涉及一起创新的法律程序:受害人通过AI向法庭发表了讲话。官方称,这可能是首次使用该技术的案件。
5/8/2025 5:38:01 PM
清源
百度发布高说服力数字人,可在电商直播领域带来超越真人体验
百度在Create大会上发布高说服力数字人,声形超拟真、互动灵活,能在电商直播等领域带来超越真人的体验。背后依托百度慧播星的“剧本生成”能力和“AI大脑”,实现高度融合的脚本与动作,并实时调整直播策略。#百度数字人# #电商直播#
4/25/2025 10:57:35 AM
远洋
腾讯混元大模型AI阅读助手——企鹅读伴正式上线
4月23日,腾讯在世界读书日当天正式上线了一款名为“企鹅读伴”的AI阅读助手。 这是由腾讯混元大模型和腾讯元器平台提供技术支持的创新产品,由腾讯SSV数字支教实验室主导研发设计,旨在为中小学生带来一场充满科技感与趣味性的阅读新体验。 在产品设计上,“企鹅读伴”能够根据学生的年级、阅读能力以及兴趣偏好,精准推荐适合的阅读书目。
4/23/2025 2:00:42 PM
AI在线
李彦宏将于25日在Create2025百度AI开发者大会发表首场演讲,揭示百度AI新动态
今日,百度创始人李彦宏的25年首场演讲海报正式曝光。 根据海报信息,李彦宏将在4月25日的Create2025百度AI开发者大会上带来一场为期1小时的主题演讲,题为《模型的世界,应用的天下》。 演讲内容将聚焦AI领域的热门议题,包括MCP、智能体、数字人、模型成本等,引发业界广泛关注。
4/17/2025 5:00:48 PM
AI在线
大厂实战案例!百度数字人直播体验改版复盘
前言. 电商直播行业从 2016 年淘宝上线直播历经 8 年增长,供需两端发生变革,越来越多并不擅长直播的商家从幕后走向前台“店播带货”, 消费者购买决策因素逐渐增多的同时,也对直播质量要求越来越高,这促使直播服务商们纷纷开辟出组合数字人主播和数智化直播流程的新直播带货解决方案,百度「慧播星平台」就是其中之一。 百度「慧播星平台」是全栈式的数字人直播解决方案,依托百度自研视觉模型/StyleSync/音频训练/PicGen/文心一言等 AI 技术,实现商家快速开播,带来用户端 7*24 小时不间断、智能专业的超拟真看播体验。
3/22/2025 1:00:51 AM
团队百度MEUX
行业首个:“中国石化 AI 数字员工”上岗,指导车主自助加油付款
中国石化 1 月 18 日在北京举行数字员工发布仪式,正式推出首位“AI 数字员工”,并在广西南宁新阳站等全国 40 余座加能站同步试点上岗。
1/20/2025 5:31:30 PM
汪淼
3D数字人生成来了!南洋理工提出StructLDM:高质量可控3D生成并支持编辑
三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。 传统三维数字人制作往往费时耗力,近年来研究者提出基于三维生成对抗网络(3D GAN)从 2D 图像中学习三维数字人,极大提高了数字人制作效率。 这些方法往往在一维隐向量空间建模数字人,而一维隐向量无法表征人体的几何结构和语义信息,因此限制了其生成质量和编辑能力。
1/14/2025 9:24:46 AM
AIGC Studio
肝了30天,我把2024年最强AI工具整理出来了!
更多盘点:. 工具大盘点! 5款AI视频生成神器优缺点分析(附打分表)24年初,Sora 爆红网络,随之大量的AI视频生成的产品趁势崛起。
1/10/2025 8:40:59 AM
言川Artie
日本罗森便利店将雇佣“海外店员”,以虚拟形象服务深夜顾客
据日经1月1日报道,日本便利店连锁品牌罗森将启用“远程海外员工”模式,通过数字化虚拟形象为深夜顾客提供服务,以应对劳动力短缺问题。
1/2/2025 9:31:54 AM
清源
中国移动联合研发 2D 数字人说话驱动系统:可生成 7 种情绪,用于 5G 新通话、AI 客服等
数字人生成技术上实现了端到端的二阶段 30 FPS 实时生成性能,并支持 512*512 人脸区域生成,同时具备高兴、悲伤等 7 种主流情绪控制生成能力。
12/9/2024 1:04:04 PM
汪淼
松下集团以 AI“复活”松下幸之助,借数字人传承创办者经营理念
松下控股株式会社内部直接接受过创始人熏陶的员工日渐减少,该公司因此决定利用生成式 AI 在集团内部探究和启发松下幸之助的理念,并传递给下一代员工。
11/29/2024 4:26:57 PM
溯波(实习)
讯飞星火多模态交互大模型上线,数字人、语音、视觉支持一键调用
“讯飞开放平台”公众号今天傍晚宣布,讯飞星火多模态交互大模型正式上线,其实现从语音交互拓展到音视频流实时多模交互,新增“多模态、超拟人和个性化”能力,实现语音、视觉、数字人交互三合一。
11/14/2024 6:07:54 PM
清源
完蛋,我被数字同事包围了!小冰AI数字员工再升级,零样本定制,即时上岗
「你好,我在咱们公司刚入职。业务上有什么事儿,就请您多多指教啦!」什么,这些同事竟然都是大模型驱动的 “数字人”?只需 30 秒画面,10 秒音频,10 分钟就能极速定制一个这样和真人无异的 “数字同事”。它可以直接和你实时交互,并且有着通信运营商级别的高质量低延迟的音画传输。就像这样:像这样:这是小冰公司最新上线的 “零样本” 数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技术,依托超千亿大模型基座,新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到
7/19/2024 2:59:00 PM
机器之心
与真人无异!Heygen 5.0数字人又来炸圈了
是的,如今不仅是搬砖人,数字人也加入了“内卷”的行列,就问你怕不怕。从上世纪 90 年代至今,数字人一直在默默发展,而近年来,随着 5G、AI 等技术的进步以及算力平台的迭代,数字人领域取得了显著的成果。
一觉醒来,Heygen 5.0 的最新升级再次让人发狂,他们推出了一款名为 Avatar in Motion 1.0 的新功能,与之前只能坐着或站着口播,做几个重复简单动作讲述的数字人相比,现在的版本可以让数字人动起来了,走动式口播和演示几乎已经与真人无异了,看不出来是数字人了。当视频在手机上无法加载,可前往PC
4/21/2024 2:55:45 AM
团队58UXD
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
LLM
字节跳动
Transformer
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构