数字人
直击WAIC:萝卜快跑入选「国家队」,AI数字人技术升级,百度全栈自研杀疯了
前几天,奥特曼在采访中透露,亲自体验 GPT-5 后,被其强大的能力吓到。 有个自己都搞不懂的问题,模型却能一下答出来,那一刻他甚至觉得自己在擅长的领域也有些「无力」。 尽管 AI 进展飞快,但总有人质疑:真正落地的 AI 不多,很多所谓的新技术,可能只是炒作。
7/26/2025 11:08:00 PM
机器之心
如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!
TaoAvatar 是由阿里巴巴淘宝 Meta 技术团队研发的 3D 真人数字人技术,这一技术能在手机或 XR 设备上实现 3D 数字人的实时渲染以及 AI 对话的强大功能,为用户带来逼真的虚拟交互体验。 它是如何实现的呢? 本文将为您揭秘 TaoAvatar 背后的黑科技!
6/25/2025 9:11:16 AM
百度首推双数字人互动直播间,文心大模型4.5T驱动多模态技术新突破
近日,百度在人工智能领域再下一城,推出了全球首个双数字人互动直播间。 这一创新应用基于百度文心大模型4.5Turbo(以下简称4.5T),通过语言、声音和形象的多模态高度融合,实现了数字人与用户之间的自然、流畅互动,为直播行业带来了全新可能。 AIbase结合网络最新信息,深入解析这一技术突破及其对行业的深远影响。
6/18/2025 11:01:54 AM
AI在线
罗永浩数字人百度电商首播告捷:26分钟GMV超真人1小时
备受关注的罗永浩数字人近日在百度电商平台首次开启直播,并取得了显著的成绩。 据报道,数字人直播间仅开播26分钟,其商品交易总额(GMV)便超越了罗永浩真人1小时的带货金额,展现出数字人直播带货的巨大潜力。 百度方面介绍,此次罗永浩数字人的成功首秀,主要得益于百度在高说服力数字人等关键技术上的突破。
6/16/2025 10:09:58 AM
AI在线
Higgsfield推出Speak功能:一键生成口型精准的数字人视频
AI视觉生成平台 Higgsfield 再推重磅功能——“Speak”,为数字人内容创作者带来前所未有的便捷体验。 用户只需三步:选择预设动作、上传自定义角色并输入语音文本,即可生成具备口型同步与自然动作的数字人视频。 Speak功能支持精确的口型同步技术,确保角色发音自然、对口,并配套 16种内置场景类型,涵盖访谈、讲解、广告、短剧等多样化内容风格,极大提升了创作自由度和内容质量。
6/6/2025 11:00:55 AM
AI在线
腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌
腾讯混元公众号今日发文宣布开源混元语音数字人模型,仅需一张图和一段音频,就能让图中的主角自然地说话、唱歌。
5/28/2025 4:47:54 PM
清源
京东:数字人带货水平超 80% 真人主播
京东数字人直播成本仅为真人1/10,带货成绩却超越80%真人主播,超10,000家商家已使用。京东近期推出高商业可用数字人,支持精品音色微调、精准声唇对齐等功能,今年618还将推出六大行业定制数字人。#京东数字人##AI直播#
5/22/2025 4:53:10 PM
远洋
AI 技术首次亮相美国法庭:家属用“数字人”呈现已故被害人言辞
亚利桑那州一名公路暴力案件的凶手上周被判刑10年半,这一判决背后涉及一起创新的法律程序:受害人通过AI向法庭发表了讲话。官方称,这可能是首次使用该技术的案件。
5/8/2025 5:38:01 PM
清源
百度发布高说服力数字人,可在电商直播领域带来超越真人体验
百度在Create大会上发布高说服力数字人,声形超拟真、互动灵活,能在电商直播等领域带来超越真人的体验。背后依托百度慧播星的“剧本生成”能力和“AI大脑”,实现高度融合的脚本与动作,并实时调整直播策略。#百度数字人# #电商直播#
4/25/2025 10:57:35 AM
远洋
腾讯混元大模型AI阅读助手——企鹅读伴正式上线
4月23日,腾讯在世界读书日当天正式上线了一款名为“企鹅读伴”的AI阅读助手。 这是由腾讯混元大模型和腾讯元器平台提供技术支持的创新产品,由腾讯SSV数字支教实验室主导研发设计,旨在为中小学生带来一场充满科技感与趣味性的阅读新体验。 在产品设计上,“企鹅读伴”能够根据学生的年级、阅读能力以及兴趣偏好,精准推荐适合的阅读书目。
4/23/2025 2:00:42 PM
AI在线
李彦宏将于25日在Create2025百度AI开发者大会发表首场演讲,揭示百度AI新动态
今日,百度创始人李彦宏的25年首场演讲海报正式曝光。 根据海报信息,李彦宏将在4月25日的Create2025百度AI开发者大会上带来一场为期1小时的主题演讲,题为《模型的世界,应用的天下》。 演讲内容将聚焦AI领域的热门议题,包括MCP、智能体、数字人、模型成本等,引发业界广泛关注。
4/17/2025 5:00:48 PM
AI在线
大厂实战案例!百度数字人直播体验改版复盘
前言. 电商直播行业从 2016 年淘宝上线直播历经 8 年增长,供需两端发生变革,越来越多并不擅长直播的商家从幕后走向前台“店播带货”, 消费者购买决策因素逐渐增多的同时,也对直播质量要求越来越高,这促使直播服务商们纷纷开辟出组合数字人主播和数智化直播流程的新直播带货解决方案,百度「慧播星平台」就是其中之一。 百度「慧播星平台」是全栈式的数字人直播解决方案,依托百度自研视觉模型/StyleSync/音频训练/PicGen/文心一言等 AI 技术,实现商家快速开播,带来用户端 7*24 小时不间断、智能专业的超拟真看播体验。
3/22/2025 1:00:51 AM
团队百度MEUX
行业首个:“中国石化 AI 数字员工”上岗,指导车主自助加油付款
中国石化 1 月 18 日在北京举行数字员工发布仪式,正式推出首位“AI 数字员工”,并在广西南宁新阳站等全国 40 余座加能站同步试点上岗。
1/20/2025 5:31:30 PM
汪淼
3D数字人生成来了!南洋理工提出StructLDM:高质量可控3D生成并支持编辑
三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。 传统三维数字人制作往往费时耗力,近年来研究者提出基于三维生成对抗网络(3D GAN)从 2D 图像中学习三维数字人,极大提高了数字人制作效率。 这些方法往往在一维隐向量空间建模数字人,而一维隐向量无法表征人体的几何结构和语义信息,因此限制了其生成质量和编辑能力。
1/14/2025 9:24:46 AM
AIGC Studio
肝了30天,我把2024年最强AI工具整理出来了!
更多盘点:. 工具大盘点! 5款AI视频生成神器优缺点分析(附打分表)24年初,Sora 爆红网络,随之大量的AI视频生成的产品趁势崛起。
1/10/2025 8:40:59 AM
言川Artie
日本罗森便利店将雇佣“海外店员”,以虚拟形象服务深夜顾客
据日经1月1日报道,日本便利店连锁品牌罗森将启用“远程海外员工”模式,通过数字化虚拟形象为深夜顾客提供服务,以应对劳动力短缺问题。
1/2/2025 9:31:54 AM
清源
中国移动联合研发 2D 数字人说话驱动系统:可生成 7 种情绪,用于 5G 新通话、AI 客服等
数字人生成技术上实现了端到端的二阶段 30 FPS 实时生成性能,并支持 512*512 人脸区域生成,同时具备高兴、悲伤等 7 种主流情绪控制生成能力。
12/9/2024 1:04:04 PM
汪淼
松下集团以 AI“复活”松下幸之助,借数字人传承创办者经营理念
松下控股株式会社内部直接接受过创始人熏陶的员工日渐减少,该公司因此决定利用生成式 AI 在集团内部探究和启发松下幸之助的理念,并传递给下一代员工。
11/29/2024 4:26:57 PM
溯波(实习)
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
OpenAI 董事会主席:如果你想快速烧掉百万美元,就开发自己的 AI 模型吧
Meta 被指控盗用 2000 余部成人影片训练 AI,或面临 3.5 亿美元天价赔偿
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
AI和云基础设施初创企业E2B如何成为88%的财富100强企业的必备选择
业界首个,腾讯混元 3D 世界模型正式发布并开源
腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑
WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用