应用
OpenAI首次官宣语音项目,配音演员警报拉响
文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。今天,OpenAI 在语音领域又带给我们一点点震撼,通过文本输入以及一段 15 秒的音频示例,可以生成既自然又与原声极为接近的语音。值得注意的是,即使是小模型,只需一个 15 秒的样本,也能创造出富有情感且逼真的声音。OpenAI 将这个语音引擎命名为 Voice Engine,首次开发时间是 2022 年末,今天是 Voice Engine 预览版的首次亮相。下面为该语音引擎的一些早期示例,例如可以帮助用户翻译视频和播客等内容,输入一段原始
4/1/2024 11:18:00 AM
机器之心
CVPR 2024 | 面部+肢体动画,一个框架搞定从音频生成数字人表情与动作
AI 数字人面部与肢体的驱动算法作为数字人研发的重要环节,可以大幅度降低 VR Chat、虚拟直播和游戏 NPC 等领域中的驱动成本。近年来,基于语音生成面部、肢体和手部的动作的各类独立基线模型已经逐渐成熟。然而,直接将不同模型的动画结果混合会导致最终全身整体的动画不协调。研究者逐渐考虑使用统一的框架来同时生成面部表情和肢体动作。然而,尽管研究社区在面部的表情和肢体的动作上分别存在统一的数据标准,已有的基线模型仅在独立的数据格式上进行训练和评估,比如 FLAME (面部) 和 AMASS (肢体)。社区仍然缺少面向
4/1/2024 11:11:00 AM
机器之心
「天工大模型3.0」4月17日正式发布——同步开源4000亿参数MoE超级模型,性能超Grok1.0
2023年4月17日,昆仑万维发布自研双千亿级大语言模型「天工1.0」正式奠定了国产大模型崛起之路。在即将到来的2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」正式开启公测!「天工3.0」采用4千亿级参数MoE混合专家模型,并将同步选择开源,是全球模型参数最大、性能最强的MoE模型之一。相较于上一代「天工2.0」MoE大模型,「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码
4/1/2024 11:05:00 AM
新闻助手
马斯克称人工智能毁灭人类的可能性为 20%,但仍值得冒险
埃隆・马斯克 (Elon Musk) 在早些时候举办的 Abundance 峰会 “人工智能辩论” 研讨会上表示,即使人工智能技术有 1/5 的可能性会对人类构成威胁,但其利大于弊,我们仍然值得冒险进行研发。马斯克重新评估了之前他对人工智能的风险评估,他在研讨会上表示:“我认为人工智能有可能终结人类文明。我可能同意 Geoffrey Hinton 的观点,这个概率大约是 10% 到 20% 左右。”但他补充说:“我认为积极的可能性场景要大于消极的可能性场景。”马斯克并没有提到他是如何计算该风险的。IT之家注意到,去
4/1/2024 10:38:10 AM
远洋
三星组建 HBM 产能质量提升团队,加速 AI 推理芯片 Mach-2 开发
三星电子 DS 部门负责人庆桂显近日在社交媒体上表示三星内部正采取双轨 AI 半导体策略,同步提高在 AI 用存储芯片和 AI 算力芯片领域的竞争力。在 AI 用存储芯片部分,三星组建了由 DRAM 产品与技术负责人 Hwang Sang-joon 领导 HBM 内存产能与质量提升团队,这是其今年建立的第二个 HBM 专门团队。三星近期在 HBM 内存上进行了大规模的人才投入,旨在赢回因策略失误而被 SK 海力士拿下的 HBM 内存市场领军地位:2019 年,三星因对未来市场的错误预测,解散了当时的 HBM 研发团
4/1/2024 10:02:46 AM
溯波(实习)
大厂实战案例!AIGC在快手电商设计中的应用
写在前面:
AIGC 无疑是 23 年设计师必备神器之最,协助设计师高效的完成创作。
伴随新技术应用,大家也经常会听到一个问题,设计师会被替代吗?这里想告诉大家的是“不必焦绿”。
作为快手电商的运营设计师,我们一直以来都在探索高质高效、灵活自由的设计创作方式。过去一年 AIGC 的出现为我们带来了创作的新思路,拓展设计师的创意边界、突破个人技能上限、交付高质高效的设计,下面与大家分享我们是如何将 AI 工具引入设计流程,帮助提质、提效的一些经验与思考。
:总结过去一年 AIGC 在电商运营设计中的应用,归纳为「创意
4/1/2024 8:40:50 AM
快手电商设计中心
免费!人手必备的AI视频生成神器 PixVerse 有多好用?
前言
最近在深度使用 PixVerse 后,制作了 AIGC 视频《恭喜发福》,对比其他几款免费版 AI 视频工具 MoonValley、Morph Studio 来说,PixVerse 显然在 AI 视频的运动效果上表现得更自然,最重要的是 PixVerse「Upscale」功能,不用花钱就可以提高视频分辨率,确实太香了!:视频版当视频在手机上无法加载,可前往PC查看。一、初步体验
接下来让我们一起来试一试吧。
目前,PixVerse 可以在官网上或者 Discord 上使用。目前 Discord 上不能建立私人
4/1/2024 7:00:47 AM
yaoyao
防止聊天机器人“造谣”,谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具
无论当下 AI 聊天机器人有多么强大,都会或多或少存在一大饱受诟病的行为 —— 以看上去令人信服的方式,向用户提供与事实不符的回答。简单来说,AI 有时会在回答中“满口跑火车”,甚至“造谣”。图源 Pixabay防止 AI 大模型出现这种行为并非易事,且是一项技术性的挑战。不过据外媒 Marktechpost 报道,谷歌 DeepMind 和斯坦福大学似乎找到了某种变通办法。研究人员推出了一种基于大语言模型的工具 —— 搜索增强事实评估器(IT之家注:原名为 Search-Augmented Factuality
3/31/2024 5:09:33 PM
清源
谷歌:手机运行人工智能模型将占用大量内存
谷歌在 3 月初发布了一个奇怪的声明,称旗下两款新手机 Pixel 8 和 Pixel 8 Pro 中,只有 Pixel 8 Pro 能够运行其最新的人工智能模型“Google Gemini”。尽管两款手机的配置非常相似,但谷歌却以神秘的“硬件限制”为由拒绝在 Pixel 8 上运行该模型。这番言论让人费解,因为谷歌一直宣称 Pixel 8 是以人工智能为核心的手机,并且还专门针对智能手机设计了“Gemini Nano”模型,然而这两者居然无法兼容运行。几周后,谷歌似乎开始松口,宣布即将在 6 月的季度更新中为 P
3/31/2024 12:08:38 PM
远洋
李玟母亲声明:AI 侵权内容 7 日内必须下架,维护逝者尊严
3 月 28 日,已故知名歌手李玟的母亲委托广东梦海律师事务所就部分网络用户制作、传播“AI 复活李玟”相关短视频事宜,公开发布了一则律师声明。该声明称,根据已掌握的证据资料显示,近期部分网络用户未经李玟女士近亲属同意,利用李玟肖像制作、发布“AI 复活李玟”系列短视频,以温情之名非法牟利,借机售卖 AI 服务、恶意转评引流推广个人业务。此类视频的广泛传播已经对李玟母亲及其家人的工作和生活造成了严重干扰,同时也给本就深陷痛苦的李玟母亲及家人带来了巨大的心理冲击和二次伤害。IT之家附声明主要内容:严正警告涉嫌侵权责任
3/31/2024 11:19:05 AM
浩渺
美国众议院禁止工作人员使用微软 AI 助手 Copilot,存泄密风险
感谢据 Axios 报道,美国国会众议院出于安全考量,禁止其工作人员在工作设备上使用微软的 Copilot 生成式人工智能辅助工具。美国众议院首席行政官凯瑟琳・斯平多 (Catherine Szpindor) 在发送给工作人员的指导意见中指出,网络安全办公室认为微软 Copilot 当前的商用版本存在安全漏洞,可能导致众议院数据泄露到未经授权的云服务。因此,该程序的所有功能将被禁用并从工作人员的 Windows 设备中移除。不过IT之家注意到,微软计划在今年夏天推出适用于政府工作的 Copilot 版本。微软发言人
3/31/2024 7:35:15 AM
远洋
微软 Azure 新增 9 款逼真 AI 语音,包括美式英语、中文等
2023 年 9 月,微软 Azure 团队宣布推出适用于商业客户的一系列逼真 AI 语音。本周微软表示,9 种更真实的人工智能声音现在普遍可供这些用户使用。根据微软博客文章,这些新语音可用于各种工作和任务,例如商务聊天机器人、语音助手、电子学习以及娱乐和游戏领域。微软表示:“这一扩展扩大了我们在 91 种语言及其变体中表达内容的能力。这一进展凸显了我们对克服语言障碍和促进更具包容性和可访问性的全球通信环境的坚定承诺。”这九款新语音现已在所有 Azure 地区上线,包括:美式英语 - en-US-AvaMultil
3/31/2024 7:24:25 AM
远洋
《妈妈咪呀》主演,女星 Sara Poyzer 一夜之间被 AI 端掉饭碗?
【新智元导读】AI 淘汰人类的紧迫感越来越近了!最近,在音乐剧《妈妈咪呀》饰演主角女星,被一封 BBC 邮件告知:不用来了,AI 替代了你。前几天,OpenAI 刚宣布进军好莱坞,并放出一波导演艺术家们体验 Sora 的震撼视频。仅仅几天的时间,已经有国际著名明星,饭碗一夜之间被 AI 端掉了!她,就是音乐剧《妈妈咪呀》的主演 ——Sara Poyzer。十多年来,她凭借在剧中饰演女主角 Donna Sheridan 的表演,称霸整个伦敦西区。作为一名演员和配音艺人,她的事业非常成功。最近,Sara 主演的伦敦西区
3/30/2024 11:45:26 PM
清源
Omdia:预计今年 AI 笔记本电脑出货约 100 万台,2028 年将占笔记本出货总量约八成
感谢行业分析机构 Omdia Mobile PC 研究团队最新人工智能笔记本电脑 (AI Notebook PC) 出货预测数据显示,2024 年 AI 笔记本电脑(AI Notebook PC)出货量约为 100 万台,且约 80% 的 AI 笔记本电脑出货为 ARM 芯片架构。该机构预估,AI 笔记本电脑出货量在 2028 年将高达 1.809 亿台,且抢下约八成笔记本电脑出货量。图源 PixabayIT之家整理 Omdia 对 AI 笔记本电脑的定义如下:单独神经网络处理器 (NPU-Neural netwo
3/30/2024 10:59:06 PM
清源
华为云与贵州签约,剑指“全球最大领先的智算中心”
华为云计算技术有限公司(以下简称“华为云”)今日与贵州贵安新区管理委员会正式签署合作协议。协议指出,华为云将在贵安新区建设华为云智算基地,并以全力打造“全球最大领先的智算中心”为目标。据介绍,智算中心作为人工智能算力底座,对于抓住数字经济时代机遇,推动人工智能发展,开展“人工智能 ”行动,培育形成新质生产力具有重要意义。据统计,AI 模型所需算力每 100 天就要翻一倍,远超摩尔定律。IT之家注意到,2023 年贵州省委经济工作会就明确提出要抢抓人工智能“风口”机遇,围绕抢占智算、行业大模型培育、数据训练三个“制
3/30/2024 10:15:45 PM
汪淼
美加州大学团队发明自供电贴片,借助机器学习可使聋哑人“说话”
据外媒 NotebookCheck 今日报道,美国加州大学洛杉矶分校生物工程师近日发明了一种新型自供电贴片,可借助机器学习技术,将喉部肌肉运动等转化为说话的声音。据悉,这种可穿戴贴片可让声带损伤、疾病而导致丧失语言能力或无法正常说话的人“说话”。该粘合贴片可感知喉部肌肉运动,贴片的外层是聚二甲基硅氧烷(PDMS),中间夹着两层铜线圈作为磁感应(MI)层,两层铜线圈被单层聚二甲基硅氧烷和磁铁作为磁机械耦合(MC)层隔开。MC 层上有许多切口,使其在喉部肌肉弯曲时更容易膨胀和收缩。人在发出声音时,需要喉部肌肉的协调运动
3/30/2024 10:09:56 PM
清源
15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型
感谢OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。OpenAI 公司表示,目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespa
3/30/2024 11:50:43 AM
故渊
联合国际顶尖高校 昆仑万维开源数字智能体研发工具包AgentStudio
AgentStudio旨在为研究人员和开发者提供一个覆盖智能体完整开发流程的综合性平台,让开发者们能够轻松、高效、灵活地构建专属数字智能体。
3/30/2024 10:21:00 AM
机器之心
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
特斯拉