应用
全方位盘点!7个常用的数字人 AI 设计神器
数字人 IP 设计是一项复杂而富有挑战性的任务,需要借助各种工具来实现。在这个领域,有许多优秀的工具可供选择,它们可以帮助我们创建出逼真、生动的数字人。本文将介绍一些常用的数字人制作工具,包括 MJ SD、虚幻引擎、Blender/C4D/MAYA、SadTalker、微软 Azure、PIKA 和 runway。这些工具在数字人设计的不同方面都有着独特的优势,我们将逐一探讨它们的功能和特点。通过了解这些工具,你将能够更好地掌握数字人设计的技术,实现你的创意想象。
更多数字人干货:一、形象生成工具
1. MJ SD
1/29/2024 12:17:40 AM
团队58UXD
让IP替品牌讲好故事!夸克x变形金刚联名设计过程复盘
当下越来越多的品牌加入跨界 IP 营销队伍,可以看到如国潮、潮流服饰、二次元、影视等的联名,其底层逻辑还是品牌在寻找一种流量变现。
对于夸克,我们认为与其说教式的结合或博眼球式的曝光,不如换个角度,找到两者的契合点。把品牌的理念、能量寄托到 IP 上,由场景角色的化身为你讲好品牌故事,可能更容易让人记住。在不久前的期末备考期,夸克跟变形金刚电影的联名中,我们实践了这种思路。
而说到这次跨界营销中的亮点,夸克与变形金刚电影的联名手办作为一种新的营销策略,为品牌带来了更多的曝光和关注度。
更多IP设计干货:一、定位
生
1/27/2024 9:05:16 AM
团队Alibaba Design
多模态大模型,阿里通义千问能和GPT-4V掰手腕了
通义千问的图像推理能力,最近有了大幅提升。2024 年,大模型领域要卷什么?如果没有思路的话,不妨看看各家大厂都在押注什么方向。最近一段时间,先是 OpenAI 推出 GPT-4V,让大模型拥有了前所未有的图像语义理解能力。谷歌随后跟上,发布的 Gemini 成为了业界第一个原生的多模态大模型,它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。很明显,新的方向就是多模态。继 GPT-4 在语言方向的里程碑式突破之后,业界普遍认为「视觉」是下一个爆发的赛道。毕竟人类的五感之中有 80
1/26/2024 2:53:00 PM
机器之心
Mamba论文为什么没被ICLR接收?AI社区沸腾了
基于 Mamba 的创新正不断涌现,但原论文却被 ICLR 放到了「待定区」。2023 年,Transformer 在 AI 大模型领域的统治地位被撼动了。发起挑战的新架构名叫「Mamba」,它是一种选择性状态空间模型( selective state space model),在语言建模方面可以媲美甚至击败 Transformer。而且,它可以随上下文长度的增加实现线性扩展,其性能在实际数据中可提高到百万 token 长度序列,并实现 5 倍的推理吞吐量提升。在发布之后的一个多月里,Mamba 逐渐展现出自己的影
1/26/2024 2:46:00 PM
机器之心
OpenAI官方下场修复GPT-4变懒,上新多个模型、还大降价
今天,OpenAI 一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。不知大家是否还记得,去年年底 GPT-4 开始变「懒」的事实。比如在高峰时段使用 GPT-4 或 ChatGPT API 时,响应会变得非常缓慢且敷衍,有时它会拒绝回答用户提出的问题,甚至还会单方面中断对话。 这种情况对于码农来说,更是深有体会,有人抱怨道「让 ChatGPT 扩展一些代码,它竟然让我自己去写。」原本想借助 ChatGPT 帮助自己编写代码,现在好
1/26/2024 2:41:00 PM
机器之心
大模型推理成本排行榜来了:贾扬清公司效率领跑
风投烧完之后,哪些大模型创业公司会开始盈利?「大模型的 API 是个亏本买卖吗?」随着大语言模型技术的逐渐实用化,越来越多的科技公司提出了大模型 API 供开发者们使用。但前有 OpenAI「每天烧掉 70 万美元」,我们也有理由怀疑以大模型为基础的业务到底能不能持续。本周四,AI 创业公司 Martian 为我们仔细盘算了一下。排行榜链接: LLM Inference Provider Leaderboard 是一个开源的大模型 API 推理产品排行榜。对于每个供应商的 Mixtral-8x7B 和 Llama-
1/26/2024 2:35:00 PM
机器之心
大模型×文本水印:清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述
本文介绍首个大模型时代下的文本水印综述,由清华、港中文、港科广、UIC、北邮联合发布,全面阐述了大模型时代下文本水印技术的算法类别与设计、评估角度与指标、实际应用场景,同时深入探讨了相关研究当前面临的挑战以及未来发展的方向,探索文本水印领域的前沿趋势。论文:A Survey of Text Watermarking in the Era of Large Language Models论文链接::文本水印新纪元文本水印是一种信息隐藏技术,起源可以追溯到上个世纪 90 年代。它通过将机密信息(水印)嵌入文本中,实现了
1/26/2024 2:29:00 PM
机器之心
Controlnet 最新动态!6款超好用的新模型解析(附下载)
大家好我是花生~
之前为大家系统介绍过 Stable Diffusion WebUI 中 Controlnet 插件的安装使用方法,也系统梳理过各个模型的用法。现在 Controlnet 又有了一些新的模型和功能,今天正好为大家梳理一下。相关模型文件都在文末的云盘链接内,有需要的小伙伴记得下载~
Controlnet 相关推荐:一、Animal_openpose
Animal_openpose 是一个专门提取狗、鹿、马、豹等四足动物姿势骨架的模型,也可以用来引导人马等奇幻形象的生成。使用时需要:
① 下载 rtmp
1/26/2024 7:35:36 AM
夏花生
美国家AI研究资源试点项目上线,NASA、英伟达、OpenAI等捐赠关键基础资源
机器之能报道编辑:吴昕为确保美国在 AI 技术领域的领先地位,拜登政府曾在几个月前发布 AI 行政命令。该行政命令指出,将通过国家人工智能研究资源试点( National AI Research Resource,NAIRR )促进美国各地的 AI 研究。今天,美国国家科学基金会( NSF )正式启动这个庞大的试点项目,让更多美国研究人员和学校(而不仅仅是财力雄厚的科技公司或精英大学及其研究人员)获得计算资源。试点项目的官网显示NSF 联合了 10 个联邦机构以及多家私营企业、非盈利组织等机构组成联盟,为有抱负的
1/25/2024 7:06:00 PM
机器之能
小米新一代Kaldi团队论文解读:新型自动语音识别 (ASR) 模型Zipformer诞生之路|ICLR 2024 Oral
近日,小米集团新一代 Kaldi 团队关于语音识别声学模型的论文《Zipformer: A faster and better encoder for automatic speech recognition》被 ICLR 2024 接收为 Oral (Top 1.2%)。论文链接:: Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队,专注于开源语音基础引擎研发,从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路,旨在提
1/25/2024 5:14:00 PM
机器之心
顺网科技公布新战略,推出算力及AI两大业务板块
近日,顺网科技(300113.SZ)对外公布新战略——“立足算力,聚焦AI”,并揭晓了全新的品牌标识。围绕该战略,顺网科技在算力及AI两大业务板块推出了系列创新产品及业务,涵盖顺网算力塔、顺网算力市场两大新产品以及全新的顺网智算中心业务;同时,灵悉智能体引擎及基于该引擎开发的AI陪伴应用“唠唠”也得到了全面展示。顺网科技将在成熟的电竞科技及ChinaJoy业务的支撑下,在算力与AI的黄金赛道重点发力。算力方面,顺网的算力服务路径将从垂直型向多场景转变。顺网科技聚焦垂直行业算力服务的“顺网雲”业务正式升级为“顺网算力
1/25/2024 4:53:00 PM
机器之心
腾讯发布2024数字科技前沿应用趋势,涉及多模态大模型、具身智能、Agent等
1月24日,腾讯发布《2024数字科技前沿应用趋势》报告,预测了数字科技未来发展趋势和应用前景。“过去一年,我们见证了数字科技的加速度。眺望未来2-3年的科技趋势,我们正驶向一个由连接衍生交互、由计算催生智能的时代。”腾讯集团副总裁、腾讯研究院院长司晓说。《2024数字科技前沿应用趋势》报告中提出:高性能计算、量子计算、云计算和边缘计算这“四大计算”融汇贯通,正催生全新的计算范式;通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台, AI治理将引领我们踏上更智慧、更安全的未来。此外,
1/25/2024 3:53:00 PM
新闻助手
Hinton、LeCun、Bengio三巨头,马维英、陈海波等华人入选,2023 ACM Fellow公布
本届 ACM Fellow 包揽了万维网发明者、深度学习三巨头等重磅名人学者。今天,美国计算机协会 ACM(Association for Computing Machinery)公布了最新一届 Fellow 名单。ACM 创立于 1947 年,是全世界计算机领域影响力最大的专业学术组织之一。ACM Fellow 是由该组织授予资深会员的荣誉,目的为表彰会员中对于计算机相关领域贡献前 1% 的学者,其审查过程十分严格,每年遴选一次,研究员由同行提名,提名由委员会审查。本年度新入选科学家中共有 68 人,他们的贡献涉
1/25/2024 3:16:00 PM
机器之心
全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步
具身智能,首先就是要共用 AI。过去一年,生成式人工智能发展的核心关键词,就是「大」。人们逐渐接受了强化学习先驱 Rich Sutton 充分利用算力「大力出奇迹」的思潮,庞大的数据量是 AI 模型展现出惊人智慧的核心原因。数据规模越大、质量越高、标注越细,模型就能了解到更全面的世界知识,从而拟合出更加智能的结果。那么,为什么人工智能的进展还没有转化成科幻片中那种全能管家机器人呢?能清理桌子、叠衣服、做早餐的机器人在哪里?一个重要的原因是机器人领域很难「大力出奇迹」,生成式 AI 的文字或图片训练数据在网络上就能轻
1/25/2024 2:56:00 PM
机器之心
物理与 AI 的融合,中国科学院大气物理研究所物理耦合图神经网络,提升降水预报技巧
编辑 | ScienceAI大模型时代,纯数据驱动的气象、气候模型效果逐渐追赶甚至赶超数值模式。然而,目前气象、气候大模型也仍然存在不少问题。比如物理一致性不高、辐散风预报效果不好等等,这些问题限制了对于降水等复杂天气气候现象的预测能力。目前,将物理、大气动力与深度学习模型结合成为提升模型能力,解决目前瓶颈问题的一条重要途径。近日,中国科学院大气物理研究所黄刚研究员团队基于地球系统数值模拟装置(寰)的数据和算力支持,从物理变量耦合关系角度出发,结合图神经网络对多变量进行物理软约束,提升了数值模式的降水预报技巧,在物
1/25/2024 2:09:00 PM
ScienceAI
未来五年AI如何改变各学科?从LLM到AI蛋白设计、医疗保健......
2019—2023 年《Nature Machine Intelligence》封面编辑 | X五年前(2019 年 1 月),《Nature Machine Intelligence》创刊。当然,就人工智能(AI)而言,五年前似乎是一个不同的时代。1 月 24 日,Nature Machine Intelligence 杂志在《Anniversary AI reflections》(周年人工智能反思)专题中,再次联系并采访了近期在期刊发表评论和观点文章的作者,请他们从各自所在领域中举例说明人工智能如何改变科学过程
1/25/2024 2:07:00 PM
ScienceAI
ComfyUI 傻瓜整合包发布!一键安装,SD 进阶自学必备!
大家好我是花生~
上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包,让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了,我也安装试用了一下,的确非常方便,今天就为大家详细介绍一下整合包的用法 ~
ComfyUI 相关教程:一、ComfyUI 简介
ComfyUI 本体 Github 主页:
ComfyUI 和大家熟知的 WebUI 一样,都是 Stable Diffusion 的一种用户界面,可以实现文生图、图生图、图像处理、AI 视频生成等操作。但 ComfyUI 是节点式模块化的
1/25/2024 8:50:36 AM
夏花生
视频里有前男友?谷歌最新AI视频生成器 Lumiere,轻松让他消失
机器之能报道编辑:SIA最喜欢的视频里有前男友?现在,你可以轻松将他删除了。事实再次证明,AI 生成视频技术的发展速度令人瞠目。过去几个月,我们一直挣扎在 AI 生成的威尔·史密斯吃意大利面的尴尬场景里,以至于一段再正常不过的吃面场景被视为视频生成领域的“图灵测试”。今天,谷歌又研发出全新的时空扩散模型 Lumiere,将 AI 视频生成水准推向新高度。法语里, Lumiere 意思是启蒙者。Lumiere 几乎集齐了常见视频生成和编辑功能,也是迄今为止我们所见过的最先进的视频生成器。Lumiere 会根据用户自然
1/24/2024 4:45:00 PM
机器之能
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
蛋白质
具身智能
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
字节跳动
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉