跳过人脸检测和关键点定位,Facebook等提出及时3D人脸姿势估量新法子

来自 Facebook AI 和美国圣母大学的研究者提出了一种 6 自由度的及时 3D 人脸姿势估量技术,可以不依赖人脸检测和人脸关键点定位独立运行。

人脸检测是给照片中的每一个人脸指定一个边境框,人脸关键点检测则需要定位特殊的人脸特征,如眼睛中心、鼻尖等。基于二者的两步走法子是很多人脸推理任务的关键所在,如 3D 重建。这种法子的处理过程通常可以表述为:首先执行人脸检测,然后在每一个检测到的人脸边境框中执行关键点检测。接下来,将检测到的关键点与参考 2D 图象或 3D 模型上对应的理想地位从事匹配,然后使用标准法子求解对齐变更。因此,「人脸对齐」和「关键点检测」这两个术语有时可以互换使用。这种法子应用起来非常成功,但计算成本很高,尤其是那些 SOTA 模型。而且,关键点检测器通常针对由特定人脸检测器生成的边境框特性从事优化,因此一旦人脸检测器更新,关键点检测器就需要重新从事优化。最后,在下图 1 所示的密集人脸图象场景中,准确定位标准的 68 个人脸关键点会变得非常困难,进而加大了估量其姿势和人脸对齐的难度。

跳过人脸检测和关键点定位,Facebook等提出及时3D人脸姿势估量新法子

为了解决这些问题,来自 Facebook AI 和圣母大学的研究者提出了以下重要察看结果:

首先,估量人脸的 6 自由度(6DoF)刚性变更比人脸关键点检测要简单。6DoF 指的是在人体在 3D 空间里的活动情况,在 3 自由度(上下俯仰、左右摇摆和滚动)的基础上增加了前 / 后、上 / 下、左 / 右三种移动方式。这一察看结果启发了很多研究者,促使他们提出「跳过关键点检测,直接从事姿势估量」的想法,但这些法子还是要为检测到的人脸估量姿势。相比之下,Facebook AI 和圣母大学的研究者的目标是在不假设人脸已经被检测到的情况下估量姿势。

其次,6DoF 姿势标签捕获的不仅仅是边境框地位信息。与一些研究者提出的 3DoF 姿势估量不同,6DoF 姿势可以转换为一个 3D-to-2D 的投影矩阵。假设有一个已知的内在相机,姿势可以使 3D 人脸与它在照片中的地位一致。因此,姿势已经捕捉了照片中人脸的地位。然而,虽然增加了两个额外的标量(6D 姿势 vs. 每一个框的四个值),6DoF 姿势还可以提供人脸的 3D 地位和方向信息。最近,有些研究用上了这一察看结果,通过提出边境框和人脸关键点的多任务学习来提高检测准确率。而本文的研究者则将两者结合在单个目标中——直接 regress 6DoF 人脸姿势。

他们提出了一个易于训练的新型及时 6DoF 3D 人脸姿势估量解决方案,可以跳过人脸检测步骤,即使在非常拥挤的图片中也不例外(如图 1)。该法子在一个基于 Faster R-CNN 的框架中 regress 6DoF 姿势。这项研究的创新之处在于,它真正摆脱了人脸对齐和关键点检测。「我们察看到,估量人脸的 6DoF 刚性变更比人脸目标点检测要简单。此外,6DoF 提供的信息要比人脸边境框标签丰富,」研究者解释道。新法子的 pipeline 可以描述为:给定一张包含多张人脸的图象,首先估量每张人脸的 6DoF 姿势。由于 6DoF 人脸姿势可以转换为一个外在相机矩阵,进而将 3D 人脸映射到 2D 图象平面,因此预测得到的 3D 人脸姿势也可用于获取准确的 2D 人脸边境框。因此,人脸检测将成为这个过程的副产品,计算开销达到最小。

跳过人脸检测和关键点定位,Facebook等提出及时3D人脸姿势估量新法子

利用 6DoF 姿势估量替代人脸边境框检测之后,输入图象中所有的 3D 人脸形态都可以得到对齐。而且,由于该姿势将具有已知几何形态的 3D 形态与图象中的面部区域对齐,因此我们可以根据大小和形态调整生成的面部边境框,匹配特定的研究需求。研究者使用小而快的 ResNet-18 骨干网络构建 img2pose 模型,并在 WIDER FACE 训练集上从事训练(该数据集包含弱监督标签和人工标注的真值姿势标签)。他们在两个领先的基准数据集( AFLW2000-3D 和 BIWI )上测试了 img2pose 的及时推断能力,发现该模型在及时运行时性能超越当前最优的人脸姿势估量器,还在关键点检测方面超越了具备类似复杂度的模型,尽管新模型并没有在边境框标签上从事优化。以下是论文中的一些实验结果:

跳过人脸检测和关键点定位,Facebook等提出及时3D人脸姿势估量新法子

跳过人脸检测和关键点定位,Facebook等提出及时3D人脸姿势估量新法子

论文链接:https://arxiv.org/pdf/2012.07791.pdf项目链接:https://github.com/vitoralbiero/img2pos

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/tiao-guo-ren-lian-jian-ce-he-guan-jian-dian-ding-wei/

(0)
上一篇 2021年 2月 9日 下午3:44
下一篇 2021年 2月 9日 下午4:10

相关推荐

  • 道阻且长,行则将至 | 安远AI x 机器之心系列讲座圆满结束

    历时一个月,安远AI与机器之心联合举办的「迈向危险、靠得住、可控的人工智能」六场系列讲座圆满结束,我们邀请了全球顶尖人工智能机构专家分享强化学习、预训练大模型、通用人工智能等内容。这六位专家分享了他们的真知灼见,并对人工智能与人类的将来展现出忧虑与希望:第1期:「寻找AGI的危险路径 」不精确的微调或方针的错误泛化可能会导致AGI追求一个不精确的方针。如果足够智能,这种未对齐(unaligned)的AGI将导致灾难性的前因。 —DeepMind研讨科学家Rohin Shah第2期:「人类与AI的

    2022年 8月 9日
  • 用技术致敬每一位妈妈,B站up主用AI复原李焕英老照片动态影像

    「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女。」

    2021年 2月 23日
  • 【重磅】世界人工智能大会——2021全世界AI财产人材高峰论坛强势来袭!

    图灵奖得主、中外院士、独角兽企业掌门人云集;智能芯片、类脑智能、双碳经济、未来医院、数字家园等热点话题荟萃;人形机械人、训练芯片等首发展品精彩纷呈;超大规模预训练模型等尖端成果竞逐大奖;还有数字人民币、无人驾驶、智慧商业等鲜活体验。

    2021年 6月 23日
  • 模块化的机器进修体系就够了吗?Bengio师生告诉你答案

    Bengio 等研讨者刚「出炉」的预印本论文,探讨了机器进修体系的一个重要方向问题。

    2022年 6月 9日
  • 论文分享 | 丢弃卷积,纯Transformer建立GAN收集

    最近,计算机视觉(CV)领域的钻研者对 Transformer 产生了极大的兴趣并陆续取得了不少突破。比如,2020 年 5 月,Facebook AI 的钻研者推出了 Transformer 的视觉版本——Detection Transformer,在性能上媲美当时的 SOTA 方法,但架构得到了极大简化;10 月,谷歌提出了 Vision Transformer (ViT),可以直接利用 transformer 对图像进行分类,而不需要卷积收集。

    2021年 2月 26日
  • 直播预约 | “BT + IT ”,这场论坛邀您共论生物盘算工业发展新范式

    9 月 2 日 13:00,2022 上海生物盘算论坛,精彩相约!随着 AI+ 生物学盘算应用的逐渐广泛,生物盘算已经成为人工智能发展的下一个明珠。依托上海强大的生物医药和人工智能工业基础,在世界人工智能大会组委会办公室指导下,由上海市生物医药工业促进中心、上海市人工智能行业协会、机械之心发起并联合主办,上海中青年知识份子联谊会、上海市经济和信息化系统中青年知识份子联谊会协办 2022 上海生物盘算论坛,论坛将于 9 月 2 日下午在张江科学会堂 303 举办。活动旨在衔接政府、药企、医院、钻研机构、创新企业等工业

    2022年 8月 31日
  • 芯耀辉完成4亿融资,红杉华夏领投助力解决芯片IP痛点

    芯片IP领先企业芯耀辉科技(以下简称”芯耀辉”)近日完成天使轮及Pre-A轮超4亿元融资。Pre-A轮由红杉华夏、高瓴创投、云晖资源和高榕资源联合投资,松禾资源、五源资源(原晨兴资源)、国策投资和大横琴集团等机构参投。老股东真格基金和大数长青同时追加投资。融资将用于吸引海内外尖端技巧人才,提升产物交付能力,功能深化和芯片生态连接能力升级。同时,芯耀辉将进一步投入服务体系。成立于2020年6月,芯耀辉集结了全球尖端的IP行业人才。中心团队均拥有数十年研发、产物及管理背景,以自主研发的进步前辈工艺芯片IP为中心,致力于服务

    2021年 2月 24日
  • 模型听人讲几句就能学得更好?斯坦福提出用谈话表明辅助进修

    谈话是人与人之间最自然的沟通方式,能帮助我们传递很多重要的信息。斯坦福大学人工智能实验室(SAIL)近日发表博客,介绍了其两篇 ACL 2020 论文。这两项研究立足于近段时间 BERT 等神经谈话模型的突破性成果,指出了一个颇具潜力的新方向:利用谈话表明来辅助进修 NLP 乃至计算机视觉范畴的使命。

    2020年 12月 1日
  • 腾讯朱雀实验室推出代码防护技巧Deep Puzzling,让代码更难被猜透

    随着AI技巧与网络安全结合得越来越紧密,鉴于AI技巧的网络攻防手段也在日益更替。11月26日,全球顶级的信息安全峰会HITB+Cyberweek 2021于近日举办,腾讯朱雀实验室专家钻研员Jifeng Zhu和钻研员Keyun Luo受邀参加,并进行了题为《Deep Puzzling: Binary Code Intention Hiding based on AI Uninterpretability》(《鉴于AI不可解释性的二进制代码用意躲藏》)的议题分享。会上,腾讯朱雀实验室展示了如何行使AI模型的特性,实

    2021年 11月 27日
  • 呆板之心CVPR线下论文分享会干货集锦,同时邀你报名ACL 2021论文分享会

    随着人工智能的火热,AAAI、NeurIPS、CVPR 等顶级学术会议的影响力也愈来越大,每年接收论文、参会人数的数量连创新高。但受疫情影响,近两年国外举办的学术会议都转为了线上,无法满足学者们现场交流的需求。以 CVPR 为例,2019 年,CVPR 注册参会人数高达 9227 人,其中来自国内的参会人数就达到 1044 位。因此,在 2020 年和 2021 年,国内 AI 从业者因疫情限制无法进行有效的学术交流。

    2021年 7月 1日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注