YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器

在 5-160 FPS 范围内速率和精度超过所有已知方向检测器。

在 YOLOv6 推出后不到两个星期,提出 YOLOv4 的团队就发布了更新一代的版本。本周三,YOLOv7 的论文被提交到了预印版论文平台 arXiv 上,其三位作者 Chien-Yao Wang、Alexey Bochkovskiy 和 Hong-Yuan Mark Liao 是 YOLOv4 的原班人马。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器论文链接:https://arxiv.org/abs/2207.02696GitHub 链接:https://github.com/WongKinYiu/yolov7YOLOv7 在 5 FPS 到 160 FPS 范围内,速率和精度都超过了所有已知的方向检测器,并在 GPU V100 上,30 FPS 的情况下达到及时方向检测器的最高精度 56.8% AP。YOLOv7 是在 MS COCO 数据集上从头开始训练的,不利用任何其他数据集或预训练权重。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器相对于其他类型的工具,YOLOv7-E6 方向检测器(56 FPS V100,55.9% AP)比鉴于 transformer 的检测器 SWINL Cascade-Mask R-CNN(9.2 FPS A100,53.9% AP)速率上高出 509%,精度高出 2%,比鉴于卷积的检测器 ConvNeXt-XL Cascade-Mask R-CNN (8.6 FPS A100, 55.2% AP) 速率高出 551%,精度高出 0.7%。此外, YOLOv7 的在速率和精度上的表现也优于 YOLOR、YOLOX、Scaled-YOLOv4、YOLOv5、DETR 等多种方向检测器。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器YOLOv7 技术要领介绍近年来,及时方向检测器仍在针对分歧的边缘设备进行开发。例如,MCUNet 和 NanoDet 的开发专注于生产低功耗单芯片并提高边缘 CPU 的推理速率;YOLOX、YOLOR 等要领专注于提高各种 GPU 的推理速率;及时方向检测器的发展集中在高效架构的计划上;在 CPU 上利用的及时方向检测器的计划主要鉴于 MobileNet、ShuffleNet 或 GhostNet;为 GPU 开发的及时方向检测器则大多利用 ResNet、DarkNet 或 DLA,并利用 CSPNet 策略来优化架构。YOLOv7 的发展方向与当前主流的及时方向检测器分歧,钻研团队希望它能够同时支持移动 GPU 和从边缘到云端的 GPU 设备。除了架构优化之外,该钻研提出的要领还专注于训练过程的优化,将重点放在了一些优化模块和优化要领上。这可能会增加训练成本以提高方向检测的准确性,但不会增加推理成本。钻研者将提出的模块和优化要领称为可训练的「bag-of-freebies」。对于模型重参数化,该钻研利用梯度传播门路的概念分析了适用于分歧网络层的模型重参数化策略,并提出了有计划的重参数化模型。此外,钻研者发现利用动态标签调配技术时,具有多个输出层的模型在训练时会产生新的问题:「如何为分歧分支的输出调配动态方向?」针对这个问题,钻研者提出了一种新的标签调配要领,称为从粗粒度到细粒度(coarse-to-fine)的引导式标签调配。该钻研的主要贡献包括:(1) 计划了几种可训练的 bag-of-freebies 要领,使得及时方向检测可以在不增加推理成本的情况下大大提高检测精度;(2) 对于方向检测要领的演进,钻研者发现了两个新问题:一是重参数化的模块如何替换原始模块,二是动态标签调配策略如何处理调配给分歧输出层的问题,并提出了解决这两个问题的要领; (3) 提出了及时方向检测器的「扩充(extend)」和「复合扩大(compound scale)」要领,以有效地利用参数和计较; (4) 该钻研提出的要领可以有效减少 SOTA 及时方向检测器约 40% 的参数和 50% 的计较量,并具有更快的推理速率和更高的检测精度。在大多数关于计划高效架构的文献中,人们主要考虑的因素包括参数的数量、计较量和计较密度。下图 2(b)中 CSPVoVNet 的计划是 VoVNet 的变体。CSPVoVNet 的架构分析了梯度门路,以使分歧层的权重能够学习更多分歧的特点,使推理更快、更准确。图 2 (c) 中的 ELAN 则考虑了「如何计划一个高效网络」的问题。YOLOv7 钻研团队提出了鉴于 ELAN 的扩大 E-ELAN,其主要架构如图 2(d)所示。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器新的 E-ELAN 完全没有改变原有架构的梯度传输门路,其中利用组卷积来增加添加特点的基数(cardinality),并以 shuffle 和 merge cardinality 的方式组合分歧组的特点。这种操作方式可以增强分歧特点图学得的特点,改进参数的利用和计较效率。无论梯度门路长度和大规模 ELAN 中计较块的堆叠数量如何,它都达到了稳定状态。如果无限堆叠更多的计较块,可能会破坏这种稳定状态,参数利用率会降低。新提出的 E-ELAN 利用 expand、shuffle、merge cardinality 在不破坏原有梯度门路的情况下让网络的学习能力不断增强。在架构方面,E-ELAN 只改变了计较块的架构,而过渡层(transition layer)的架构完全没有改变。YOLOv7 的策略是利用组卷积来扩大计较块的通道和基数。钻研者将对计较层的所有计较块应用相同的组参数和通道乘数。然后,每个计较块计较出的特点图会根据设置的组参数 g 被打乱成 g 个组,再将它们连接在一起。此时,每组特点图的通道数将与原始架构中的通道数相同。最后,该要领添加 g 组特点图来执行 merge cardinality。除了保持原有的 ELAN 计划架构,E-ELAN 还可以引导分歧组的计较块学习更多样化的特点。如果将这些要领应用于鉴于连接的架构,我们会发现,当对深度放大或缩小时,鉴于连接的计较块之后的过渡层的入度会随之减小或增加,如下图 3(a)和(b)所示。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器因此,对鉴于串联的模型,我们不能单独分析分歧的扩大因子,而必须一起考虑。该钻研提出图 3(c),即在对鉴于级联的模型进行扩大时,只需要对计较块中的深度进行扩大,其余传输层进行相应的宽度扩大。这种复合扩大要领可以保持模型在初始计划时的特性和最佳结构。此外,该钻研利用梯度流传播门路来分析如何重参数化卷积,以与分歧的网络相结合。下图 4 展示了该钻研计划的用于 PlainNet 和 ResNet 的「计划重参数化卷积」。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器在标签调配策略方面,下图 5 (a) 和 (b) 分别显示了「没有」和「有」深度监督的方向检测器架构。钻研者将负责最终输出的 head 称为 lead head,用于辅助训练的 head 称为 auxiliary head。该钻研所提的两种深度监督标签调配策略分别如图 5 (d) 和 (e) 所示。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器与通常的独立标签调配器(图 5(c) )分歧,该钻研提出的标签调配器通过 lead head 预测和实况进行优化,以同时获得训练 lead head 和 auxiliary head 的标签。下面我们具体看一下 YOLOv7 与其他方向检测模型的性能比较。

YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器

表 1. 与基线方向检测器的比较。作者将提出的新要领与用于通用和移动 GPU 的 SOTA 方向检测器进行了比较,详细结果如下表 2 所示。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器如果我们利用输入分辨率 1280 比较 YOLOv7 和 YOLOR,YOLOv7-W6 的推理速率比 YOLOR-P6 快 8 fps,检测率也提高了 1% AP。YOLOv7-E6 和 YOLOv5-X6(r6.1)对比,前者 AP 增益比后者高 0.9%,参数少 45%,计较量少 63%,推理速率提升 47%。YOLOv7-D6 的推理速率与 YOLOR-E6 接近,但 AP 提高了 0.8%。YOLOv7-E6E 的推理速率与 YOLOR-D6 接近,但 AP 提高了 0.3%。YOLOv7上线:无需预训练,5-160 FPS内超越所有方向检测器感兴趣的读者可以阅读论文原文,了解更多钻研细节。

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/33270

(0)
上一篇 2022年7月8日 下午2:22
下一篇 2022年7月8日 下午2:37

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注