清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

这项研究将极大地促进了三维视觉、虚拟现实、智慧城市和无人驾驶等领域的发展。

近日，清华大学计图 (Jittor) 团队提出了一种针对三角网格的卷积神经搜集，在两个网格分类数据集上首次取得 100% 正确率，在其他多个若干进修任务中，性能显著超过现有办法。

尤为重要的是，这种鉴于细分表示的网格卷积神经搜集的提出，使得 VGG、ResNet 和 DeepLabV3 + 等二维图象的骨干搜集模型可以方便地应用到三维模型的进修上，从而突破了二维图象和三维模型在深度进修上的壁垒，将极大地促进三维视觉、虚拟现实、智慧城市和无人驾驶等领域的发展。

三角网格上的卷积搜集

三维若干进修是计算机视觉与图形学中的一个重要研究方向，鉴于三维体素、点云、网格（mesh）等数据表示，进修物体的若干形状特征。其中，网格广泛应用于建模、渲染、3D 打印等。因为网格数据较为复杂，包含点、边、面三种基本元素，缺乏规矩的结构与层次化的表示，因此也更具挑战。

近日，清华大学 Jittor 团队在 arXiv 发布了论文《Subdivision-Based Mesh Convolution Networks》，提出了一种鉴于细分结构的网格卷积搜集 SubdivNet。该办法首先将输入网格举行重网格化（remesh），构造细分结构，得到一般网格的多分辨率表示，并提出了直观灵活的面片卷积办法、上 / 下采样办法，并将成熟的图象搜集架构迁移到三维若干进修中。

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

论文链接：https://arxiv.org/abs/2106.02285

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

图 1 SubdivNet 的流程图

面片卷积与上下采样

以往的网格深度进修办法将特征存储在点或者边上，但是点的度数不固定，边的卷积不灵活。该论文提出了一种在面片上的网格卷积办法，充分利用了每个面片与三个面片相邻的规矩性质。鉴于这一规矩性质，Jittor 团队进一步依据面片之间的距离，设计了多种不同的卷积模式。

从图 2 可以看到，这种面片上的网格卷积办法，直观且灵活，有规律，可支持指定卷积核大小、步长、空洞等参数，很类似于图象的情形。图中，k 为卷积核大小，d 为空洞长度；其中 a)为三角面片卷积，b)对应的二维图象卷积，c)为卷积中可能出现的重复访问，d)为更复杂的卷积示例。

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

图 2 三角网格上的卷积示意图

由于三维数据格式中的面片顺序不固定，SubdivNet 在计算卷积结果时，通过取邻域均值、差分均值等方式，使得计算结果与面片顺序无关，满足排列不变性。图 3 给出了卷积的定义及其每项的含义。

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

图 3 卷积的定义及其每项的含义

在举行上下采样时，该办法受到传统的 Loop 细分曲面建模的启发，构造了一种鉴于细分结构的上下采样办法。如图 4a）所示，细分曲面建模对面片举行「一分四」的面片分裂，使得三维模型逐渐变得光滑。

该论文首先将网格举行重网格化，使其面片具有细分连接结构，从而可以举行「四合一」的面片合并，从高分辨率转为低分辨率，实现面片特征的 pooling 操作，如图 4b）所示。上采样时，同样对面片举行「一分四」的分裂。这样定义上下采样方式是规矩且均匀的，还可以实现双线性插值等需求。

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

图 4 细分曲面的示意图

由于卷积和上下采样规矩且灵活，Jittor 团队实现了 VGG、ResNet 和 DeepLabV3 + 等搜集架构，在三维网格模型的尝试中取得了显著的效果。

该工作由清华大学的深度进修框架 Jittor 实现，Jittor 框架提供了高效的重索引算子，无需额外的 C++ 代码即可实现邻域索引；并且在同等网格面片数量下，SubdivNet 的速度可达以往办法 [2] 的 20 多倍。

GitHub 开源地址为：https://github.com/lzhengning/SubdivNet

尝试结果

SubdivNet 在多种应用方面举行了尝试，展示了其在若干进修上的优势。更多的消融尝试可以阅读原论文。

1. 网格分类

SubdivNet 在三个网格分类数据集中举行了尝试比较，如表 1 和表 2 所示。其中，在 SHREC11 和 Cube Engraving 两个数据集上首次达到了 100% 的分类正确率。

表 1 在 SHREC11 数据集上的分类精度

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

表 2 在 CubeEngraving 数据集上的分类精度

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

该办法还把 ModelNet40 中的模型修复为紧致流形，贡献了新的数据集 Manifold40 。在此数据集上，SubdivNet 也超过了以往的网格办法。表 3 给出 ModelNet40 和 Manifold40 上的分类精度，其中前两行以位置和法向为输入的点云的最好结果，后三行是网格模型的结果。

表 3 在 Manifold40 数据集上的分类精度

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

2. 网格分隔

计图团队在人体分隔数据集、COSEG 数据集上举行了网格分隔的尝试。量化指标下，SubdivNet 的分隔准确率均高于对比的点云、网格办法。以下是分隔结果展示。

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

图 5 人体分隔结果

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

图 6 COSEG 玩具分隔结果

3. 形状对应

在量化的形状对应尝试中，SubdivNet 达到了 SOTA性能。图 6 中，给定 Source Mesh 的点，寻找 Target Mesh 中与之对应点；相同的颜色表示对应关系。

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

图 7 形状对应可视化结果

4. 网格检索

Jittor 团队还利用 RGBD 相机扫描了真实场景，以点云为输入，在网格数据库中检索相似网格模型；以下为一些检索结果。

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

图 8 从真实场景检索数据库中的三位网格模型

参考文献

Shi-Min Hu, Zheng-Ning Liu, Meng-Hao Guo, Jun-Xiong Cai, Jiahui Huang, Tai-Jiang Mu, Ralph R. Martin， Subdivision-Based Mesh Convolution Networks, 2021, arXiv:2106.02285.

Rana Hanocka, Amir Hertz, Noa Fish, Raja Giryes, Shachar Fleishman, Daniel Cohen-Or, Meshcnn: a network with an edge, ACM Transactions on Graphics, Vol. 38 No. 4, Article No. 90, 1-12.

{{userData.name}}已认证

清华大学计图团队首创三角网格面片上的卷积神经搜集，首次取得100%正确率

从开发者日到AI开发者论坛，WAIC开发者年度盛会线下重启，共论后深度进修时代的AI走向

这是机械之心举行的首场智能驾驭论坛，快来报名围观

独家对话李岩：宿华、经纬、红点资金支持，第一个「生成式推荐」创业公司｜AI Pioneers

墙裂推荐！Karpathy大模型培训课LLM101n上线了，非常基础

baidu李彦宏：开源模型是智商税，闭源模型更强大、推理本钱更低

Midjourney 再更新！V6 模型支持外绘拓展与局部重绘了!

Python 3.11正式版来了，比3.10快10-60%，官方：这或许是最好的版本

邢波任校长的MBZUAI大学国内招生了，Michael Jordan、Raj Reddy等大佬授课

无需训练，主动扩大的视觉Transformer来了

康奈尔大学发布用于增强型传感器以及高性能计算的a轴超导晶片