AI在线 AI在线

arXiv 2025 | 无需增参!加权卷积wConv2D助力分类去噪双提升,传统CNN焕然一新!

一眼概览本文提出了一种无需增加参数的加权卷积算子,通过引入空间密度函数显著提升CNN在图像分类与去噪任务中的性能表现。 核心问题传统卷积操作默认局部邻域内的像素等权贡献,忽视其空间位置差异,这限制了模型对空间特征的刻画能力。 该研究旨在解决如何在不增加模型参数的前提下,使卷积操作能够自适应地感知像素间的空间结构,从而提升图像分类与去噪性能。

1. 一眼概览

本文提出了一种无需增加参数的加权卷积算子,通过引入空间密度函数显著提升CNN在图像分类与去噪任务中的性能表现。

2. 核心问题

传统卷积操作默认局部邻域内的像素等权贡献,忽视其空间位置差异,这限制了模型对空间特征的刻画能力。该研究旨在解决如何在不增加模型参数的前提下,使卷积操作能够自适应地感知像素间的空间结构,从而提升图像分类与去噪性能。

3. 技术亮点

  • 空间加权机制:引入对称密度函数,对卷积邻域内的像素赋予不同权重,使模型关注中心像素及其空间分布;
  • 无额外参数负担:密度函数参数为预设超参,不增加训练参数量,完全兼容现有CNN架构;
  • 通用性强:适用于任意维度规则网格(如2D图像、3D体数据、1D时间序列),具备广泛拓展潜力。

4. 方法框架

加权卷积的实现主要包括以下步骤:

  • 密度函数定义:对称、正定、秩为1,仅需少量参数定义(如3×3核只需1个);
  • 核权融合:每轮训练中将密度函数与卷积核逐元素相乘,动态更新加权卷积核;
  • 高效执行:预计算密度函数,计算量与标准卷积相当,适配PyTorch环境。

5. 实验结果速览arXiv 2025 | 无需增参!加权卷积wConv2D助力分类去噪双提升,传统CNN焕然一新!

论文在两个任务上验证了加权卷积的有效性:

📌 图像分类(CIFAR-100)

• VGG:准确率由 56.89% 提升至 66.94%,F1值从 0.566 提升至 0.670;

• GAC-SNN:准确率由 54.32% 提升至 62.24%。

📌 图像去噪(DIV2K)

• DnCNN:PSNR由 20.17 提升至 22.63(3×3核);

• CGNet:PSNR由 26.01 提升至 28.07(5×5核)。

⏱ 训练耗时

• 加权卷积训练时间仅略高(~5%),在大图像尺寸时影响更小。

6. 实用价值与应用

该方法广泛适用于图像分类、图像去噪、医学影像处理等任务,特别适合在不改变网络结构或参数量的前提下提升模型表现。同时对3D体积数据、视频、时序信号等具有良好的推广性。

7. 开放问题

• 加权密度函数是否可学习而非手动设定?如何进一步优化其形式?

• 在动态输入(如视频序列)中,能否设计时空联合加权密度函数?

• 方法在大规模多维数据(如医学CT、MRI体积)中的扩展性能如何?

相关资讯

论文分享 | 丢弃卷积,纯Transformer构建GAN网络

最近,计算机视觉(CV)领域的研究者对 Transformer 产生了极大的兴趣并陆续取得了不少突破。比如,2020 年 5 月,Facebook AI 的研究者推出了 Transformer 的视觉版本——Detection Transformer,在性能上媲美当时的 SOTA 方法,但架构得到了极大简化;10 月,谷歌提出了 Vision Transformer (ViT),可以直接利用 transformer 对图像进行分类,而不需要卷积网络。
2/26/2021 2:27:00 PM
机器之心

清华大学计图团队首创三角网格面片上的卷积神经网络,首次取得100%正确率

这项研究将极大地促进了三维视觉、虚拟现实、智慧城市和无人驾驶等领域的发展。
6/20/2021 1:14:00 PM
机器之心

Yann LeCun主讲,纽约大学《深度学习》2021春季课程放出,免费可看

Yann LeCun 主讲的《深度学习》课程现已全部在线可看!
11/16/2021 2:37:00 PM
机器之心
  • 1