我可以使用卷积过滤器而不是密集层进行分类吗?

Can I use a convolution filter instead of a dense layer for clasification?

我正在阅读一篇不错的论文 S-DCNet,然后我看到了一个部分(page3,table1,classifier),其中在特征图上使用了卷积层以生成二进制分类输出作为一部分的一个内部过程。因为我是一个菜鸟,当有人和我谈论分类时,我会自动创建一个与 FC 相关的突触与 softmax 相结合,我开始怀疑……这是否可行?确实可以使用卷积层对二元结果进行分类吗?整个概念极大地激发了我的想象力,以至于我坚持要得到答案...

老实说,这实际上是如何工作的?使用卷积滤波器而不是全连接层进行分类有什么区别?

编辑(关于它是如何工作的不确定答案):我问了一位同事,他告诉我使用与当前特征图的长宽形状相同形状的过滤器阶段,可能会导致可学习的二进制输出(考虑到您还将特征图的#channels 减少为单个通道)。但是我仍然不明白这种技术背后的动机..

使用卷积作为 FC 可以(例如)使用空间大小为 (1,1) 且深度与 FC 输入大小相同的过滤器来完成。

生成的特征图与输入特征图的大小相同,但每个像素都是“FC”层的输出,其权重是共享的 1x1 conv 过滤器的权重。

这种东西主要是用来做语义分割的,意思是按像素分类。如果没记错,U-net 就是一个很好的例子。


另见 this
另请注意,1x1 卷积也有 other uses
paperswithcode 可能那里的一些网使用了这个技巧。