推荐|【文献阅读与想法笔记12】GhostNet: More Features from Cheap Operations

文章目录

背景以及环境
目标任务
方法核心
- 网络结构
实验结果
自己的不成熟想法
参考文献

背景以及环境

1、现有模型又大又慢
2、神经网络在移动设备上的应用亟待解决
3、解决问题的两个思路
模型压缩，比如剪枝、量化、知识蒸馏等
高效的网络结构设计，比如MobileNet，ShuffleNet等
4、问题：在训练好的深度神经网络中，通常会包含丰富甚至冗余的特征图，以保证对输入数据有全面的理解。如下图所示，在ResNet-50中，将经过第一个残差块处理后的特征图拿出来，三个相似的特征图对示例用相同颜色的框注释。该对中的一个特征图可以通过廉价操作（用扳手表示）将另一特征图变换而获得，可以认为其中一个特征图是另一个的“幻影”。因为，本文提出并非所有特征图都要用卷积操作来得到，“幻影”特征图可以用更廉价的操作来生成。
在这里插入图片描述

目标任务

方法核心

基于一组原始的特征图，使用一系列线性变换，以更小的代价生成许多能从原始特征发掘所需信息的“幻影”特征图（Ghost feature maps）。该Ghost模块即插即用，通过堆叠Ghost模块得出Ghost bottleneck，进而搭建轻量级神经网络——GhostNet。

在本文中，作者提出了一种新颖的Ghost模块，可以使用更少的参数来生成更多特征图。具体来说，深度神经网络中的普通卷积层将分为两部分。第一部分涉及普通卷积，但是将严格控制它们的总数。给定第一部分的固有特征图，然后将一系列简单的线性运算应用于生成更多特征图。与普通卷积神经网络相比，在不更改输出特征图大小的情况下，该Ghost模块中所需的参数总数和计算复杂度均已降低。基于Ghost模块，作者建立了一种有效的神经体系结构，即GhostNet。作者首先在基准神经体系结构中替换原始的卷积层，以证明Ghost模块的有效性，然后在几个基准视觉数据集上验证GhostNet的优越性。实验结果表明，所提出的Ghost模块能够在保持相似识别性能的同时降低通用卷积层的计算成本，并且GhostNet可以超越MobileNetV3等先进的高效深度模型，在移动设备上进行快速推断。

网络结构

实验结果

在ImageNet分类任务，GhostNet在相似计算量情况下Top-1正确率达75.7%，高于MobileNetV3的75.2%。

自己的不成熟想法

参考文献

论文链接 GhostNet: More Features from Cheap Operations
[代码链接 pytorch] Surpassing MobileNetV3: “GhostNet: More Features from Cheap Operations”](https://github.com/huawei-noah/ghostnet)
[他人评述]