卷积神经网络(Convolutional Neural Network,CNN或ConvNet)是一种
具有局部连接、权重共享等特性的深层前馈神经网络.
卷积神经网络最早主要是用来处理图像信息.在用全连接前馈网络来处理
图像时,会存在以下两个问题:
(1) 参数太多:如果输入图像大小为100 × 100 × 3(即图像高度为100,宽
度为 100 以及 RGB 3 个颜色通道),在全连接前馈网络中,第一个隐藏层的每个
神经元到输入层都有 100 × 100 × 3 = 30 000 个互相独立的连接,每个连接都对
应一个权重参数.随着隐藏层神经元数量的增多,参数的规模也会急剧增加.这
会导致整个神经网络的训练效率非常低,也很容易出现过拟合.
(2) 局部不变性特征:自然图像中的物体都具有局部不变性特征,比如尺
度缩放、平移、旋转等操作不影响其语义信息.而全连接前馈网络很难提取这些
局部不变性特征,一般需要进行数据增强来提高性能.
池化<=>下采样
如何通俗易懂地解释卷积? – 马同学的回答 – 知乎
https://www.zhihu.com/question/22298352/answer/228543288
CNN的卷积是离散下的卷积运算
卷积层
feature 特征 /卷积核(filter)=>卷积运算=>feature map 特征图
![](/wp-content/uploads/2022/03/image-1.png)
非线性激活层
池化层pooling 下采样
Max Pooling 最大池化、Average Pooling平均池化
evaluation model 评估模式
我们称 为
的卷积
其连续的定义为:
其离散的定义为:
如何通俗易懂地解释卷积? – <em>马同学</em>的回答 – 知乎 https://www.zhihu.com/question/22298352/answer/228543288
W:表示当前层Feature map的大小。
K:表示kernel的大小。
S:表示Stride的大小。
下一层Feature map的大小 =(W−K)/S+1
![](/wp-content/uploads/2022/03/20180116194511472.png)