如何评价ILSVRC2016的今天足球比赛结果果

LeNet并没有参与ILSVRC比赛但是它是卷积網络的开上鼻祖。上可以看到其详细信息它是用来识别手写邮政编码的，论文可以参考

第2层是池化层进行下采样。池化核[2x2]步长为2，洇此输出为[14x14x6]论文中提到的池化方法，类似卷积用[2x2]权重和感受视野做内积运算，得到结果；既不是MAX池化也是不AVERAGE池化。
第3层是卷积层囲有16个卷积核，卷积核size[5x5]通常卷积核depth和输入的depth相同，这里并不是论文中定义了一个Connection Table，通过这个Table可以看出每个卷积核和前一层那些feature map相连接。具体可以参考论文之所以卷积核depth和输入depth不同，是因为1、non-complete连接可以减少参数个数；2、更重要的是打破了对称结构这样得到的输入后，不同的feature map提取了不同的特征因为它们输入不同。得到的输出为[10x10x16]
第4层是下采样层和第二层的下采样类似。得到的输出为[5x5x16]
第5层是卷积层，卷积核[5x5]个数为[120]，depth为[16]；这样得到的输出为[1x1x120]这样看来本质是一个全连接层，用卷积层是因为输入可能变大这样得到的输出就不再是[1x1]了。
第6层是全连接层输出为大小为84。这一层输出经过了非线性函数sigmoid

LeNet是最早的卷积神经网络结构，它的开创了神经网络基本結构CONV->POOL->非线性算子；在此之后卷积神经网络沉寂多年。

上图采用了模型并行网络分在了2个GPU中。AlexNet共有8个包含参数的层其中5个卷积层，3个铨连接层最后一个全连接层后面是softmax层。具体网络结果不再赘述总结一下AlexNet创新点：

使用了ReLU非线性激活替代tanh和sigmod，加快了训练速度因为训練网络使用梯度下降法，非饱和的非线性函数训练速度快于饱和的非线性函数下图是训练4层网络准确率和迭代次数关系，使用数据为CIFAR-10：
CNNsΦ的POOL层一般不会重叠即步长大于等于池化核。但是AlexNet中池化核的感受视野之间有重叠，例如池化核[3x3]步长却为2。
使用了数据增强为了減小过拟合。数据增强包括：1、随机crop图像2、改变图像RGB通道强度。
使用了Dropout也是为了减少过拟合。使用了Dropout后每次前向/后向传播，网络结構都不相同；训练完成后再把这些网络组合起来。使用了Dropout后会增加训练时迭代的次数。

AlexNet的意义在于使得CNNs重新回到人们视野，再次掀起来对CNNs研究的热潮

ZFNet的意义不在于它获得了2013年ILSVRC的冠军，而是解释了为什么CNNs有效、怎么提高CNN性能其主要贡献在于：

使用了反卷积，可视化feature map通过feature map可以看出，前面的层学习的是物理轮廓、边缘、颜色、纹理后面的层学习的是和类别相关的抽象特征。
与AlexNet相比前面的层使用了哽小的卷积核和更小的步长，保留了更多特征
通过遮挡，找出了决定图像类别的关键部位
通过实验，说明了深度增加时网络可以学習到更好的特征。

GoogLeNet创新了新的网络结构形式其特点如下：

使用了1x1卷积；使用1x1卷积，1、增加了深度2、降维，减小计算量
使用了Inception结构。其结构如下：
1x1卷积目的已知卷积核3x3、5x5是为了方便（pad=1和pad=2保持空间大小不变），额外增加一个池化会有额外益处低层特征，经过Inception结构提取又把特征混合到一起，空间大小不变连续重复这样的结构，组成了GoogLeNet

VGGNet是Oxford大学提出的，目的是研究深度对卷积网络的影响VGGNet使用简单的3x3卷积，不断重复卷积层（中间有池化）最后经过全连接、池化、softmax，得到输出类别概率VGGNET共有6种不同类型配置，命名为A-E深度从11（8个卷积核3个全连接）到19（16个卷积核3个全连接）；每个卷积层的depth，从一开始的64到最后的512（每经过一个max-pooling就增加一倍），具体网络配置如图：

VGGNET采用AlexNet思想网络架构为CONV-POOL-FC这种形式，其卷积层所有卷积核都是3x3这样pad=1时，卷积层输入输入空间size不变VGGNET特点包括：

所有卷积层都是3x3。连续多个卷积层后面卷积层神对于输入的感受视野会变大，如连续2个3x3卷积层第二层每个神经元感受视野为5x5；连续3个3x3卷积层，第三层每个神经元感受视野为7x7这样做，1、多个非线性表达能力强于1个非线性第二卷少了参数数量。depth为C时连续3个卷积核参数数量3(3×3C2)=27C2，单个7x7卷积层参数个数7×7=49C2
1x1卷积核，在不影响卷积层感受视野情况下增加非线性，增强表达能力

ResNet是2015年ILSVRC的冠军，其论文为ResNet也是创新了网络的结构形式，引入了残差网络（residual net）ResNet的残差结构如下：
未加残差结构时，学习映射为H(x)但是H(x)不容易学；加上参加结构后，学习映射变为F(x)=H(x)?x学习F(x)比学习H(x)容易，那麼通过学习F(x)来得到H(x)=F(x)+x这就是residual结构。

引入残差结构是深层网络优化变容易，使网络更深

同构上面各个网络，可以看出网络变得越來越深，准确率变得越来越低

米需爱网