VGG
Visual Geometry Group [2014]
完全使用小的卷积核(
特征:
- 输入图像尺寸均为
- 均为 5 层 Max Pooling
- 所有卷积层后接 ReLU 激活
- 全系列均未使用局部响应归一化(LRN)
- 卷积部分后均为 3 层全连接(FC-4096 → FC-4096 → FC-1000)
VGG-16
结构
层名称 | 类型 | 配置 | 输出尺寸 | 参数量 |
---|---|---|---|---|
input | 输入层 | 224×224 RGB 图像 | 224×224×3 | 0 |
conv1_1 | 卷积层 | 3×3×64, stride=1, padding=1 | 224×224×64 | 1,792 |
conv1_2 | 卷积层 | 3×3×64, stride=1, padding=1 | 224×224×64 | 36,928 |
pool1 | 最大池化 | 2×2, stride=2 | 112×112×64 | 0 |
conv2_1 | 卷积层 | 3×3×128, stride=1, padding=1 | 112×112×128 | 73,856 |
conv2_2 | 卷积层 | 3×3×128, stride=1, padding=1 | 112×112×128 | 147,584 |
pool2 | 最大池化 | 2×2, stride=2 | 56×56×128 | 0 |
conv3_1 | 卷积层 | 3×3×256, stride=1, padding=1 | 56×56×256 | 295,168 |
conv3_2 | 卷积层 | 3×3×256, stride=1, padding=1 | 56×56×256 | 590,080 |
conv3_3 | 卷积层 | 3×3×256, stride=1, padding=1 | 56×56×256 | 590,080 |
pool3 | 最大池化 | 2×2, stride=2 | 28×28×256 | 0 |
conv4_1 | 卷积层 | 3×3×512, stride=1, padding=1 | 28×28×512 | 1,180,160 |
conv4_2 | 卷积层 | 3×3×512, stride=1, padding=1 | 28×28×512 | 2,359,808 |
conv4_3 | 卷积层 | 3×3×512, stride=1, padding=1 | 28×28×512 | 2,359,808 |
pool4 | 最大池化 | 2×2, stride=2 | 14×14×512 | 0 |
conv5_1 | 卷积层 | 3×3×512, stride=1, padding=1 | 14×14×512 | 2,359,808 |
conv5_2 | 卷积层 | 3×3×512, stride=1, padding=1 | 14×14×512 | 2,359,808 |
conv5_3 | 卷积层 | 3×3×512, stride=1, padding=1 | 14×14×512 | 2,359,808 |
pool5 | 最大池化 | 2×2, stride=2 | 7×7×512 | 0 |
flatten | 展平层 | - | 7×7×512 | 0 |
fc6 | 全连接层 | 25088 → 4096 | 4096 | 102,764,544 |
fc7 | 全连接层 | 4096 → 4096 | 4096 | 16,781,312 |
fc8 | 全连接层 | 4096 → 1000 | 1000 | 4,097,000 |
softmax | 分类层 | - | 1000 | 0 |
总参数量:138,357,544
卷积层参数计算