- 例えばVGG-16を考えてみると,
- 最後の全結合って計算量やばいよね
- VGG-16だと, $7 \times 7 \times 512 → 1 \times 1 \times 4096 $ で全結合
- パラメタ数は $(7 \times 7 \times 512) \times (1 \times 1 \times 4096) $ → エグい
- チャネル方向に平均をとって, そいつらをconcatしてあげればOKじゃない?
- → Global Average Pooling
- 性能は普通にflattenした場合とさほど変わらないらしい
This page looks best with JavaScript enabled
Global Average Pooling
· ☕ 1 min read