プーリング(Pooling)
プーリング(Pooling)は、画像処理において特徴マップの空間的な次元を削減するための操作です。プーリングは主に畳み込みニューラルネットワーク(CNN)のアーキテクチャで使用されます。
プーリングの目的は、特徴マップのサイズを縮小することで計算量を減らし、ネットワークのパラメータ数や計算負荷を削減することです。また、プーリングは不変性や位置へのロバスト性を向上させる効果も持っています。
最も一般的なプーリング操作は、最大プーリング(Max Pooling)です。最大プーリングでは、特徴マップ内の各領域から最大値を抽出し、その最大値を新しい特徴マップの値とします。これにより、特徴マップ内の局所的な最大値が保持され、空間的な情報の一部が保持されます。
他のプーリングの手法としては、平均プーリング(Average Pooling)やL2ノルムプーリング(L2-Norm Pooling)などもあります。平均プーリングでは、各領域の平均値が新しい特徴マップの値となります。L2ノルムプーリングでは、各領域のL2ノルム(ユークリッド距離)が新しい特徴マップの値となります。
プーリングは、特徴マップのサイズを削減することで計算量を減らし、局所的な特徴の不変性を向上させるという効果を持っています。これにより、ネットワークの処理効率や汎化性能が向上することが期待されます。