chainer.functions.
spatial_pyramid_pooling_2d
(x, pyramid_height,
pooling_class)[source]
空間的なピラミッド・プーリング関数。
この関数は入力された特徴マップのサイズにかかわらず、決められた長さのベクトルを出力します。
まず、入力した4次元配列x
を、異なるカーネルサイズ、パディングサイズでプーリング処理を行ってから、全てのプーリング結果の最初の次元を除いた全ての次元を1次元化し、それを最終的に2次元目に結合します。
ii番目のピラミッドレベルで、プーリング処理のカーネルサイズ (k(i)h,k(i)w)(kh(i),kw(i)) と パディングサイズ (p(i)h,p(i)w)(ph(i),pw(i)) は下記のように計算されます:
ここで、 ⌈⋅⌉⌈⋅⌉ はシーリング関数を表し、bh,bwbh,bw
はそれぞれ入力 x
の高さと幅を表します。
ピラミッドレベル iiのインデックス は0から始まることに注意してください。
詳細はこちらの論文をお読みください。: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition.
Parameters: | |
---|---|
Returns: |
出力値。 shapeは(batchsize,c∑H−1h=022h,1,1)(batchsize,c∑h=0H−122h,1,1)となり、ただしcc
は入力 |
Return type: |
この関数はいくつかのプーリングクラスを空間的なピラミッドプーリング処理のコンポーネントとして用います。現時点では、 MaxPooling2D
のみを、プーリング操作のエレメントとしています。