chainer.functions.spatial_transformer_sampler(x, grid, **kwargs)[source]

二次元空間変形サンプラー。

 

これは、微分可能な画像サンプラーです。grid のサンプリングポイントの集合と入力特徴マップ xを使って、標本化された出力特徴マップを生成します。(訳注:マップ=写像)

この関数は現在、バイリニア補間のみを 標本カーネルとしてサポートしています。

grid における座標が [1,1][−1,1]の外側の範囲にある場合、 値はゼロでパディングした入力画像から標本化されます。

 

表記法:次元に関わる表記法

  • nn はバッチサイズです。
  • cIcI は入力チャンネル数です。
  • hh と ww は、それぞれ入力画像の高さ(h)と幅(w) です。
  • hOhO と wOwOは、それぞれ出力画像の高さ(h)と幅(w) です。

詳細は、次の論文もお読みください。: Spatial Transformer Networks.

 

Note

cuDNN はversion5.0.0からSpatialTransformerSampler をサポートしています。

Parameters:
  • x (Variable) –shapeが (n,cI,h,w)(n,cI,h,w) の入力値
  • grid (Variable) –

    shapeが (n,2,hO,wO)(n,2,hO,wO)の座標変数。 各座標は、出力で標本カーネルが特定のピクセルの値を取得するために適用される空間的な位置を入力値において定義している。 grid[idx, :, i, j] は (i,j)(i,j).にある出力ピクセル用の値を標本とするために用いられる座標に相当する。

    2次元目において、1番目の座標は水平軸方向の位置に相当し、2番目の座標は垂直軸方向の位置に相当する。

    したがって、入力画像の座標 (1,1)(−1,−1) は左上の角にあたる。

Returns:

出力する特徴マップ。shapeは (n,cI,hO,wO)(n,cI,hO,wO)

Return type:

Variable