テンソル(Tensor)
画像処理AIにおいて、テンソル(Tensor)は多次元配列で表現されるデータの形式です。テンソルは、スカラー、ベクトル、行列といったより低次元のデータ構造を一般化したもので、3次元以上のデータを表現するために使用されます。
テンソルは、次元(軸)とその次元ごとの要素数(サイズ)によって特徴付けられます。以下に一般的なテンソルの次元と表記方法を示します:
-
スカラー(0次元テンソル): 1つの値からなるテンソルです。例えば、単一のピクセルの輝度値などがスカラーとして表されます。
-
ベクトル(1次元テンソル): 複数の値が1つの次元(軸)に沿って並んだテンソルです。例えば、1次元の特徴ベクトルや1次元の画像データがベクトルとして表されます。
-
行列(2次元テンソル): 複数の値が2つの次元(軸)に沿って並んだテンソルです。例えば、画像データやフィルタ(カーネル)が行列として表されます。
-
3次元テンソル: 複数の値が3つの次元(軸)に沿って並んだテンソルです。例えば、RGB画像のピクセルデータが3次元テンソルとして表されます。第1次元は縦方向のピクセル、第2次元は横方向のピクセル、第3次元はRGBのチャンネルを表します。
-
高次元テンソル: 4次元以上の次元を持つテンソルです。例えば、バッチ処理のためのデータセットや、畳み込みニューラルネットワークにおける畳み込み層の入力データは、4次元テンソルとして表されることがあります。
テンソルは、画像やビデオなどの多次元データを効果的に表現するために使用されます。画像処理AIにおいて、テンソルはデータの操作や変換、畳み込みニューラルネットワークへの入力として広く使用されます。