用語集

Musashi AI 株式会社の用語集はこちらをご覧ください。

テンソル(Tensor)

画像処理AIにおいて、テンソル(Tensor)は多次元配列で表現されるデータの形式です。テンソルは、スカラー、ベクトル、行列といったより低次元のデータ構造を一般化したもので、3次元以上のデータを表現するために使用されます。

テンソルは、次元(軸)とその次元ごとの要素数(サイズ)によって特徴付けられます。以下に一般的なテンソルの次元と表記方法を示します:

  • スカラー(0次元テンソル): 1つの値からなるテンソルです。例えば、単一のピクセルの輝度値などがスカラーとして表されます。

  • ベクトル(1次元テンソル): 複数の値が1つの次元(軸)に沿って並んだテンソルです。例えば、1次元の特徴ベクトルや1次元の画像データがベクトルとして表されます。

  • 行列(2次元テンソル): 複数の値が2つの次元(軸)に沿って並んだテンソルです。例えば、画像データやフィルタ(カーネル)が行列として表されます。

  • 3次元テンソル: 複数の値が3つの次元(軸)に沿って並んだテンソルです。例えば、RGB画像のピクセルデータが3次元テンソルとして表されます。第1次元は縦方向のピクセル、第2次元は横方向のピクセル、第3次元はRGBのチャンネルを表します。

  • 高次元テンソル: 4次元以上の次元を持つテンソルです。例えば、バッチ処理のためのデータセットや、畳み込みニューラルネットワークにおける畳み込み層の入力データは、4次元テンソルとして表されることがあります。

テンソルは、画像やビデオなどの多次元データを効果的に表現するために使用されます。画像処理AIにおいて、テンソルはデータの操作や変換、畳み込みニューラルネットワークへの入力として広く使用されます。

用語集 さくいん