用語集

Musashi AI 株式会社の用語集はこちらをご覧ください。

HOG(Histogram of Oriented Gradients)

HOG(Histogram of Oriented Gradients)は、画像処理における特徴量記述子の一つであり、主に物体検出や人物認識のタスクにおいて使用されます。HOGは、画像内の局所領域の勾配方向のヒストグラムを特徴として表現する手法です。

HOGの特徴は以下の通りです:

  1. 勾配方向の統計情報: HOGは、画像内の局所領域における勾配の方向を特徴として利用します。画像の各ピクセルに対して勾配を計算し、勾配方向のヒストグラムを作成します。

  2. 光変動に対する頑健性: HOGは、画像内の局所領域の勾配情報を使用するため、一部の光変動に対して比較的頑健な特徴量を提供します。これは、物体の形状やエッジ情報に焦点を当てるためです。

  3. 形状の局所性: HOGは、画像内の局所領域に注目し、その領域の特徴を記述します。これにより、大域的な画像変化やノイズの影響を軽減し、特徴のロバスト性を向上させます。

HOGの手順は、以下のようになります:

  1. 勾配の計算: 画像内の各ピクセルに対して、勾配の計算を行います。通常は、画像の輝度勾配を求めます。勾配は、画像のエッジやテクスチャ情報を捉えるために重要です。

  2. セルの作成: 画像をセルと呼ばれる小領域に分割します。セルは通常、16x16ピクセルや8x8ピクセルのサイズです。セルは、局所領域の特徴を表現するために使用されます。

  3. 勾配方向のヒストグラム作成: 各セル内で、勾配方向のヒストグラムを作成します。ヒストグラムは、セル内のピクセルの勾配方向に対する統計情報を表現します。

  4. ブロックの作成: 複数のセルを組み合わせて、ブロックと呼ばれる大きな領域を形成します。ブロックは、セル間の情報を統合する役割を果たします。

  5. 特徴ベクトルの作成: ブロック内のヒストグラムを結合して、最終的な特徴ベクトルを作成します。特徴ベクトルは、画像内の局所領域の形状やエッジ情報を表現します。

HOGは、物体検出や人物認識などのタスクで広く使用されます。画像内の局所領域の形状やエッジ情報を効果的に捉えることができるため、画像内の物体の特徴量として利用されます。

用語集 さくいん