混同行列(Confusion Matrix)
混同行列(Confusion Matrix)は、機械学習や統計学において、分類モデルの性能を評価するために使用される行列です。混同行列は、モデルの予測結果と実際のクラスラベルとの間の一致や不一致を示す情報を提供します。
混同行列は、真陽性(True Positive, TP)、真陰性(True Negative, TN)、偽陽性(False Positive, FP)、偽陰性(False Negative, FN)の4つの値から構成されます。
- 真陽性(TP):実際のクラスが陽性であり、モデルが正しく陽性と予測したサンプル数。
- 真陰性(TN):実際のクラスが陰性であり、モデルが正しく陰性と予測したサンプル数。
- 偽陽性(FP):実際のクラスが陰性でありながら、モデルが誤って陽性と予測したサンプル数。
- 偽陰性(FN):実際のクラスが陽性でありながら、モデルが誤って陰性と予測したサンプル数。
混同行列は、クラスごとにこれらの値を表形式で示します。行が実際のクラスを、列がモデルの予測クラスを表しています。各セルには対応するサンプルの数が表示されます。
混同行列を解析することで、モデルの分類の正確さやエラーの種類を評価することができます。例えば、偽陽性の数が多い場合、モデルが誤って陽性と予測する傾向があることを示しています。また、真陽性や真陰性の数が高い場合、モデルが正確に予測できていることを示しています。
混同行列は、機械学習モデルの性能評価だけでなく、クラスごとの適合率(Precision)、再現率(Recall)、F1スコア(F1 Score)などの指標を計算するためにも使用されます。これらの指標は、混同行列の値に基づいて計算され、モデルの性能をより詳細に評価するのに役立ちます。