混同行列と分割表の違いは何ですか?



What Is Difference Between Confusion Matrix



解決:

ウィキペディアの定義:

人工知能の分野では、混同行列は通常、教師あり学習で使用される視覚化ツールです(教師なし学習では、通常、マッチング行列と呼ばれます)。行列の各列は予測されたクラスのインスタンスを表し、各行は実際のクラスのインスタンスを表します。



混同行列は明確である必要があります。これは基本的に、予測結果と一致する実際の結果の数を示します。たとえば、この混同行列を参照してください

予測されたクラスc1-c2実際のクラスc115-3 ___________________ c2 0-2

それはそれを伝えます:



  1. 列1、行1は、分類子が15個のアイテムをクラスに属すると予測したことを意味しますc1、実際には15個のアイテムがクラスに属していますc1(これは正しい予測です)

  2. 2番目の列の行1は、分類子が3つのアイテムがクラスに属すると予測したことを示しています。c2ですが、実際にはクラスに属していますc1(これは間違った予測です)

  3. 列1、行2は、実際にクラスに属するアイテムがないことを意味しますc2はクラスに属すると予測されていますc1(これは間違った予測です)



  4. 列2行2は、クラスに属する2つのアイテムであることを示していますc2はクラスに属すると予測されていますc2(これは正しい予測です)

これで、本の精度とエラー率の式(第4章、4.2)を参照すると、混同行列とは何かを明確に理解できるはずです。これは、既知の結果のデータを使用して分類器の精度をテストするために使用されます。 K-Foldメソッド(本にも記載されています)は、本にも記載されている分類器の精度を計算する方法の1つです。

分割表の場合:ウィキペディアの定義:

統計では、分割表(クロス集計またはクロス集計とも呼ばれます)は、変数の(多変量)度数分布を表示するマトリックス形式のテーブルの一種です。これは、2つ以上のカテゴリ変数間の関係を記録および分析するためによく使用されます。

データマイニングでは、分割表を使用して、トランザクションや販売分析のショッピングカートのように、一緒に読み取りに表示されたアイテムを示します。例(これはあなたが言及した本の例です):

コーヒー!コーヒーティー150 50200!ティー6501508008002001000

1000件の回答(コーヒーと紅茶、またはその両方、あるいはその1つが好きかどうかについての回答、調査結果)は次のようになっています。

  1. お茶とコーヒーの両方が好きな150人
  2. 50人はお茶は好きだけどコーヒーは嫌い
  3. 650人はお茶は好きではなくコーヒーが好き
  4. お茶もコーヒーも好きではない150人

分割表は、基本的に相関ルールを評価するために、相関ルールのサポートと信頼性を見つけるために使用されます(第6章6.7.1を参照)。

ここでの違いは、混同行列を使用して分類器のパフォーマンスを評価し、分類器が分類に関する予測を行う際の精度を示し、分割表を使用して相関ルールを評価することです。

答えを読んだ後、少しググって(本を読んでいる間は常にグーグルを使用してください)、本の内容を読んで、いくつかの例を見て、本で与えられているいくつかの演習を解決することを忘れないでください。それらの両方について、また特定の状況で何を使用するか、そしてその理由について明確な概念を持っている必要があります。

お役に立てれば。