統計学(中央値)


こんにちは、株式会社クリエのIT制作部の鷹尾です。
弊社の「アクセス解析レポート」では、Google Analyticsから得たデータを統計学を用いて解析しています。今回も、統計学の各処理を紹介します。第2回目は、中央値です。

1.中央値とは

中央値は、データを大きい順(または小さい順)に並び替えた時に真ん中の値を指します。データの数が偶数の時は「真ん中の値」を2つ足して2で割ったものを中央値にします。

今回はA~Eの5名に10点満点のテストを1回行いました。この例を元に中央値のメリットとデメリットについて説明します。

中央値のメリット

中央値のメリットは、データを並べ替えた時の真ん中の値になるので、外れ値に強い。
今回のテストの中央値は、2です。
テストの外れ値であると思われる10は除外されます。

中央値のデメリット

中央値のデメリットは、全てのデータを考慮出来ない。中央値は、データを並び替えた時の真ん中の値になるので、10点を取ったデータを考慮することが出来ません。

あとがき

今回、中央値について紹介しました。中央値は、外れ値を除外出来るが全てのデータを考慮出来ません。次回は、残り1つの代表値「最頻値」について紹介します。

まとめ

  • 中央値について紹介しました。
  • 中央値のメリット・デメリットについて紹介しました。

 
参考:【基本】データの中央値【基本】平均値・中央値・最頻値はどう使い分ける?