こんにちは、株式会社クリエのIT制作部の鷹尾です。
弊社の「アクセス解析レポート」では、Google Analyticsから得たデータを統計学を用いて解析しています。今回も、統計学の各処理を紹介します。第2回目は、中央値です。
1.中央値とは
中央値は、データを大きい順(または小さい順)に並び替えた時に真ん中の値を指します。データの数が偶数の時は「真ん中の値」を2つ足して2で割ったものを中央値にします。
今回はA~Eの5名に10点満点のテストを1回行いました。この例を元に中央値のメリットとデメリットについて説明します。
中央値のメリット
中央値のメリットは、データを並べ替えた時の真ん中の値になるので、外れ値に強い。
今回のテストの中央値は、2です。
テストの外れ値であると思われる10は除外されます。
中央値のデメリット
中央値のデメリットは、全てのデータを考慮出来ない。中央値は、データを並び替えた時の真ん中の値になるので、10点を取ったデータを考慮することが出来ません。
あとがき
今回、中央値について紹介しました。中央値は、外れ値を除外出来るが全てのデータを考慮出来ません。次回は、残り1つの代表値「最頻値」について紹介します。
まとめ
- 中央値について紹介しました。
- 中央値のメリット・デメリットについて紹介しました。