漫画の地球儀

ヒストグラムの『Excel』での作り方!【種類、特徴、活用例、棒グラフとの違い、pc、度数分布表】

スポンサーリンク

ヒストグラム

f:id:rick1208:20210114154009p:plain


ヒストグラム(度数分布図)とは、度数分布表をグラフ化したものです。度数分布表とはこのような表のことです。

こういった表をヒストグラム化して視覚化することで、より直感的にデータをチェック可能なようになります。

これにより円グラフなどでは分かりづらかったデータも視覚的にチェック可能です。

ヒストグラムの特徴と活用方法

f:id:rick1208:20210114010139p:plain

ヒストグラムを作っても、それを活用できなければ意味がありません。

そこで、ヒストグラムにはどういった特徴があるのか、どういう時に活用可能なのか見ていきましょう。

異常値の発見や突出したデータの発見が得意

ヒストグラムは、大量のデータから異常値を発見したり、年齢分布傾向などを調べるのに役立ちます。

度数分布表をグラフ化することで、各区間(階級)の相対度数や累積度数を調べることが可能です。

例えばこちらの度数分布表をヒストグラム化して「購入件数が多い年齢」と「2番目に購入件数が多い年齢」を調べてみます。


f:id:rick1208:20210114154148p:plain



こちらがヒストグラム化したものです。


f:id:rick1208:20210114154221p:plain



先ほどの度数分布表を観る場合と比較して、「購入件数が多い年齢」と「2番目に購入件数が多い年齢」がひと目でわかったはずです。

ほかにも購入頻度が高い価格帯などもヒストグラムを使用して調べることが可能です。

ヒストグラムと棒グラフの決定的な違い

ヒストグラムは、棒グラフと違って棒と棒の間隔をなくしてグラフ化することが多いです。

ですが、ヒストグラムによっては棒と棒の間隔が空いているものもあります。

例えば、こちらのグラフもヒストグラムといえます。


f:id:rick1208:20210114154244p:plain



では棒グラフとヒストグラムの違いは何なのかというと、扱うデータの違いです。

棒グラフは棒の並びを変えてもOKデータを扱う
ヒストグラムは棒の並びを変えると問題が発生するデータを扱う

という扱うデータに明確な違いがあります。

例えば、上でのヒストグラムの棒の並びをバラバラにしてみましょう。



このグラフを見て、「どの年齢から購入件数が増加し、どの年齢から購入件数が下がりはじめているか」パット見でわかるでしょうか


f:id:rick1208:20210114154300p:plain


わかるとしても、かなり分かりづらかったはずです。

ヒストグラムでは棒に順序があるという特徴があり、これこそが棒グラフとの決定的な違いです。

それに対してこちらの棒グラフを見てください。


f:id:rick1208:20210114154325p:plain




こちらは好きなフルーツに関するアンケートですが、順番を並び替えても何も問題ありません。

こういうグラフはヒストグラムではなく棒グラフと呼ばれます。

「棒の幅が広くて棒と棒の間隔がない=ヒストグラム」とは限らないので覚えておきましょう。

Excelヒストグラムを作成する方法

f:id:rick1208:20210114154353p:plain


Excelヒストグラムを作成する方法は簡単です。

まず最初は、 ヒストグラムの元となる度数分布表を用意しましょう。

度数分布表の用意が面倒という人は、以下の表をコピーペーストしてください。


年齢 購入件数
10代 24
20代 46
30代 78
40代 33
50代 11
60代 4

ここでは上の度数分布表を使用して解説します。


まず、ヒストグラム化したいデータを範囲選択しておきます。


f:id:rick1208:20210114154413p:plain


上部メニューの「挿入」を押します。


f:id:rick1208:20210114154432p:plain



続けてグラフアイコンをクリックするとヒストグラムが表示されるので、選んでください。

f:id:rick1208:20210114154442p:plain



するとヒストグラムが挿入されますが、明らかにグラフがおかしい状態になっていますので、ちょっと修正していきます。


f:id:rick1208:20210114154504p:plain



ヒストグラムの縦軸項目名をダブル押して軸の書式設定を表示します。


f:id:rick1208:20210114154515p:plain



「軸のオプション」を「分類項目別」に切り替えます。


f:id:rick1208:20210114154525p:plain



これで求めていたヒストグラムのグラフが出来上がったはずです。必要に応じてグラフタイトルをダブル押して変更しましょう。


f:id:rick1208:20210114154533p:plain


横軸もダブルクリックすれば同様に編集可能です。

f:id:rick1208:20210114155835p:plain


ヒストグラムの種類と分析

f:id:rick1208:20210113225153p:plain

ヒストグラムを使用して分析するにあたって、色々なヒストグラムが出来上がります。

ここでありがちなヒストグラムの種類を見ていきましょう。

一般型

データが中心に集まって山になっているものを一般型と言われます。

f:id:rick1208:20210114155910p:plain


どこにデータが集中しているかわかりやすいため、最も分析が簡単なヒストグラムと思います。

ふた山型

データが集中している山が二つあり、ラクダ状になってなっているものがふた山型です。


f:id:rick1208:20210114160025p:plain



グラフの山を構成している要素が2つ以上あることが考えられるため、ヒストグラムを複数に分けて層別する必要があります。

歯抜け型

歯抜け型は、データに規則性や山がどこかわからないヒストグラムです。



f:id:rick1208:20210114160044p:plain


これは元のデータに問題があることが多く、ヒストグラムの意味を成していません。

すそ引き型

データが左右どっちかに大きく偏っており、平均値が意味を成さないヒストグラムです。



f:id:rick1208:20210114160100p:plain


左から右にかけてデータが減ちょっとているものを「右すそ引き型」、右から左にかけてデータが減ちょっとているものを「左すそ引き型」といいます。

絶壁型

常に右肩上がりになっているグラフがあるタイミングを境にデータが全くと言っていいほどなくなったヒストグラムです。

f:id:rick1208:20210114160126p:plain



離れ小島型

離れ小島型は一部データが飛んでいる形跡が見られるヒストグラムです。



f:id:rick1208:20210114160143p:plain



この場合、データの測定に誤りがある可能性があるため、注意すべきグラフの一つです。