Rでヒストグラムをつくる

ヒストグラムは統計の授業でも最初のほうに出てくる基本的なグラフですが、Excelでつくろうとするとアドインを加えたり、区間を定義したりとちょっと面倒です。Rだとかなり簡便に作れます。

1)データの読み込み

csvファイルを読み込ませる方法もありますが、ウェブで調べてみるとコピペでデータを読み込ませる方法があり、これがたぶん一番簡単ではないかと思いました。まず、ヒストグラムをつくりたいデータをコピーします。Excel上に入力してあるときはデータ範囲をドラッグしてコピーです。次に、Rのコンソール画面で次のように入力します。

>A=scan("clipboard")

これでEnterを押すと、さきほどのデータが読み込まれます。たとえば140個のデータなら、

Read 140 items

などと返されるでしょう。Aというのはデータセットに名前をつける便宜的なものなので"D"でも"S12"でも"Money"でもなんでもよいです。

2)ヒストグラムの作成

> hist(A)

とするともうヒストグラムが表示されるはずです。

3)区間の変更

デフォルトで設定されている区間でなく指定したい場合は次のように調整します。

> hist(A,breaks=seq(0,10,0.5))

これは0から10までの範囲で0.5ずつの区切りでデータを分けたヒストグラムを作成せよという意味になります。

4)データの重ね合わせ

別のデータを上記ヒストグラムに重ねるときは、まず別のデータセットを読み込んでおきます。上記1と同様にコピペです。

>B=scan("clipboard")

 つぎにBのヒストグラムを重ねわせるには、

> hist(A,breaks=seq(0,10,0.5))

> hist(B,breaks=seq(0,10,0.5),col="#808080",add=T)

とします。col="...."は色指定をするコマンドで、色のコードは6ケタで与えます。このコードは次のサイトを参考にしてください。add=Tが先にできたヒストグラムに新たなヒストグラムを重ね合わせるコマンドです。

カラーコードで色指定

y軸がおさまらないときは、上記コマンドの中にylim=c(0,100)等と入れます。y軸の範囲が0から100までという意味です。たとえば次のように書きます。

> hist(A,breaks=seq(0,10,0.5),ylim=c(0,100))