Python で解析 4

“Advent Calendar 2013 - Python で解析!” の四日目。matplotlib - 1

1. notebook の起動

せっかく matplotlib をインストールしたので、そろそろ活用してみる。なお、今回は、notebook も使ってみることにする。

$ ipython notebook --pylab=inline

これでブラウザが起動し、 Notebook の画面が表示されるので、新しい Notebook を作成するために、右上の “New Notebook” (*1) を押す。オプションの '--pylab=inline' で、チャートがインライン表示される。

(*1) Notebook に Notebook を作成するって変だなぁ〜とは思う。”New Note” ぢゃダメなんだろうか?

2. チャート作成

Notebook の入力エリアに次のコードを入力して、上部の実行ボタンを押すと、即座にチャートが表示される (キーボードショットカットなら ‘Shift-Enter’)。

import pandas as pd

df = pd.DataFrame({
                   u'名前': [u'山田', u'鈴木', u'佐藤', u'木村'],
                   u'性別': [u'男', u'男', u'女', u'女'] ,
                   u'身長': [181, 173, 159, 164],
                   u'体重': [79, 71, 51, 52]
                   })
df.plot()

実際の画面はこんな感じになる。

DataFrame も見やすく表示される。

df

df.boxplot()

箱ひげ図も簡単に表示できる。

要約統計量 (df.describe() で表示される統計量 ) を計算した上で表示してくれるので、自前で計算する必要はない!

# 身長と体重を箱ひげ図で並べてもしょーがないが…。

もし、ファイルに入っているデータを使うとするならば、わずか 3 行でチャートが表示されることになる。

import pandas as pd

df = pd.read_table('hoge.txt')
df.plot()

Pandas ブラボー!!

なお、Notebook を使わず、 ipython をターミナルで活用する場合は、別ウィンドウでチャートが表示される。

Notebook は python コード以外にも markdown を書けたりするので、解析の形跡を残すのに活用するものなのかもしれない。初見のデータの傾向を見るために、アトランダムにデータを調べてみるなら、ターミナルの方が快適に使えるかもしれない。ま、お好みで…。

今回はこんなところで。