Python で解析 4
“Advent Calendar 2013 - Python で解析!” の四日目。matplotlib - 1
1. notebook の起動
せっかく matplotlib をインストールしたので、そろそろ活用してみる。なお、今回は、notebook も使ってみることにする。
$ ipython notebook --pylab=inline
これでブラウザが起動し、 Notebook の画面が表示されるので、新しい Notebook を作成するために、右上の “New Notebook” (*1) を押す。オプションの '--pylab=inline' で、チャートがインライン表示される。
(*1) Notebook に Notebook を作成するって変だなぁ〜とは思う。”New Note” ぢゃダメなんだろうか?
2. チャート作成
Notebook の入力エリアに次のコードを入力して、上部の実行ボタンを押すと、即座にチャートが表示される (キーボードショットカットなら ‘Shift-Enter’)。
import pandas as pd df = pd.DataFrame({ u'名前': [u'山田', u'鈴木', u'佐藤', u'木村'], u'性別': [u'男', u'男', u'女', u'女'] , u'身長': [181, 173, 159, 164], u'体重': [79, 71, 51, 52] }) df.plot()
実際の画面はこんな感じになる。
DataFrame も見やすく表示される。
df
df.boxplot()
要約統計量 (df.describe() で表示される統計量 ) を計算した上で表示してくれるので、自前で計算する必要はない!
# 身長と体重を箱ひげ図で並べてもしょーがないが…。
もし、ファイルに入っているデータを使うとするならば、わずか 3 行でチャートが表示されることになる。
import pandas as pd df = pd.read_table('hoge.txt') df.plot()
Pandas ブラボー!!
なお、Notebook を使わず、 ipython をターミナルで活用する場合は、別ウィンドウでチャートが表示される。
Notebook は python コード以外にも markdown を書けたりするので、解析の形跡を残すのに活用するものなのかもしれない。初見のデータの傾向を見るために、アトランダムにデータを調べてみるなら、ターミナルの方が快適に使えるかもしれない。ま、お好みで…。
今回はこんなところで。