ブログ移転のお知らせ

Sphinx を使ってブログを書きたい! ということで、移転することにした。 Tommy Heartbeat 4th

Python で解析 24

“Advent Calendar 2013 - Python で解析!” の二十四日目。実データの操作。今回は、実際のデータを探ってみたい。ここまでのデータ操作を使って、簡単にできるところまで。一応、これが Advent Calendar 2013 の最後。技術系の Advent Calendar では 25 まで…

Python で解析 23

“Advent Calendar 2013 - Python で解析!” の二十三日目。DataFrame - 16今回は Period について。Timestamp が時刻、Period が時間を取り扱う。時間というより、期間の方が語感としては近いかもしれない。 1. Period だいたいの言語で、日付型や時刻型は用…

Python で解析 22

“Advent Calendar 2013 - Python で解析!” の二十二日目。DataFrame - 15今回はカテゴリーデータの扱いについて。カテゴリーデータというのは大きさを表す数字ではなく、種類を表すもので、例えばどのブラウザからのアクセスが多いか? のような時に活用する…

Python で解析 21

“Advent Calendar 2013 - Python で解析!” の二十一日目。DatetimeIndex今回は DatetimeIndex について。 1. データの生成 DatetimeIndex を生成するには、 date_range を使う。試しに DatetimeIndex を使った DataFrame を生成してみる。 In [1]: import pa…

Python で解析 20

“Advent Calendar 2013 - Python で解析!” の二十日目。Timestamp今回は Timestamp について。 Python の datetime と同等と思われるが、 Pandas では Timestamp を使うようだ。効率がいいらしいが、詳しいことは未調査。まずは、使い方を。 1. Timestamp の…

Python で解析 19

“Advent Calendar 2013 - Python で解析!” の十九日目。DataFrame - 14今回は sort を取り上げる。だいたい想像している通りのことができる。 1. データの準備 では、いつもの通りのデータの準備を。 In [1]: import pandas as pd In [2]: df = pd.DataFrame…

Python で解析 18

“Advent Calendar 2013 - Python で解析!” の十八日目。DataFrame - 13今回は apply を取り上げる。DataFrame に任意の関数を実行するもので、 python の組み込み関数である map と思えばいいだろう。 1. データの準備 では、いつもの通りのデータの準備を。…

Python で解析 17

“Advent Calendar 2013 - Python で解析!” の十七日目。DataFrame - 12今回は DataFrame の演算を取り上げる。データは円単位だが表示はドルで行いたいとか、タイムゾーンを変換したい…などのシチュエーションが考えられる。 1. データの準備 では、いつもの…

Python で解析 16

“Advent Calendar 2013 - Python で解析!” の十六日目。DataFrame - 11今回は replace を取り上げる。間違ったデータを修正したいとか、プリフィックスを付けたいとか…そんなシチュエーションを想定している。 1. データの準備 では、いつもの通りのデータの…

Python で解析 15

“Advent Calendar 2013 - Python で解析!” の十五日目。DataFrame - 10 1. データの準備 今回は、fillna を使ってみる。いつも綺麗なデータなら良いのだが、欠損しているデータをどうにかしなきゃならないシチュエーションだ。 In [1]: import pandas as pd …

Python で解析 14

“Advent Calendar 2013 - Python で解析!” の十四日目。DataFrame - 9 1. データの準備 今回取り上げるのは duplicated。レコードの重複を取り除く。誤って同じデータを取り込んでしまったとか、ログ解析でユニークユーザーに絞りたいなど…のようなシチュエ…

Python で解析 13

“Advent Calendar 2013 - Python で解析!” の十三日目。DataFrame - 8 1. データの準備 今回は cut を取り上げる。例えば、身長 10cm 刻みでの平均身長、平均体重を算出する…などで使うことができる。たぶん、 SQL にはない機能で、もし SQL で実現するなら …

Python で解析 12

“Advent Calendar 2013 - Python で解析!” の十二日目。matplotlib - 2 1. いつものごとく準備から データ操作が続いたところで、久しぶりにチャートを。その前に、データの用意を…。 import pandas as pd df = pd.DataFrame({ u'睦月': [18100, 22000, 6800…

Python で解析 11

“Advent Calendar 2013 - Python で解析!” の十一日目。DataFrame - 7 1. 前回の補足 今回は concat を取り上げるのだが、その前に、十日目の記事を読み返していたら、書き忘れていたことがあったので、先に補足しておく。 In [10]: df4 = df1.join([df2, df…

Python で解析 10

“Advent Calendar 2013 - Python で解析!” の十日目。DataFrame - 6 1. お決まりの準備を… 今回は DataFrame の join について。 join は merge のお手軽版といったところのようだ。インデックスがあって、カラムが重複していない場合には、merge よりもお手…

Python で解析 9

“Advent Calendar 2013 - Python で解析!” の九日目。DataFrame - 6 1. お決まりの準備を… 今回は DataFrame のマージについて。マージとは、二つのデータフレームを結合することで、SQL で言うところの join と同等のもので、数学的には集合演算とかベン図…

Python で解析 8

“Advent Calendar 2013 - Python で解析!” の八日目。DataFrame - 5 1. お決まりの準備を… 今回は DataFrame の保存だが、その前に例によって準備を。 In [1]: import pandas as pd In [2]: df = pd.DataFrame({ ...: u'名前': [u'山田', u'鈴木', u'佐藤', …

Python で解析 7

“Advent Calendar 2013 - Python で解析!” の七日目。matplotlib - 21. 準備Notebook を使いたいところだが、ブログにコードを書くのにスクリーンショットでは都合が悪いので、ターミナルの ipython を使う。起動時に '--pylab=inline' を付けておくと、'sho…

Python で解析 6

“Advent Calendar 2013 - Python で解析!” の六日目。Pandas で DataFrame - 4 1. お決まりの準備を… In [1]: import pandas as pd In [2]: df = pd.DataFrame({ ...: u'名前': [u'山田', u'鈴木', u'佐藤', u'木村'], ...: u'性別': [u'男', u'男', u'女', …

Python で解析 5

“Advent Calendar 2013 - Python で解析!” の五日目。Pandas で DataFrame - 3 1. 例のごとく準備を…。 In [1]: import pandas as pd In [2]: df = pd.DataFrame({ ...: u'名前': [u'山田', u'鈴木', u'佐藤', u'木村'], ...: u'性別': [u'男', u'男', u'女'…

Python で解析 4

“Advent Calendar 2013 - Python で解析!” の四日目。matplotlib - 1 1. notebook の起動 せっかく matplotlib をインストールしたので、そろそろ活用してみる。なお、今回は、notebook も使ってみることにする。 $ ipython notebook --pylab=inline これで…

Python で解析 3

“Advent Calendar 2013 - Python で解析!” の三日目。Pandas で DataFrame - 2 1. ファイルの読み込み CSV (カンマ区切り), TSV (タブ区切り), Excel ファイルなどを読みこんで、 DataFrame を作ることができる。 import pandas as pd pd = pd.read_csv('hog…

Python で解析 2

“Advent Calendar 2013 - Python で解析!” の二日目。Pandas で DataFrame - 1 1. DataFrame の作成 DataFrame は、Excel の表、あるいはデータベースのテーブルのようなもの。ipython を使って試してみる。 $ ipython 以下、 ipython の画面。In が入力を表…

Python で解析 1

“Advent Calendar 2013 - Python で解析!” の一日目。環境構築。 0. 前置き 「Pythonista なら解析も python でやりたい!」日本では、解析ツールというと R が一般的なようだが (*1)、世界的には Python も標準的に使われているようだ。アドホックな解析なら…

DeeMo

最近のお気に入りのリズムゲーム "DeeMo"。"太鼓の達人" のようにリズムに合わせてタップするだけ。簡単に遊べるの単純なものなのだが、ピアノのサウンドと曲調、そしてイラスト & 紙芝居のタッチが、独特の雰囲気を醸し出していて、引き込まれるのだ。リズ…

納品日

IT

1. 願望納品日 … この日に欲しいなぁ〜 2. 期待納品日 … すべてがうまくゆけばいいなぁ〜 3. 予測納品日 … 過去の実績から推測すると… 4. 裏・納品日 … そうは言ってもこのぐらいだよねぇ〜 5. 予定納品日 … 後はバグを潰すだけ! 6. 真・納品日 … あとは調整…

iPad Air - 最高傑作が持つ、最大の矛盾

Mac

歴代の iPad を触ってきたが、iPad Air は最高傑作と言っていいだろう。完成系の一歩手前。iPad - Apple(日本)これまで、iPad と Kindle Paperwhite を持ち歩いていのは iPad が重たかったからだ。片手で快適に読書ができる Paperwhite は最高の読書ツール…

大東京トイボックス

とってもおもしろいコミック。2012年マンガ大賞で、"銀の匙" に続く 2 位に輝いたというのもうなずける作品。ゲーム業界版の半沢直樹…というのは言い過ぎにしても、ゲーム制作の現場のヒキコモゴモを描いた、なかなかの力作。プランナーの苦悩、エンジニアの…

第一回チキチキ秋のデータサイエンスアイデアソン&ハッカソン

IT

"第一回チキチキ秋のデータサイエンスアイデアソン&ハッカソン" に参加してきた。データスタジアム株式会社様提供の実際のプロ野球のデータを使って、おもしろいものを作るという企画だ。スポーツの秋! 芸術の秋! データの秋!! ということで、スポーツに関す…