データ行列を扱うのに便利なライブラリなようだ。
これからメモを残しておこうと思う。
概要
Pandasは、Python環境でデータ構造を扱いやすくするためのライブラリのことだ。Numpy上で動くようになっている。
インストール
インストールは簡単で、Windowsはインストーラが用意されているし、Macは、
$ sudo easy_install pandas
とすればインストールしてくれる。
Dataframe
- 手始めにデータ行列を扱うためのDataframeは、表の構造をそのまま持っている。
- 行名・列名は、それぞれindex、columnsメソッドで取得できる。
- データ行列自体は、valuesメソッドで取得できる。
- stackメソッドを使えば、データを1列にして積み上げることもできる。
- 行列の結合は、concatメソッドを使う。axis=1にすれば、横に結合できる。
- キーが見つからない場合はNaNになる。
http://pandas.pydata.org/
コメント