スキップしてメイン コンテンツに移動

注目

濁点「゛」・半濁点「゜」の置換

MacのプレビューアプリでPDFのテキストをコピペしたりすると、濁点や半濁点が分割されてしまったりする。 それをパワーポイントやエクセルに貼り付けたりすると、見た目が悪い。 なので、こんなサービスっぽいものを作ってみた。 https://papipupepo.herokuapp.com/ Webアプリの作り方がわからなかったので、作りがいまいちではあるが、まずは公開した。

Pythonで数量化3類(2)散布図への日本語ラベル

前回から継続調査としていた散布図のラベルの表示の件は、解決できた。
いろいろ調べると、Scatterを使うのではなく、annotationを使うのが良いみたいだ。
日本語の扱いには苦労したが、元のデータ行列を明示的にUTF-8にしていけば問題なく、日本語ラベルを各プロットの横に表示できた。

数量化3類


アノテーションの繰り返し処理のコードサンプルの一部をメモしておく。



だいぶ汚いコードなのでこれから整理していこうと思う。
今回から、Pythonのデータ分析ライブラリであるpandasを使うことにした。
行列演算というよりも、テーブルデータの行と列の扱いが非常に楽になる感じなので、今後いろいろ調べようと思う。

http://pandas.pydata.org/

PandasやNumpyは、こちらの本に詳しい。私はUSのオライリーで購入したけど、日本のAmazonでKindle版が出ていた。

コメント

人気の投稿