インフラ系ソフトウェアエンジニアのざっくばらんなメモ。 一応、技術メモが中心だけど、まあなんでもありということで。 技術ネタであればあるほど、英語版のほうに書くことが多くなるけれど、 それもまあ、そういうことで。
Sunday, March 31, 2013
えぼりゅーしょん3
この話の続き。
まだ python のプログラムはいじっていなくて、データ処理の話。
家系図は書いてみたので、次は genes のクラスタ分析をしたらどうなるか?…ということで、Rを使ってひとしきりやってみた結果。
1000updateかけた後、生存animal数 152、死亡animal数 466、残plant数 53、生存animalの平均年齢(update) 197.4、生存animalの平均保持 energy 88.5…という状態がお題。
生存animalを対象にすると、genes は8要素のベクターなので、これが152個あることになる。練習としては、まあたいしたことはないデータ量だ。
まず、階層型クラスタリングの R の hclust を使って書いてみたのがこれ。
ふーん、と思いつつ、このへんを参考にk-meansでクラスタ数2~15で変化させながら、あたりをみてみたのがこれ。
クラスタ数5くらいでいいのかしら?と思いながら分類させてみたのがこれ。
実は、Rをそれっぽく使ってみたのは初めてだったのだが、データ入出力はいまいち使い勝手が悪い(or 整理されていない)な…というのが感想だったりする。
まあ、そもそも論として、この環境で種の分化ってどう定義するの?なんて話もあるわけだし、先は長い...
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment