ゴーストのサーフィス数の統計を取ってみる。†
投票ページで、ランダムトーク数について統計が取られており、
さとーさんによってその
考察が行われている。
ここでは、
ゴーストを構成するもう一つの要素である、サーフィス数について、
統計を取ったりして遊んでみたりする。
統計を取る方法†
もしかするとゴーストDBや何かを使ってうまい方法があるのかもしれないが、
良い方法が思いつかなかったので、とりあえずツールを組んでローカルにある
ゴーストを数えてみることにする。
ツールは次のものを使う。.NET2.0が必要。
&attachref(./surfacecount0_9_1.zip);
このツールのカウントロジックは下記のとおり。
- ゴーストディレクトリ\shell\master ないし \shell\surface を探す
- surfaces.txt があれば、その中に含まれる surface[数字] という行をカウント
- surfaces.txt が無いか、もしくは surface[数字]という行が含まれなければ、同ディレクトリにある surface*.png をカウント
得られたデータ†
色々な方のご協力を得て、データが集まったので、統計処理して遊んでみる。
頂いたデータを全てマージ*1した元データは &attachref(./countuniq.csv); と &attachref(./countsurface.csv); 。
全部で 819 体分のデータが集まった。
尚、以下の文章においては、ゴースト名の代わりにゴーストのディレクトリ名を使っている。
得られたデータから、サーフィス数トップ50を浮子屋/ゴーストのサーフィス数統計/top50に示す。
但し、このカウント方法だと、アニメーションは全く考慮に入っていないことに注意。
あくまでサーフィス番号の数をサーフィス数とした統計である。*2
サーフィス数†
さて、得られたデータを度数分布のグラフにすると、次のようになる。
&attachref(./histall.png,nolink);
えらく長いのは、panz3 が 972 サーフィス(!)あるためで、これでは何が何だか分からない。
201サーフィス以上は一まとめにすると、次のグラフになる。
&attachref(./200.png,nolink); &attachref(./200en.png,nolink);
見て分かるとおり、サーフィス数50以下のゴーストで全体の8割以上を占めている。
サーフィス数50以下の部分について、もっと細かく見てみると、次のグラフになる。
(%は50以下のゴースト中での割合)
&attachref(./1-50.png,nolink);
恣意的になるかもしれないが、補助曲線を引いてみた。
- サーフィス数12前後を中心とした集団(赤い線):これは、いわゆる「伝統的な」\0側0~9,\1側10,11というサーフィス構成のゴーストの集団だろうか。
- サーフィス数20前後のゆるやかな集団(緑の線):これは、「伝統的な」サーフィス構成にとらわれないゴーストの集団だろうか。
- サーフィス数1または2の集団:これは1発ゴーストの集団で確定でしょう。
色々読み取れて面白い。
サーフィス番号†
さて、頂いたデータには、個々のサーフィス番号も含まれている。
こちらも統計処理してみる。
とりあえず \s[0]~\s[100] までについてグラフにしてみる。
&attachref(./surface100.png,nolink);
下ヒトケタ 0 または 1 をピークとした、ノコギリ状の形が見て取れる。
つまり、下ヒトケタが大きな数字になるにつれ、そのサーフィス番号は、あまり使われない傾向にある。
\0側が 0~9 、\1側が 10~19 という、「伝統的な」サーフィス番号を意識して、0~19について見てみると、次のようになる。
&attachref(./surface19.png,nolink);
0番や10番の無いゴーストが結構居るのは置いておいて、9番が少ないのが目につく。
0が平常、1が照れ、2が驚き、3が困惑、4が消沈、5が笑い、6が目閉じ、7が怒り、8が苦笑、ときて、
9は、というと、確かにはっきり決まった印象が無いような気がする。
まとめ†
特にまとめは無し。統計を取って遊んでみただけです。
暇な人は元データを使って、また別の角度からの分析を試みても面白いかもしれません。
こめんとにはちからをこめんと†
- カウントロジックはこれで良いのかどうか非常に自信が無い。もっとこうすべき、といった意見をください。
- 沢山ゴーストを入れている人はやってみて、hist.txt and/or count.txt をこのページに貼り付けてみてください。
- 溜まったらマージしてまた統計とってみたりするかも。
- count_pona_libretto.txtやってみた。 -- ぽな@ばぐとら
- ごめんなさい、度数を出すように変えましたー -- 浮子屋
- ぽなさんのもグラフにしてみました。50にピークがあったのはうちだけか。 -- 浮子屋
- hist_pona_main.txt count_pona_main.txt メイン機で。 -- ぽな@ばぐとら
- ありがとうござます。もうちょっと集まったら本格的に統計とってみたりするかもしれません。 -- 浮子屋
- あ、じぶんちの上げ忘れてた。count_ukiya.txthist_ukiya.txt -- 浮子屋
- 面白そうなのでちょっと参加^^ &attachref(t_misaki.txt);&attachref(count_misaki.txt); -- みさき
- 間違えた……; &attachref(hist_misaki.txt);&attachref(count_misaki.txt); -- みさき
- ちなみにゴースト数は344組、更新はぼちぼち程度です。 -- みさき
- みなさんご協力ありがとうございました。頂いたデータはそのまま残しておきますが気になるようであれば消してください。 -- 浮子屋
- というわけで、頂いたデータを元にマージして統計してみました。 -- 浮子屋