Garbage Collection


2005-12-02

§ Sampling Error Chart

http://www.lizard-tail.com/isana/lab/tools/sampling_error.php
ちょっと必要になったので、統計学の勉強がてら簡単なスクリプトを組んでみた。
えーと、これは統計学で標本誤差と呼ばれる「サンプル数に応じた統計の誤差」を表にしたもの。

たとえば、「街頭アンケートで100人に聞いたところ、小泉さんの支持すると答えた人は45%です」という文章に出くわしたら、このスクリプトでちょこちょこっと計算する。すると、「えーと、誤差は±9.8% ... ぜんぜん意味ないじゃん」ということがわかるというわけ。便利だ!便利じゃないかな?

このチャートを片手に、いろんなアンケート結果を見ていると結構面白い。たとえば、
内閣支持4割台に回復、自民支持も増 朝日新聞世論調査
有効回答数が1782件で、支持率41%ってことは...本当に4割台?
「民主が34%で自民の30%を上回った」この差は本当に有意な差なのかな?
まあ、ごまかしているというほどじゃないけど、結構苦しい分析だよね

*

もちろん、統計の誤差はこれだけじゃない。質問項目や調査の設計にバイアスがかかっていたり、サンプルの選択に偏りが生じることは珍しくない。たとえば、「あるアンケートに回答する」というモチベーションを持っている人は、それを持っていない人とはすでに違う考え方や行動をしている可能性がある。時には、そういうバイアスが調査そのものを全く無意味なものにしてしまうこともある

統計調査には、どんなに少なく見積もっても、このチャートに書かれているような誤差がある。統計調査で目にする数字は、なんだかかっちりきっちりしているように見えるけれど、実際はぐにゃぐにゃと形の定まらない、けっこうもやもやしたものだ。そのことは覚えておいて損はないと思う。

§ 雑スクリプト

なんだかこういう細々したスクリプトがずいぶん増えた。
この日記からしかリンクされていないので、忘れないうちに、まとめてリンクしておこう。

WorldClock
http://www.lizard-tail.com/isana/lab/clock.php
ちゃんと、サマータイムを計算する世界時計スクリプト
Moon Age CGI
http://www.lizard-tail.com/isana/lab/starchart/mooncalc.php
理科年表とほぼ同じ精度の月齢表。「mooncalc.php?year=2006」で年を指定できる。
Redshift-Distance Relation
http://www.lizard-tail.com/isana/lab/redshift/redshift-distance.php
遠方にある天体までの距離と赤方偏移の関係を表すチャート。
いちおう宇宙論パラメータをもとに計算している。
Countdown for STS-114
http://www.lizard-tail.com/isana/lab/space_exploration/sts114pre.php
イベントリストを読み込んで、カウントダウンを表示するスクリプト。
イベントリストを入れ替えれば他のことにも使える(はず)。

※一部のスクリプトはソースコードがリンクされているけれど、
※かなり適当に作ったものばかりなので、動作保証はしません。あしからず。