« 関連主義 | トップページ | あるある »

非復元単純無作為

書いて放置していたのだが、以前書いた無作為抽出の話の続き、日のもとへ。

前回の記事中に「本気で」と書いたが、これは個々の要素(前回の記事では個体)の選択確率を厳密に同じにし、独立に選択する、という意味だ。特に、選択の過程を通して独立である、ということを意味していた。そのためには、復元無作為抽出法を適用しなければならない(それ以外の方法を私は知らない)。

単純無作為標本(抽出)というのがある。
これは、可能なすべての標本が等確率で抽出される、というのを定義に含んでいる。可能なすべての標本というのは要素の組み合わせのすべてであるから、必然的に、ある要素が標本に含まれる確率も全要素において等しくなる。
そういう意味で要素については平等なわけだが、これは(同時ではなく系列的な)抽出の過程を通じて要素の選択確率が一定であることを必然的に要求はしないし、選択の系列における独立性も要求しない。
単にすべての標本の抽出される確率が等しければよいのだ。だから、非復元抽出でもよいわけだ。

しかし、標本理論に依拠する多くの統計解析法が話の出発点として置いているのは、復元抽出である。たぶん理由は、話が簡単だから。
それを見て取れる例の一つが非復元抽出の場合の有限母集団修正だ(もちろんこの修正がある場合のほうが誤差が小さくて良いのだが、良いか悪いかはここでは別問題)。非復元抽出では各回の間で相関するから、こんなことせにゃならん。

こういうのは専門家には周知のことだから統計理論としては問題なく発展しているのだが、さて、一般ユーザはどうだろう。
サンプリングまわりのことをわかりずらくしているのは、サンプリングに関して言及されているのが標本のことなのか構成要素のことなのかを学習者がきっちり区別できていないことだ。ここをもっと強調して教えてくれるとよいと思うのだが、そうもいっていないみたい。日本でここを徹底してくれる教官に出会った人がもしいたら、その人はラッキーだと思います。
いわゆる文系の初学者にとって似たような困難は、標本要素の分布と推定量の分布との間にもある。

さて、有限母集団修正に話を戻すと、分散に(N-n)/(N-1)をかけるわけだけど、普通の教科書だと、抽出率(母集団サイズと標本サイズの比率)が小さい場合には1に漸近するから気にしなくてよくなるよ、って教えられる。
そこで学生は「なんだよ、じゃあ最初から教えるなよ!」ってずっこけるんだけど、教官はなんでこれを説明するかって、頭から消してしまうと問題が出る状況があるからいちいち言うわけであって、つまりこんな細かいことでも覚えておきなさいよ、ってことなわけで。というよりも言わないとまずいから責任回避、的なことかもしれないけど。しかし学生側としては、右から左へ抜けているので、超幾何分布なんて覚えてる心理の院生は激レアだと思われる。

じゃあそのまずい状況を考えてみる。
うちの学部とかってまあ学生が3、400人くらい(?)いて、そこで6、70人誘ってきて実験とか調査とかする、というよくあるパターン。
ここで、誘ってくるのが無作為抽出か?って根本的な問題がもちろんあるけど、そこは今回は目をつむって非復元単純無作為だとしましょう。心理学では母集団をどこに設定するかっていう問題もよく議論にあがるものだが、ここでは自分の学部の被験者しかとってないんだし、全人類に統計学的に一般化なんて無茶は主張せず、統計学的一般化はその学部くらいを焦点にしておきましょう(それでも300人について言えるんだから)。それ以上の一般化は別の根拠で。
さて、この場合に先の修正項はどうなるかというと、(300-60)/(300-1)≒0.80です。8割ですよ。標準偏差については、ルートとるからおよそ9割です。これってぜんぜん無視していい数字じゃない。
みんなが好きな検定にもがっつり影響しますよ。

そういえば、私は市販の統計ソフト(Sで始まる)で母集団サイズを入力するウィンドウが現れるという場面を未だ見たことがない。どうなってんだろう。

まあ現場的観点からの結論としては、よかったね、ってことです。いや、よいケースは限られるか。困ったね、ってことです。

|

« 関連主義 | トップページ | あるある »

Α 科学の諸問題」カテゴリの記事

Δ 心理学の諸問題」カテゴリの記事

Ζ 教育の諸問題」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/26863/5338739

この記事へのトラックバック一覧です: 非復元単純無作為:

« 関連主義 | トップページ | あるある »