« type III error | トップページ | 証明責任 2 »

3学派の区間推定

ご存じ、統計学にはそれぞれ frequentist, likelihoodist, Bayesian と呼ばれる3つの school がある。
これらの違いを説明するという場面ではそう頻出ではない(しかしかなり良い例として使えると思われる)のが、それぞれで用いられる区間推定量の定義。

前置きだが一般に、パラメタの区間推定というのは、次の性質を持つ集合値統計量 S(X) が欲しい:
1. "高い確率"で S(X) がパラメタの真の値θ∈Θを含む
2. S(X) が"小さい"
この意味では、より一般には「集合推定」と呼ぶべきだが、よく使われる分布関数の性質などから、集合の中でも [l, h] ⊂Re のような区間を取ることが多く、区間推定と呼ばれる。

以下共通に X ~ fn(x|θ) とする。

* likelihoodist intervals
ρ∈(0, 1)
S(X) = {θ∈Θ: fn(x|θ) / fn(x|θ^ML) >= ρ}

つまり、最尤推定値 θ^ML の場合を分母にした尤度の比をとって一定の基準値 ρ以上となる部分を推定値(集合/領域/区間)とする。

* Bayesian credible intervals
α∈(0, 1)
P[θ∈S(x)| X = x ] >= 1-α

つまり、S(x)がθを含むという事後確率が 1-α以上という条件を満たす任意の領域 S(x) 。

さらに g(θ) をθの事前分布として
S(x) = {θ∈Θ: fn(x|θ)g(θ) >= k }
すなわち、上の事後確率の条件を満たしつつ、k をぎりぎり大きく決め、事後密度(の定数倍)が k 以上となる部分をとると、もっとも小さな credible interval/region が得られる。これを最高事後密度領域 highest posterior density (HPD) region と呼ぶ。

* frequentist confidence intervals
α∈(0, 1)
P[θ∈S(X) | θ ] >= 1-α

つまり、真の値θ∈Θがどんな値であっても、S(X) がθを含む確率が 1-α以上となるように、 S(X) の構成方法を決める。よく注意されるように、ここで確率変数は S(X) であってθではない。

|

« type III error | トップページ | 証明責任 2 »

Α 科学の諸問題」カテゴリの記事

Η 数理の諸問題」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/26863/40964046

この記事へのトラックバック一覧です: 3学派の区間推定:

« type III error | トップページ | 証明責任 2 »