Η 数理の諸問題

将棋の盤面数

米長永世棋聖がボンクラーズに敗れたというニュースがきたので、将棋ネタでも書いておこうと思う。

将棋(本将棋)の盤面の正確な通り数については私は知らない。そもそも厳密にルールを理解してすらいない。
でも、以前、大まかな通り数を計算してみたことはある。一応専門的にゲーム理論も勉強したし、いろんなきっかけでいろんなゲームの解析をしていた。その一部の痕跡は私のサイトにも顕れているから知る人ぞ知るところ。

だいたい、二歩を考慮して、2.75 × 10 70 通りより少ない程度だ。
連盟公式のはもっと色々ルールがあるようなので(行き所のない駒は禁止とか)、もうすこし小さくなるだろう。

1つの盤面は単純に考えて45バイトあれば十分表現できるが、もっと小さくできる。
2.75 × 10 70 < 2 234
ということで高々234ビットにはできるはず。

検索すると 10 220 みたいな記載をみかけるが、それはおそらく指し手の通り数(しかもかなりアバウトな概算)であって、盤面の通り数ではない。

しかし、着手の通り数を考えるのは、連盟のルールに文脈(ヒストリー)に関するものが含まれているからだと思われる。そういうルールだと、手順を考慮しないと必勝プログラムは作れない。2 234でも十分大変だが、このことがさらに難度を高くしている。


これまでゲームやロボットやいろいろな「俗に言う人工知能」を作ってきた私だが、将棋のは単純に数理的な問題なので、いまのところあまり興味がない。でも将棋は好きなので、いつかやる日が来るのかな。

| | コメント (0) | トラックバック (0)

良い問いと悪い問い: 一方そのころ

先の記事から削った余談。


二、外の世界のほんとうの有り様とか法則とかは、我々の能力ではすべて思い浮かべられないかもしれない。

これは、これまでにも書いた感覚の性質にもとづく論(例えばこれなど)とはちょっと違って、悟性の限界の意味です。
たぶん過去に同じように思った人がたくさんいたことでしょう。

先の記事では、図の B に含まれない A の話でしたが、こちらは A に含まれない B (以下これを I と呼ぶことにします)の話です。


そういう I があったとしたら、我々にはどう見えるのか。
端的に言って、まったく無関係でいられるかもしれません。あるいは、「この世界ってよくわかんない世界だな」となるかもしれません。しかしそのよくわかんなさの原因を知ることはできません。
すなわち、I があるのかどうかは当然認識できず、よくわかんないのが A の内側のせいなのか A の外側に何かあるからなのかを区別できないのです。

二次元に落とした影からは元が何次元だったのかはわからない、のと同様です。


これは、我々によるこの世界の理解の限界点を言っているわけですが、しかし、
認識能力が誰しも、未来の誰もかも、同じであるとは限りません。
つまり、我々とは根本的に違う能力を持ち、違う仕方でこの世界について考える人がいるかもしれません。それこそが進化というものを支える要素なのですが。

よって、世界の把握をあきらめる必要はない。

でもなー、どうしてそれが人だということがあろうか。

| | コメント (0) | トラックバック (0)

形式体系とカラッポの構造

述語論理に関する以前の記事がけっこう反響があるようなので、続編めいたものを。

前は量化子をネタにしたのだが、そのような記号を含んでいる公理や推論規則を入れた形式体系(formal system)は、それによって解釈(interpretation)を制限している。これはフツーのことであり、記号論理学において推論規則や論理公理(logical axioms)は論理記号の意味を絞る役割を担っている(これをどのようにして成すかがまさに形式化の仕方の違いである)。
全称例化の公理図式を組み入れるということは、モデルのユニバースを空にすることを禁じる。WikipediaでStructureについての記事にて

This is similar to the definition of a prime number in elementary number theory, which has been carefully chosen so that the irreducible number 1 is not considered prime. The convention that structures may not be empty is particularly important in logic, because several common inference rules are not sound when empty structures are permitted. (retrieved 2011-08-17)

とあるように、確かにこれは広く用いられている慣例である。しかし、慣例であって、体系を作るのに必須ではない。もちろん、これを抜いてしまうと体系としては 貧弱貧弱ゥ!! なことになる。数学者はそんなものにまったく興味を持たないかもしれない。
ただ、その場合でも述語記号はいくら用意しても問題ない、というのがひとつポイントである。つまり、見た目広辞苑を全部カバーするくらいリッチな述語記号セットを張りぼてすることもできる。

論理学者や数学基礎論者は、まず formal な系を与えてその性質について調べる、という方向での仕事に興味があるかもしれないが、数理論理学の成果を応用したい人たち、例えば自分の分野の理論を形式化したい科学者などは逆だ。(多くの数学者もそうかもしれない。)すなわち、まず構造ありきである。そしてその構造をモデルにしてくれるような理論体系を後から作る。もっと日常的に喩えれば、言いたいことがまずあって、それからその記号的表現を考える。この順序がフツーだ。
加えて重要な特徴は、科学者はユニバースをコロコロと変えて考える。つまり、ユニバースは静的なのがドンと1つあるのではなく、文脈によって相手にする範囲は動的に変化するのがフツーである。
このようにユニバースが(従って構造が)文脈によって変わってしまうのを避けるために、すべてを含むユニバースを用意しておいて ∀x∈D. P(x) とか∃x∈D. P(x) とか、条件をつけて話したい範囲を限定した定式化を行うという事例もよくある。
ここで ∀x∈D. P(x) と ∃x∈D. P(x) はこの形だと似ているが、きちんと書き直すと似ていない形になるというのが、前の記事での要点と関連する。

現場の応用者は対象範囲の条件をコロコロ変えて話をするので、話の流れでいつのまにか対象範囲が空になっていたりいなかったりする(もちろん自然言語で対話しているときも)。よって、 ∀x∈D. P(x) は D が空でも成立する(一方 ∃x∈D. P(x) は成立しない)というのを理解し注意しておくのは、科学者がロジックでこけないために不可欠である。
先に指摘したように、対象領域が空であっても(科学者の話に該当するものは1つも存在しなくても)その分野の理論における述語はどんどん着飾ることができる。だから、なんか専門用語がたくさん入った理論を提唱して世界を記述した気になっていても、実は何も記述していない、というのは極端な例としてありうる話だ(そんなマヌケなプロはいないと期待したい)。

まあ、そもそも意味不明な用語が多いのをなんとかしなければスタート地点にも立てないのだが。

| | コメント (0) | トラックバック (0)

帰無仮説と帰納

先日の会で、帰無仮説を積極的に主張してはいけない理由をみんなどのように理解しているのかと尋ねてみた。

「さあ、そう言われたので」

この答えはもはや私にとって衝撃でも何でもない。こんなのは心理学業界ではザラである。
多少驚いたのは、授業で先生が言ったという次の説明である。

白いカラスの話みたく、差がないことは証明できないので、いくらデータをとっても帰無仮説は主張できない」

こんな説明を教える大学院が日本にはあるらしい(しかも有名国立)。
日本の大学院教育は、科学的にやろうとしている基礎心理分野ですら、裾野だけではなく全体的にひどいという一例。
(ご存じのようにそれが私が草の根の研究会に精を出している理由)

以前の記事の通り、帰無仮説が主張できない理由に帰納の問題は関係ありません。

というか、検定論など推測統計に手を染めた時点ですでに確率論的に推測をするという土俵に立っているのに、どうして帰納の問題の出る幕があろうか。
そもそも推測統計の何たるかが(教官に)理解されていないのか、あるいは自分たちがテストしようとしている経験的命題の意味が自分でわかっていないのか。

どれにせよ、事の影響(それが含意する他の面でのヤバ沢さん)が大きすぎ。

| | コメント (0) | トラックバック (0)

3学派の区間推定

ご存じ、統計学にはそれぞれ frequentist, likelihoodist, Bayesian と呼ばれる3つの school がある。
これらの違いを説明するという場面ではそう頻出ではない(しかしかなり良い例として使えると思われる)のが、それぞれで用いられる区間推定量の定義。

前置きだが一般に、パラメタの区間推定というのは、次の性質を持つ集合値統計量 S(X) が欲しい:
1. "高い確率"で S(X) がパラメタの真の値θ∈Θを含む
2. S(X) が"小さい"
この意味では、より一般には「集合推定」と呼ぶべきだが、よく使われる分布関数の性質などから、集合の中でも [l, h] ⊂Re のような区間を取ることが多く、区間推定と呼ばれる。

以下共通に X ~ fn(x|θ) とする。

* likelihoodist intervals
ρ∈(0, 1)
S(X) = {θ∈Θ: fn(x|θ) / fn(x|θ^ML) >= ρ}

つまり、最尤推定値 θ^ML の場合を分母にした尤度の比をとって一定の基準値 ρ以上となる部分を推定値(集合/領域/区間)とする。

* Bayesian credible intervals
α∈(0, 1)
P[θ∈S(x)| X = x ] >= 1-α

つまり、S(x)がθを含むという事後確率が 1-α以上という条件を満たす任意の領域 S(x) 。

さらに g(θ) をθの事前分布として
S(x) = {θ∈Θ: fn(x|θ)g(θ) >= k }
すなわち、上の事後確率の条件を満たしつつ、k をぎりぎり大きく決め、事後密度(の定数倍)が k 以上となる部分をとると、もっとも小さな credible interval/region が得られる。これを最高事後密度領域 highest posterior density (HPD) region と呼ぶ。

* frequentist confidence intervals
α∈(0, 1)
P[θ∈S(X) | θ ] >= 1-α

つまり、真の値θ∈Θがどんな値であっても、S(X) がθを含む確率が 1-α以上となるように、 S(X) の構成方法を決める。よく注意されるように、ここで確率変数は S(X) であってθではない。

| | コメント (0) | トラックバック (0)

type III error

先日の研究会で type III error にふれたので補記。

type I error と type II error 以外に第三、第四の error を付け加えようとする試みは色々ある。
結構多様なので、文献で一口に type III error と言っても同じものを指しているとは限らない。

研究会でふれたのは、次のエラーである:

 両側検定で帰無仮説を正しく棄却した後で、効果の方向を誤って推論する

例えば、仮に μ1 < μ2 が正しいとして、両側 t 検定で 帰無仮説 μ1 = μ2 を(正しく)棄却した後に、2標本の平均値の大きさを比べて、 μ1 > μ2 と結論してしまう、というケース。
(実際に、研究現場では、この推論手順は頻繁に行われている。)

文献で type III error と呼ばれている様々なエラーたちは、もはや統計学の範囲ではないものも多いが、こいつはまだ統計学的に扱える。

では、このエラーの起こる確率はどれくらいだろうか? シミュレーションしてみる。

replicate(10000, {
  y1 <- rnorm(10, m=0)
  y2 <- rnorm(10, m=0.2)
  c(mean(y1), mean(y2), t.test(y1, y2)$p.value)
}) -> r
sum(r[3,] < 0.05)
sum(r[1,] > r[2,])
sum(r[3,] < 0.05 & r[1,] > r[2,])
sum(r[3,] < 0.05 & r[1,] > r[2,]) / sum(r[3,] < 0.05)

棄却したときという条件で、だいたい 10% 前後か。どやさ!10回に1回もまちがう!

しかし上の状況はパワーがかなり小さいことに注意。
サンプルサイズやイフェクトサイズを大きくすると、このエラーの確率は非常に小さくなる。
αは増やしても無駄である。

両側検定で対立仮説 μ1 ≠ μ2 を主張してそれで満足、という研究はまず無いだろう。ふつうは効果の方向は主張する。(もっといかした研究なら効果の大きさも主張する。)
しかし両側検定を使うと、このように、α、β以外にも気にすべきことが。

| | コメント (0) | トラックバック (0)

検出力 < 0.5

第2種の過誤の確率 β について 「帰無仮説が正しいと言えない理由」 でも書きましたが、

届いた鈴川・豊田(2011) を読むと、

publish された研究でも β > 0.5 のようなケースが少なからずあるようです。

リアリティでましたか?

| | コメント (0) | トラックバック (0)

相関係数の不偏推定

これも多くの統計ユーザに知られていないようだが、
標本の相関係数は母相関係数の不偏推定量ではない。
(二変量正規の場合は最尤推定量ではある)

二変量正規の場合の不偏推定量の近似式は、日本語で粕谷さんが紹介されている。Olkin & Prattの論文は私は読んだことがない。
http://kasuya.ecology1.org/stats/unbiased-r1.html
漸近的には不偏である。

また、標本の平均、分散、共分散が一致推定量なら、相関係数も一致推定量。

| | コメント (0) | トラックバック (0)

オッズ比

オッズ比を指標として使っているのをときどき見かける。
そして、オッズ比についての肝心なところを説明していないもの、あるいは誤って説明しているのものも見かける。


いわゆる2x2のクロス表で表現されるデータ、すなわち、各対象について2つの二値属性を測っているデータがあるときに、データ発生源(母集団)の性質を考える場面。

E1E0
T1p1 - p
T0q1 - q

理解のため、ある処置をした場合(T1)としない場合(T0)の、イベントが発生する(E1)しない(E0)の割合、というような具体的イメージを持つとよいだろう。
入手できるデータは有限個であるが、研究の通常では、データ発生源は無限個のデータを発生させられる(無限母集団)と仮定するので、上のクロス表は標本ではなく母集団を表現しようとしていて、セル内の記号は計数ではなく確率を表していると考えよう。

ここでよく登場する専門用語の定義は、

T1のリスク(=T1でのE1の確率) = p
T0のリスク(=T0でのE1の確率) = q
リスク差 = p - q
リスク比(=相対リスク) = p / q
対数リスク比 = log(リスク比) = log(p) - log(q)
T1のオッズ = p / (1 - p)
T0のオッズ = q / (1 - q)
T1のロジット(=T1の対数オッズ) = log(T1のオッズ) = log(p) - log(1 - p)
T0のロジット(=T0の対数オッズ) = log(T0のオッズ) = log(q) - log(1 - q)
オッズ比 = T1のオッズ / T0のオッズ
対数オッズ比(=ロジット差) = log(T1のオッズ / T0のオッズ) = T1のロジット - T0のロジット

以上のとおり。
リスク差やリスク比は、確率の解釈から実質的な意味をとりやすいので、解釈が容易と言われる。
一方で、オッズ、オッズ比、対数オッズ比の解釈は難しいと言われている。

これらの値のとりうる範囲は、

0 ≦ リスク ≦ 1
-1 ≦ リスク差 ≦ 1
0 ≦ リスク比 < ∞
-∞ < 対数リスク比 < ∞
0 ≦ オッズ < ∞
-∞ < ロジット < ∞
0 ≦ オッズ比 < ∞
-∞ < 対数オッズ比 < ∞

である。
これらのうち、属性Tと属性Eの関係の有無や関係の強さを示す指標として使えるのは、「T1の」や「T0の」という修飾が付いていないもの。すなわち、リスク差、リスク比、対数リスク比、オッズ比、対数オッズ比、の5つである。

例えばリスク比が1.5とはどういうことか、オッズ比が1.5とはどういうことか、などを直観的に把握してもらうために、値が同じ(階級分けが荒いので正確には「近い」)ところを同じ色にぬった等高図を5つそれぞれについて下に用意した。

risk difference

risk ratio

log risk ratio

odds ratio

log odds ratio

リスク比とオッズ比は無相関を原点とした対称性がないので、まずその点で不慣れな者には解釈上のつまづきがある。
そして、オッズ比と対数オッズ比は、その"曲線的同値性"の点で、リスクに結びつけた実質的解釈が難しく感じられるのだろう。
その意味では、オッズ比は5つのなかで最悪とも言える。

オッズ比は、その値だけ見ても、T1はT0に比べてリスク(確率)が何倍とかどれくらい増えるとかいうことすら導けないのである。(そういう解釈の仕方を紹介している文献やウェブページは、まず間違いだと思って差し支えないだろう。)
例えば、オッズ比 30 は、図の左上、マゼンタと塗られていない部分の境界線あたりである。もし q(=図ではrisk0)=0.8ならばリスクの差はおよそ 0.2 だが、q=0.05 だとしたらリスク差はおよそ 0.56 である。また、q=0.8だとしたらリスクはおよそ1.2倍だが、q=0.05 ならばリスクはおよそ12倍である。たとえオッズ比が同じでもまさに桁違いである。
よってオッズ比だけから平易な実践的示唆を得ることはまずできないだろう。

しかし、例えば積率相関係数もこれと似たようなものである。その値自体の実質的(非数学的)解釈は難しいので、事実的指標としては異なる標本から計算した係数同士の比較や散布具合の目安程度にしか使わない。(もちろん統計学的には大活躍する。)
しかしそれでもみな納得して頻繁に使っている。オッズ比もそういう使い方を徹底したほうがよいのではと思う。つまり、単純に連関の程度の指標として扱い、事実的解釈はしない、という道。

事実的解釈をしたいなら、対数オッズ比のほうがまだマシである。
というよりも、私の持論では、ロジット差として解釈するほうがより分かりよい。

上記は、2種類のデータ発生源を想定し、その違いを検討するという枠組みであった。しかし、1種類のデータ発生源における2つの属性の同時分布を考えるという枠組みもある。
オッズ比は数学的には2つの属性を対称に扱っているので、どちらの枠組みでも使える。というより、後者の枠組みでは上に挙げた指標はほとんど不適だから、オッズ比しか合わない。
これが、医学・疫学系の文献でケースコントロール研究にてオッズ比の使用を推奨している理由である。

しかし、単純に連関の指標として使うなら、連関の指標は他にもあるから、無理にオッズ比を選択する利点は私には思い浮かばない。

人気のロジスティック回帰は、一般化線形モデルの観点からはリンク関数がロジット関数であり、説明変数の効果はロジット差(=対数オッズ比)だから、対数オッズ比が活躍する。その点で、二値データに対してオッズ比の使用を慣習づけたいのかもしれない。
しかしそのようなオッズ比の常用癖に良い点はないと思う。ロジスティック回帰はそのままロジットの差として解釈したほうがよい。オッズに直すことの積極的意義はとくにない気がする。

図をみればわかるように、T1もT0もリスクが低いことが分かっている場合のリスク比とオッズ比の類似性を利用して、オッズ比をリスク比へ読み替えることが勧められることがあるようだ。これはまだわからないでもないが、その条件すなわち「リスクがある範囲に含まれることが既知」が満たされているなら、他にもやれることはたくさんあろう。リスク比を経由しないでオッズ比からリスクを推定することもできる。とくにリスク比にこだわる必要もないだろう。

オッズ比が指標としてもてはやされる理由がわからない。少なくとも私はロジット差しか教えようとしたことがない。

| | コメント (0) | トラックバック (0)

良い問いと悪い問い

とってもとっても基本的で重要なこと。ぜひ心していただければと思います。
難しいことを考える人だけでなく、誰にとっても。

 一、 我々の考える能力は、(最高にとは言わないが)非常に強力である。すなわち、外の世界では成り立たない事柄についてまで考えることができる。

その例として、私たちは、嘘をついたり、間違った文章について批判したり、現実世界にそのモデルがない(だろう)公理から数学を展開したり、後悔したり、できます。

このことを図にすると

この A が私たちの考えられる範囲で B が外の世界 ではなくて

こうです。図の重なっていない黄色い部分が空でない(何かがそこに含まれる)ということです。実のところ、空でないなんてもんじゃなく、めちゃめちゃ詰まってるんです。


私たちは、わからないことについて疑問・問い(question)を立てて、それに答えようとします。日常生活だけでなく科学者の仕事現場でもそれは同じです。
さて、私たちの考える能力がパワフルということは、いろんないろんな問いが自在に作れるということです。しかも現実の世界の在り様なんかまったく無視してです。
日常で遭遇するようなふつうな問い(例えば「リンゴ3個ウチにおいてあって今日リンゴ2個買って帰ったら全部で何個になる?」)だけでなく、はちゃめちゃな問い(例えば「すべては存在しないのではないか?」)も作ることができます。余談ですが、哲学の歴史の一部は、そうしたはちゃめちゃな問いに答えようとしてきた節があります。
私たちに作ることが可能な問いがいかに多様かについては、あなた自身が疑問文を作れる能力について振り返ればすぐわかってもらえるでしょう。疑問文、自由自在に作れますね。もう1つ作って、もう1つ別の・・・とお願いされても全然困らないですね。

さらに、疑問文を作る上で千両役者なのが、「なぜ」"why" という語です。これを付ければ、なんでも重要っぽい疑問になります。しかも、はい/いいえで答えられる疑問ではなく、かなり深めな感じの。
なので、科学者、哲学者、宗教家、思想家、一般人を問わず、「なぜ」が多くの人を魅了してきました。


では、私たちはそのように多様で大量な(実のところ無限個の)問いを立てることができるのですが、それらの問い全部の答えを得られるのでしょうか?

続きを読む "良い問いと悪い問い"

| | コメント (0) | トラックバック (0)

より以前の記事一覧