ベイズ統計学による心理学研究のすゝめ(2)

ベイズ統計学への批判点

こうしたベイズ統計学の枠組みにはいろいろ優れた点があるのですが、お楽しみは次回にまわして、今回は批判のお話です。ベイズの定理を用いて確率の更新ができること自体は、証明できる数学の結果ですから、特に批判される点はありません。批判を受けうるのは、ベイズの定理を現実のデータ分析に応用する、その仕方についてです。

ベイズ統計学に対する批判のポイントは、大別して事前等確率の設定についてと、確率の主観的解釈についての2点があります。

事前等確率の設定

1点目から見ていきましょう。ベイズ統計学はデータに基づいて確率をアップデートしていく枠組みですので、データが得られる前の確率を表す、事前分布を設定しなければなりません。素朴に考えると、特に事前情報がない場合には、「すべてのとりうる値について、確率は等しい」という、事前等確率の設定が妥当に感じます。事実、ベイズもラプラスも、事前等確率の設定を利用していました。この設定は「理由不十分の原則」とよばれることもあります。特に理由がなければ、事前分布に等確率を設定しよう、ということです。

もし関心があるのが「コインの表(裏)が出る確率」であれば、可能な結果は「表」と「裏」だけですから、事前等確率の設定を利用し、データを見る前には表が出る確率も裏が出る確率もそれぞれ0.5である、と考えることに特に問題はなさそうです。しかし、バスの時刻の例ではどうでしょうか? 机上の空論的ですが、バスが着く時刻は非常に遅く、もしくは早くなってしまう可能性だってあるかもしれません。事前等確率の考え方に基づくなら、-∞(マイナス無限大)から+∞(プラス無限大)までの範囲に、一様な事前確率を設定することになります。しかし、いくらデータがまだないとはいえ、この設定は妥当なものでしょうか。どんなに情報がなくても、定刻8時のバスが7:55~8:05の間に来る確率は、8:55~9:05の間に来る確率よりもよほど大きいと考えるのが自然ではないでしょうか? こうした考え方は、次回お話しする、より情報のある事前分布の利用につながります。

さらにいえば、じつは「-∞から+∞までの範囲で一様である」という事前分布は、厳密な意味での「確率」の性質を満たしていません。確率の数学的な定義では、すべての場合について足し合わせると100%、つまり1になることが要請されています。しかし、「-∞から+∞までの範囲で一様」の分布は、この要請を満たすことができないのです。こういったおかしな確率分布のことを、非正則(improper)な分布といいます。

じつは、非正則な事前分布を用いても、多くの応用場面では事後分布は通常の(正則な)分布になります。ですので、非正則な事前分布の利用は、ある1つの統計モデルのもとでの推論を考える限りは問題にならないことが多いです。しかし、2つの統計モデルの間でどちらがより適切かを考えるような場合には、非正則な事前分布を使うとしばしば、答えが1つに定まらなくなる、といった大きな問題が生じます。このように、事前等確率の設定は、意味的な問題点だけでなく、モデル選択においては数学的な問題点を抱えています。

この問題を解決する方法は、機械的な事前等確率の設定を避けることです。しかし、そうした理論の体系がつくられるようになったのは20世紀のフィッシャーらの時代以降のことでした。長い間にわたって、ベイズ統計学で事前等確率の設定を用いるのは半ば当然のことと考えられ、またそれに由来する批判を受けてきたのです。

fig2-3

アメリカではフィッシャーといえば、イタチのようなこの動物のことを指します。その名に反して、魚はあまり食べないのだそうです(5)


1 2 3
執筆: