ベイズ統計学による心理学研究のすゝめ(2)

いま、心理学の中でベイズ統計学を用いた研究が増えています。ベイズ統計学はどういった特徴をもつのか、研究増加の背景には何があるのか。専修大学の岡田謙介准教授による「ベイズ統計学による心理学研究のすゝめ」、第2回はベイズ統計学の特徴と、これまでにどういった批判を受けてきたのかを紹介します。(編集部)

連載第1回はこちら

Author_OkadaKensuke岡田謙介(おかだ・けんすけ):専修大学人間科学部准教授、カリフォルニア大学アーバイン校客員准教授。主要著作・論文に、A Bayesian approach to modeling group and individual differences in multidimensional scaling.(Journal of Mathematical Psychology, 2016,共著)、『伝えるための心理統計――効果量・信頼区間・検定力』(勁草書房,2012年,共著)など。→webサイト、→twitter: @kenmetrics

ベイズ統計学の冬の時代

fig2-1

冬といえばクリスマス。当地では、こんなふうに車にトナカイの角と赤鼻をつけるのが流行していました

この原稿を書いているいまは1月末。冬真っ盛りのはずの時期ではありますが、西海岸の南カリフォルニアは温暖です。晴れの日が大半なこともあり、半袖で川沿いのサイクリングロードを毎朝気持ちよく通勤しています。もっともカリフォルニアでは水不足が深刻で、川といっても水はほとんど流れていないのですが……。

さて、前回は18世紀にベイズ牧師がベイズの定理を発見し、ラプラスがそれを広く普及させる形で発表した、というベイズ統計学の誕生についてお話ししました。ベイズ統計学は、現実世界の不確実性を確率という単一の尺度に落とし込んで表現し、データに基づいて確率を更新していきます。この更新に、ベイズの定理を用います。ベイズ統計学の考え方は、そのシンプルさと汎用性の高さから、19世紀にはいろいろな分野で応用されるようになりました。しかし、広まるにつれ、この枠組みに対する批判も見られるようになりました。

20世紀の大部分は、ベイズ統計学にとって冬の時代でした。これを決定づけたのは、現代統計学の祖といって過言ではないR. A. フィッシャー(1)と、ジェジー・ネイマン(2)、エゴン・ピアソン(3)らの、1920~30年代を中心とした仕事です。フィッシャーは、ベイズ統計学とは異なる、頻度論的統計学の枠組みを確立しました。ネイマンとピアソンはこれを推し進め、仮説検定という統計的意思決定法を確立しました。今回のテーマは、彼らがなぜベイズ統計学の枠組みを批判したのかについてです。

確率のアップデート

下の図は、ベイズ統計学に基づく推論を模式的に示したものです。

fig2-2

図 ベイズ統計学による推論の模式図

例を挙げましょう。Aさんは、海外のはじめて住む土地に引っ越してきたばかりです。家の最寄りのバス停に、定刻では8時着の路線バスがあるとします。このバスが実際にはいつ来るのか、についての推論を考えてみます。

図の横軸は定刻の8時を基準とした時間(分)を表すとします。青線で描かれているのは、バスの到着時間について、データを得る前に分析者がもっている確率分布、すなわち事前分布です。ここでは、この土地の路線バスがどのぐらい遅れるか、もしくは早く来るかについての情報がほとんどなく、0を中心とした「つぶれた」事前分布になっています(4)。緑のヒストグラムは、実際に1カ月の間このバス停で収集した、到着時刻のデータを表します。そして、ベイズの定理は、事前分布にデータのもつ情報を表す尤度の項をかけ合わせて、事後分布を導きます。なお、「∝」は左辺が右辺に比例する、という意味の記号です。

こうして事前分布とデータから、ベイズの定理を適用して得られた事後分布が、1カ月間の観測を経た後で、バスの到着時刻についての確率を表す事後分布になります。事後分布は赤線で示されています。

赤線の事後分布は、青線の事前分布よりも分布が釣り鐘型に引き締まっており、到着時刻について、より豊かな情報をもっています。具体的には、事後分布のピークは2より少しだけ小さいところにあり、定刻の8時よりも2分弱ほど遅れてバスが来る可能性が一番大きいことがわかります。また、事後分布のほとんどの領域は0から4の間にありますから、8:00~8:04の間にバスが来ると思っていれば、ほぼ間違いなさそうなこともわかります。この確率を具体的な値として得たい場合には、図の0から4までの事後分布の面積を求めればよいのです。このように、ベイズ統計学はデータのもつ情報によって、事前から事後へと、ベイズの定理を用いて確率をアップデートしていく枠組みです。


1 2 3
執筆: