ベイズ統計学による心理学研究のすゝめ(4)
Posted by Chitose Press | On 2016年04月18日 | In サイナビ!, 連載専修大学の岡田謙介准教授による「ベイズ統計学による心理学研究のすゝめ」,第4回は,ベイズ統計学の普及について、計算の方法論的側面として、マルコフ連鎖モンテカルロ法とそれを実装したソフトウェアを紹介します。(編集部)
→連載第1回はこちら
→連載第2回はこちら
→連載第3回はこちら
→この連載をPDFや冊子で読みたいかたはこちら
岡田謙介(おかだ・けんすけ):専修大学人間科学部准教授。主要著作・論文に,A Bayesian approach to modeling group and individual differences in multidimensional scaling.(Journal of Mathematical Psychology, 2016,共著),『伝えるための心理統計――効果量・信頼区間・検定力』(勁草書房,2012年,共著)など。→webサイト,→Twitter: @kenmetrics。
ロサンゼルスはアメリカ第2の都市ですが,鉄道網が発達しておらず車移動が中心の,先進国では一風変わった都会です。少し前までは,自家用車を使わずに目的地に行くには,不便なバスを乗り継ぐか,高い料金を払ってタクシーを呼ぶしかありませんでした。ですが,UberやLyftといったスマートフォン上で配車から支払いまで完結するライドシェア・サービスが登場し,学生も大学教員もいまでは日常的に使っています。私も何度も利用しましたが,こうしたサービスの登場以前に当地で暮らすのは,もう少し簡単でなかっただろうなと思います。
UberやLyftが当地の人たちの生活を便利にしたように,今回紹介するマルコフ連鎖モンテカルロ法という技術,そしてBUGSに代表されるそれを実装したソフトウェアは,ベイズ統計学を用いたデータ分析を,便利で実用的にすることに大きく貢献しました。
積分計算の困難
ベイズ統計学は,ベイズの定理を用いて事前から事後へと確率を更新していく枠組みでした。ここで,ベイズの定理の式の分母は,エビデンスとよばれる,データについての確率です。この項はパラメータのすべての可能な値を考慮して求めるため,連続変数の場合にはそれについて積分する必要があります。特にパラメータが複数ある場合には,多重積分が必要になります。
また,複数のパラメータを含む統計モデルを考えている場合でも,第一義的な関心は,各パラメータについて個別の点推定値(例えば事後平均)やばらつきの大きさ(例えば事後標準偏差)であることが多いです。この計算にもやはり,事後分布をほかのパラメータについて多重積分する必要があります。
こうした確率分布の積分計算は,事前分布をかなり工夫して設定しない限り,一般に容易ではありません。少し複雑な統計モデルになると,事実上この積分計算は解析的に行えなくなってしまうのです。
ベイズ統計学は直感にも合い,一貫して合理的な枠組みでした。ですが,1980年代まではこの積分計算の困難さによって,単純な統計モデル以外では,求めたい事後確率を実際に計算することができませんでした。このために,ベイズ統計学は理想論であって現実に合っていない,「考え方はわかるけれども実際に使えない」という状況が生じてしまっていました。