ベイズ統計学による心理学研究のすゝめ(3)
Posted by Chitose Press | On 2016年03月25日 | In サイナビ!, 連載専修大学の岡田謙介准教授による「ベイズ統計学による心理学研究のすゝめ」,第3回は,頻度論に基づく帰無仮説検定・有意性検定の問題点がベイズ統計学ではどう解消されるのかを紹介します。(編集部)
岡田謙介(おかだ・けんすけ):専修大学人間科学部准教授,カリフォルニア大学アーバイン校客員准教授。主要著作・論文に,A Bayesian approach to modeling group and individual differences in multidimensional scaling.(Journal of Mathematical Psychology, 2016,共著),『伝えるための心理統計――効果量・信頼区間・検定力』(勁草書房,2012年,共著)など。→webサイト,→twitter: @kenmetrics。
世紀末,という言葉は,ともすると終末論的な意味合いで語られがちです。しかし,実際の20世紀末には,恐怖の大王がどこからか降臨することはありませんでした。それどころか1990年代に入って,心理学を始めとする実証的な学問分野ではベイズ統計学再興の機運がにわかに高まりました。長かったベイズ統計学の冬が終わり,春がやってきたのです。
その原動力は2つあります。1つは頻度論に基づく帰無仮説検定・有意性検定に科学の仕組みが依存しすぎたことに対する反動であり,もう1つは計算機の発展と軌を一にしたマルコフ連鎖モンテカルロ法の発展です。
今日は特に前者のお話を,そして次回に後者のお話を書きたいと思います。
従来の仮説検定の問題点
フィッシャーとネイマン,ピアソンらが確立した頻度論に基づく仮説検定は,20世紀の大半を通じ,統計的データ分析の主役でした。「平均値の差のt検定」や「クロス表のカイ二乗検定」といった検定は,大学でデータを扱う分野を専攻すれば,一度は触れる機会があるでしょう。科学者コミュニティの中でデータ分析が認められ,論文として世に出るためには,仮説検定を行い「p<0.05 」という結果を出す必要がある。それが,「統計学的有意性」を示したことになる。心理学を始め多くの分野で,こうした考え方が主流の時代は長く続きました。
しかし,仮説検定のアイディアはたしかに有用なのですが,科学の仕組みがあまりに従来の検定に依存したために,その弊害が表面化するようになりました。特にロジックの観点から,今回は2つの問題点に注目しましょう。
問題点その1――仮説の非対称性点
仮説検定では,帰無仮説と対立仮説という2つの仮説が登場します。例えば,血圧を下げる薬の効果を調べるために薬を飲む前後で血圧を測定する状況を考えましょう。このとき,帰無仮説は薬を飲む前後で測定値に「差がない」という仮説,対立仮説は「差がある」という仮説です。
仮説検定には2つの仮説が登場するので,公平に2つを天秤にかけるのだと思われるかもしれません。しかしじつはそうではなく,仮説検定で考えるのは,帰無仮説が正しい状況だけなのです。仮説検定の流れは,簡略化して書くと次のチャートのようなものです。
ここからわかる通り,仮説検定で検討するのは帰無仮説が正しいという前提のもとでの話だけなのです。仮説検定では,帰無仮説が正しいときに,いま手元にあるようなデータが手に入る確率(1),すなわちp値を求めます。もしp値が事前に定めた基準(典型的には0.05)よりも小さい場合には,帰無仮説が正しいという前提のもとではめったに得られないデータが得られたことになります。ですので,そもそもの前提,すなわち帰無仮説が間違いだったのだと結論づけ,代わりに対立仮説を採用します。これが仮説検定のロジックです。はじめにわざと言いたいのとは逆の仮定をし,データがそれが整合的ではないと示すことによって言いたいことを主張する,という点で,このロジックは数学の証明で使う背理法と似ています。
このロジックを2つの仮説の間での選択に使ううえで,問題点は何でしょうか。それは,帰無仮説を積極的に支持できないことです。もしp値が事前に定めた基準より大きい場合,それはデータが帰無仮説のもとでめったに生じないわけではないことを意味します。ですが,このことは,帰無仮説を積極的に支持するわけではありません。実際,ほかの仮説のもとでは,もっと得られやすいデータかもしれないのです。仮説検定は帰無仮説を前提としたもとで話を進めており,対立仮説を含むほかの仮説については直接考えないので,枠組み上,帰無仮説を積極的に支持することができないのです。