ベイズ統計学による心理学研究のすゝめ(3)

問題点その2――仮説の確率が求められない

ところで,先に「p値」が登場しました。p値は,統計用語としては知名度がある用語です。しかし,その意味は誤まって理解されていることも多いです。p値の値は,いったい何を表すのでしょうか?

答えはすでに先ほど(より正確には注に)書きましたが,よくある誤解に,p値は「帰無仮説が正しい確率」であるというものがあります。これは,クジラは魚である,とかオーストラリアの首都はシドニーである,などと同じように,よくある誤解です。

p値は「帰無仮説が正しい確率」である,という考えが誤りなのは,頻度論における確率の考え方に由来します。統計学では,データ生成の背後に確率的なメカニズムを考えます。前回お話ししたように頻度論では,試行を繰り返したときの頻度の極限として確率を解釈するのでした。ある仮説が正しいときに,データを繰り返し得ることは,少なくとも概念的に可能です。しかし,あるデータが与えられたときに,そこから「仮説」についての繰り返しを想定することはできないでしょう。あるデータを生じたメカニズムについての仮説は,正しいか,もしくは間違っているかのどちらかです。たとえそのどちらなのかが不確実であっても,仮説を繰り返す?ということが考えられない以上,仮説についての確率は考えることができないのです。「帰無仮説が正しい確率」は,頻度論ではそもそも考えることができない量だったのです。

そこで従来の検定では,帰無仮説が正しい確率を考える代わりに,帰無仮説が正しいことを前提としたときに手元にあるようなデータが得られる確率を考えることにしました。これがp値です。p値の考え方は,多分に頻度論的なものだったのです。

しかし,しつこくて恐縮ですが,p値を「帰無仮説が正しい確率」であると思ってしまうことは,私の講義での経験からもとても多い誤解です。データ分析は仮説が支持されるかどうかを検証するために行っているのですから,仮説についての確率を評価したいというのは,むしろ自然に考えることなのだと思います。

じつはこれ,ベイズ統計学ならできるんです。

ベイズ統計学では?

ベイズ統計学の立場からは,従来の検定の2つの問題点はどうなるでしょうか?

まず2つめの,仮説の確率についてから見ていきましょう。ベイズ統計学では,確率は不確実性の度合いを表す量だと理解します。これにより,多数回の繰り返しが考えられない状況でも,確率的な議論ができるようになるのでした。したがってベイズ統計学の立場からは,手元のデータの生成メカニズムとして帰無仮説が正しい確率を考えることが,問題なくできます。繰り返しが可能かどうかは,ベイズの立場からは問題ではないのです。

ただし,仮説の確率を実際に求めるにあたっては,注意すべき点が2つあります。

第1に,ある仮説の確率とは,それ単独では考えることはできない相対的なものです。ほかにどんな仮説が候補としてありうるのか,ほかの候補がいくつあるのかなどによって,仮説の確率は変わります。このことは,すべての場合について合計すると1(100%)になる,という確率の重要な性質に由来します。

第2に,単にある仮説の確率よりも,データによって仮説を支持する証拠の大きさがどれだけ変化したのか,の方が実際的にはより重要なことが多いです。例えば,明日の天気は晴れか雨かを考えましょう。ここ南カリフォルニアは,冒頭に示した青空とヤシの木の写真でイメージされる通りの乾燥した気候で,特に夏の間は普通,ほぼまったく雨が降りません。ですので,予報士が夏のある日,気象データに基づいて「明日は晴れでしょう」という予報を出したとしても,もともと晴れの事前確率が高かったですので,それほど価値のある情報が得られたとは言い難そうです。一方,気象データに基づいて「明日は雨でしょう」という予報を出した場合はどうでしょう。今度はデータ分析をする前後で支持される仮説が大きく変わったのですから,データ分析から得られた情報の価値は高いといえるでしょう。このように,単に仮説の確率だけではなく,事前から事後へと仮説の確率がどう変わったのかを評価することは大切なのです。


1 2 3
執筆: