10月 みあやまり――擬似相関(2)
『大学生ミライの因果関係の探究』より
Posted by Chitose Press | On 2016年09月20日 | In サイナビ!, 連載本当にそういうデータが得られるのだろうか。
「実際にデータをとってみなくても大丈夫。もしもデータをとれば,おそらくは高い正の相関が出るはずだ」
そんなこと,確実に言えるのだろうか。
「そういうデータをとると,こういう散布図が得られる」
そう言うと先生は,メモ用紙にグラフを描き始めた。
グラフを見ると右上がりで,とても高い正の相関が得られそうだ。
「このままだと,相関係数はとても高い。.80以上あるんじゃないかな」
たしかに,それくらいありそうな気がする。でも,これはさっきと同じ,擬似相関の例ではないのだろうか。何が第3の変数?
「この関連には,学年が影響している」
それが第3の変数ということなのか。
「同じテストをしているので,学年が上がれば上がるほど,かけ算の得点は上昇する。そして……」
私は先生の言葉に続いた。
「学年が上がれば上がるほど,握力は上昇するというわけですね」
「そういうことだね」
先生がうなずく。
学年という第3の要因が,握力とかけ算の両方に影響を及ぼす。そして,結果的に,両者の間に正の相関が生じる。
先生は,このグラフに,学年の要因をつけ加えて描いた。
「散布図で表すと,こうなる。左下が2年生で,学年が上がるほど右上に上昇していく」
図の中で,円が順に折り重なっている。
「それぞれの学年の中だけで考えれば,散布図は円形,つまり相関は0だ。学年の影響を取り除けば,この斜めのグラフが円形になる」
影響を取り除くって? どうすれば良いのだろう。すると先生が教えてくれた。
「この影響要因を取り除いて関連を検討するには,偏相関係数や,重回帰分析を利用した方法を使うことができる。具体的な分析については,そのうち実際にやってみることもあるだろう。まずは分析方法の名前だけ覚えておくといいね」
偏相関係数に,重回帰分析か。覚えておこう。
(→続く:近日公開予定)
「因果関係があるかないかを決めるのは,予想以上に難しかった」。心理学科のミライが統計にまつわる出来事に遭遇するキャンパスライフ・ストーリー。ストーリーで心理統計がわかる!