確率推論におけるエラー
今回は確率推論におけるエラーということで、4つのエラーを例題とともに紹介します。
ちなみに確率推論は帰納的推論に含まれますが、帰納的推論におけるエラー・バイアスについては、『帰納的推論におけるエラー・バイアス』の記事で扱っていますので、併せて確認しておいてください。
ここで生じるエラーは代表性ヒューリスティクでも説明が可能です。
それでは早速見ていきます。
事前確率の無視
被験者は事前確率の情報を無視して、ステレオタイプの代表性情報に基づいて判断を行う、というエラーです。
例題を挙げます。
「30人はエンジニア、70人は弁護士の合計100人の集団があります。そこから一人を選出してみると、その人は政治・社会問題に無関心で、余暇は日曜大工だといいます。この時選出された一人がエンジニアである確率は?」
このような問いかけに対し、90%の被験者がエンジニアの割合を多く見積もって答えました。
このようなエラーは、症状から病名を判断する問題でもよく生じます。
ベイズの定理
(Bayes’ theorem)
これは、事前確率の無視が起こらないように、仮説の正しさを確率的に求める定理です。
「事象Aが起こったという条件のもと、事象Bが生じる確率」を計算します。
これを条件付確率と呼びます。
たまにこれを計算させる問題が出ますが、まあ、できなくてもいいと思います…。この公式が親切に問題文の中にのっていることがほとんどです。
一応この式の記号の説明をしておくと、右式の分母の上のバー( ̄)は事象Bが起こらない確率のことを表します。
ここで有名な例題をもうひとつ紹介しておきます。
感染者問題
「感染確率は1000人に一人。検査薬で、感染していれば0.98の確率で陽性、していなくても0.01の確率で陽性が出ます。もし陽性だった場合、感染している確率はどれだけか?」
皆さんも軽く予想してみてください。
後程正解をお伝えしますので、なんとなくで想像してみましょう。
おそらく何となくの予想とは異なる数値だと思います。
人の直観と規範解とのこのような解離が、心理的なバイアスとして問題とされています。
それでは正解です。
この問題の、実際の確率は約0.089です。大体9%ですね。
いかがですか?事前確率の無視のエラーを体験できたでしょうか。
ギャンブラーの錯誤
(gambler’s fallacy)
次はギャンブラーの錯誤です。これはランダム系列の誤認知とも言われています。
例を挙げますね。
「コインの裏と表が次のように出た場合、次に裏が出る確率は?」
裏 表 表 裏 表 裏 ⇒?
裏 裏 裏 裏 裏 裏 ⇒?
どのような結果になるかは皆さんもすぐわかると思います。
このエラーは我々の’ランダム’というものに対する誤認知によって起こるとされています。
連言錯誤
(conjunction fallacy)
これは圧倒的有名な例題を早速紹介します
リンダ問題
(Tversky & Kahnemann , 1983)
「リンダさんは31歳独身、率直、頭が良い、大学専攻は哲学。学生時代は差別と社会的正義の問題に関心を示し、反核デモに参加した経験を持ちます。この人物はどちらが当てはまるとおもいますか?」
A)彼女は銀行出納係である。
B)彼女は銀行出納係でフェミニスト運動の活動家である。
この例題に対し、Bを選択する被験者が多いようです。
Bという選択肢は、Aである確率よりも条件が増えているため、確率は下がるのですが、選択肢の後に続くフェミニスト運動の活動家であるという連言による錯誤が起こる為だと考えられます。
標本の大きさの無視
(sample size neglect)
こちらもトバスキー・カーネマンによる有名な例題を紹介しますね。
病院問題
(Tversky & Kahnemann , 1972)
「大小の病院が一つずつ、一日約45人、15人それぞれで赤ちゃんが生まれます。合計の男女差平均は等しいが、日によってバラつきがあります。6割以上男子の場合は☆マークを付けて一年経過したとき、どちらの病院で、より☆マークが多くなるか?」
この問いに対し、被験者は変わらない、と答えることが多いようです。
しかし実際は、大数の法則によって、標本が大きいほど期待値が出やすい、とされるため、小病院の方が☆マークは多くなります。
これが標本の大きさの無視です。
今回はこれで以上です。これらは有名なものが多いので、しっかり復習しておきましょう。
お疲れ様でした。