Qualia Journal
数学・論理
正しい情報が揃っていても、人はそれを正しく使えない。基準率の無視は、直感と確率が最も激しく衝突する場所にある。
カーネマンとトヴェルスキーが「予測の心理学」を発表。基準率の無視を実験的に初めて示した。
この年、ベトナム戦争の和平協定が締結。シドニー・オペラハウスが開館。第四次中東戦争とオイルショックが世界経済を揺るがした。
基準率の無視(base-rate neglect)とは、ある出来事が「そもそもどれくらいの頻度で起きるか」という背景情報を無視し、目の前の手がかりだけで判断してしまう認知バイアスのこと。
健康診断の結果が返ってきた。封筒を開けると「要精密検査」の文字。心臓がどくんと鳴る。頭の中はもう「自分は病気だ」でいっぱいになっている。検査の精度が高いと聞いていれば、なおさらだ。陽性と出たのだから、病気に違いない——そう考えるのは、ごく自然なことに思える。
同じことは医療以外でも起きている。「この候補者は怪しい経歴書だから不採用だろう」「あの目撃者は80%の確率で正しいのだから、きっと正しい」。根拠があるように見える判断が、実はある情報をまるごと無視している。
その情報を「基準率」と呼ぶ。この記事は、人間の直感が確率を最も派手に裏切る瞬間の話だ。
確率に関する問いに直感で答え、その直感がどこでどう裏切られるかを体験する。そして、なぜ人間の脳が「そもそもの確率」を無視してしまうのか、そのメカニズムに迫る。
夜の街で、1台のタクシーがひき逃げ事故を起こした。この街にはグリーン・タクシーとブルー・タクシーの2社がある。街を走るタクシーの85%はグリーンで、15%がブルーだ。目撃者がひとり、「あれはブルーのタクシーだった」と証言した。裁判所が同じ条件下でこの目撃者の識別能力を検査したところ、80%の確率で正しく色を見分けることがわかった。
さて、問いはこうだ。事故を起こしたタクシーがブルーである確率は、いくつだろうか。多くの人は「80%」と答える。目撃者が80%正しいのだから、それがそのまま答えだと感じてしまう。しかし、正解は約41%だ。ブルーである可能性のほうが低い。
なぜ80%ではなく41%なのか。直感に反する理由は、グリーンのタクシーが圧倒的に多いという事実にある。街にタクシーが100台いるとしよう。85台がグリーン、15台がブルーだ。目撃者の精度が80%なら、ブルー15台のうち12台は正しく「ブルー」と識別される。しかし同時に、グリーン85台のうち17台が「ブルー」と誤認される(85 × 0.2 = 17)。つまり「ブルーだ」という証言が出る29回のうち、本当にブルーなのは12回だけ。12 ÷ 29 = 約41%。
| 実際の色 | 台数 | 「ブルー」と証言 | 「グリーン」と証言 |
|---|---|---|---|
| ブルー | 15 | 12(正しい) | 3 |
| グリーン | 85 | 17(誤認) | 68 |
| 合計 | 100 | 29 | 71 |
この表を眺めれば、構造は明快だ。「ブルー」という証言が29件あるうち、本物のブルーは12件しかない。基準率——「そもそもブルーは15%しかない」という情報——を考慮に入れなければ、目撃証言の信頼性を正しく評価できない。これが基準率の無視基準率の無視(base-rate neglect)
ある出来事が「そもそもどの程度の頻度で起きるか」という背景の確率を無視し、個別の手がかりや証言だけに基づいて判断してしまうバイアス。と呼ばれる現象の核心だ。
1973年、イスラエル出身の心理学者ダニエル・カーネマンDaniel Kahneman(1934–2024)
イスラエル生まれ、アメリカで活躍した心理学者。行動経済学の創始者の一人。2002年ノーベル経済学賞受賞。著書『ファスト&スロー』で知られる。とエイモス・トヴェルスキーAmos Tversky(1937–1996)
イスラエルの認知心理学者。カーネマンとの共同研究で、人間の判断におけるヒューリスティクスとバイアスの体系的研究を開拓した。が「予測の心理学(On the Psychology of Prediction)」という論文を発表した。この論文の中で二人は、被験者に架空の人物「ジャック」の人物スケッチを見せた。几帳面で、保守的で、数学パズルが趣味——。そして「この人はエンジニアか弁護士か」と尋ねた。
被験者にはもう一つ情報が与えられていた。ジャックが属する集団の構成比だ。あるグループでは「エンジニア70人、弁護士30人」、別のグループでは「エンジニア30人、弁護士70人」と伝えられた。理屈の上では、この比率——基準率——が回答に強く影響するはずだ。ところが被験者の回答はほとんど変わらなかった。人物スケッチが「エンジニアっぽい」ので、集団の構成比がどうであれ「エンジニアだ」と判断した。
カーネマンとトヴェルスキーはこれを代表性ヒューリスティック代表性ヒューリスティック(representativeness heuristic)
あるものが典型的なカテゴリにどれだけ似ているかで確率を判断する心理的近道。「エンジニアっぽい」→「エンジニアだろう」という推論がこれにあたる。で説明した。人は、ある人物や出来事がどれだけ「典型例に似ているか」で確率を判断する。似ていれば確率が高い、似ていなければ低い——と。この近道は日常では便利だが、確率の問題ではしばしば裏目に出る。「似ている」ことと「確率が高い」ことは、まったく別の話だからだ。
よくある誤解
検査が陽性で、精度が90%なら、自分が病気である確率も90%だ。
実際は
病気の人が人口の1%しかいなければ、陽性でも実際に病気である確率は約8%にすぎない。精度と事後確率はまったく異なる数字だ。
よくある誤解
目撃者が80%の確率で正しいなら、その証言は80%信頼できる。
実際は
対象となる出来事がまれな場合、80%の精度でも誤認が正解を上回ることがある。タクシー問題では41%まで下がる。
よくある誤解
基準率の無視は「無知」の問題で、統計を学べば解消される。
実際は
医師ですら、マンモグラフィの結果を10倍も過大評価することがある。知識があっても直感のバイアスは消えない。
これから2つの問いを出す。どちらも必要な情報はすべて与えられている。計算する前に、まず直感で答えてほしい。その直感がどこでどうずれるかを体験するのが、この記事の核心だ。
問い1: マンモグラフィ問題。ある年齢層の女性が定期検診でマンモグラフィを受ける。乳がんの有病率は1%。乳がんの人が検査を受けると、80%の確率で陽性になる。乳がんでない人が検査を受けても、9.6%の確率で陽性になる。ある女性の検査結果が陽性だった。この女性が実際に乳がんである確率は?
有病率: 1% / 検出率(感度): 80% / 偽陽性率: 9.6%
陽性と出た女性が、実際に乳がんである確率は?
正解: C — 約7.8%
1000人の女性を想像してほしい。10人が乳がんで、そのうち8人が陽性になる。残り990人のうち、約95人が偽陽性になる。陽性と出た103人のうち、本当に乳がんなのは8人だけ。8 ÷ 103 = 約7.8%。1982年、医師のデイヴィッド・エディがこの問題を医師100人に出したところ、95人が「70〜80%」と答えた。専門家でさえ、基準率を無視した。
問い2: タクシー問題。先ほど紹介した問題だ。あらためて、直感で答えてみてほしい。
街のタクシー: グリーン 85% / ブルー 15%
目撃者の識別精度: 80%
「ブルーだった」と証言。実際にブルーである確率は?
正解: C — 約41%
100台中、ブルー15台のうち12台が正しく「ブルー」と識別される。グリーン85台のうち17台が「ブルー」と誤認される。「ブルー」証言は合計29件、うち本物は12件。12 ÷ 29 = 約41%。目撃者が「ブルーだ」と言っても、実際にはグリーンである可能性のほうが高い。
2つの問いに共通する構造が見えてきただろうか。どちらも、「検査の精度」や「目撃者の正確さ」という個別の手がかりに引きずられ、「そもそもどのくらいの頻度で起きるか」という基準率が頭から消えてしまう。これがベイズの定理が教えてくれることであり、人間の直感が最も苦手とする計算だ。
ここで「数字ではなく目で見て」確かめてみよう。下のシミュレーターは、1000人を1000個のドットで表示する。「検査を実行」を押すと、陽性判定を受けた人がハイライトされる。その中で本当に病気なのは、ごくわずかだ。
この問題を正しく解くための道具が、ベイズの定理ベイズの定理(Bayes' theorem)
事前の確率(基準率)と新しい証拠を組み合わせて、事後の確率を求める公式。1763年にトーマス・ベイズが原型を発表、ラプラスが定式化した。だ。原理はシンプルで、3つの情報を組み合わせる。①ある仮説が正しい事前の確率(基準率)、②仮説が正しいときに証拠が観察される確率(感度)、③仮説が正しくなくても証拠が観察される確率(偽陽性率)。この3つから「証拠が観察されたとき、仮説が正しい確率」を計算する。
ここで「ものさし」をひとつ。検査の精度が80%とか90%とか言われても、それだけでは意味がわからない。大事なのは基準率との比率だ。基準率が50%(半々)なら、精度80%の検査は額面通り。しかし基準率が1%のように極端に低いと、精度が90%でも事後確率は一桁パーセントに落ちる。基準率が低いほど、検査が信頼性を「失う」度合いが大きい——これが直感に反するポイントだ。
1000人中、病気の人は10人。うち8人が陽性。健康な990人のうち95人が偽陽性。陽性103人中、本当に病気なのは8人。
スライダーを動かしてみてほしい。基準率を10%まで上げると、同じ検査精度でも事後確率は一気に跳ね上がる。逆に基準率を0.1%まで下げると、90%の感度でもほとんど当てにならなくなる。基準率こそが、事後確率の「地盤」なのだ。
基準率が無視される3つの認知メカニズム
人は確率を計算する代わりに、「これは典型的なパターンにどれだけ似ているか」で判断する。人物スケッチが「エンジニアっぽい」なら、集団にエンジニアが何人いようとエンジニアだと判断する。似ていること(representativeness)と確率が高いこと(probability)は別物だが、直感はそれを区別しない。
「病気であるときに陽性になる確率」(感度)と「陽性であるときに病気である確率」(事後確率)は異なるのに、多くの人がこの二つを混同する。数式で書くと、P(A|B)P(A|B)
「Bが起きたという条件のもとで、Aが起きる確率」を意味する記号。縦線「|」は「〜という条件のもとで」と読む。(BのときのAの確率)とP(B|A)P(B|A)
「Aが起きたという条件のもとで、Bが起きる確率」を意味する。P(A|B)とは別の値になることがほとんどで、これを混同するのが逆条件確率の錯誤。(AのときのBの確率)は別物だ。これは逆条件確率の錯誤(inverse fallacy)と呼ばれ、マンモグラフィ問題で医師が70〜80%と答える最大の原因だ。
人は抽象的な数字より、具体的なエピソードに強く反応する。「目撃者がブルーだと言った」という物語は鮮明で説得力がある。「街の85%はグリーンだ」という統計は抽象的で印象に残りにくい。基準率は「背景のノイズ」として無視され、個別の手がかりが「信号」として際立つ。
1763
トーマス・ベイズの論文が死後に発表
英国の牧師トーマス・ベイズが遺した論文「偶然の教義における問題を解くための試論」を、友人リチャード・プライスが王立協会で発表。確率を「信念の更新」として捉える考え方の原点。
1973
カーネマン&トヴェルスキー「予測の心理学」
エンジニア・弁護士問題で、人間が基準率を無視して個別情報に過度に依存することを実験的に証明。代表性ヒューリスティクスの概念を提唱した。
1980
バーヒレルが基準率無視の一般性を確認
マヤ・バーヒレルがタクシー問題を含む複数の実験で基準率無視の頑健性を示し、因果的な基準率とそうでない基準率で無視の度合いが異なることを発見。
1982
エディのマンモグラフィ研究
医師デイヴィッド・エディが医師100人にマンモグラフィ問題を出題。95人が事後確率を70〜80%と見積もった(正解は約8%)。専門家でさえ基準率を無視することを示した衝撃的な結果。
1995
ギゲレンツァー&ホフラージュ「自然頻度」の発見
確率を「自然頻度」で表現すると、ベイズ推論の正答率が劇的に向上することを実証。人間は確率よりも頻度の方が扱いやすいという新たな視点を提供した。
2002
カーネマン、ノーベル経済学賞受賞
トヴェルスキーの死後6年、カーネマンが単独でノーベル経済学賞を受賞。基準率の無視を含む認知バイアスの研究が、経済学の根幹を揺るがした功績が評価された。
基準率の無視が怖いのは、必要な情報がすべて目の前に揃っていても起きることだ。タクシー問題でも、マンモグラフィ問題でも、数字はすべて提示されている。足りないのは情報ではなく、情報の使い方だ。
"The correct answer is 41%. However, you can probably guess what people do when faced with this problem: they ignore the base rate and go with the witness."
「正解は41%だ。しかし、この問題に直面したとき人は何をするか、想像がつくだろう。基準率を無視し、目撃証言に飛びつくのだ。」
— ダニエル・カーネマン『ファスト&スロー』より
1995年にギゲレンツァーが示した「自然頻度」という解法は、希望を与えてくれる。「1%の有病率で感度80%」と言われるとわからない。しかし「1000人のうち10人が病気で、そのうち8人が陽性。残り990人のうち95人も陽性」と言われれば、8÷103という計算は見える。表現を変えるだけで、正答率は大幅に上がる。
「1000人の広場」
広場に1000人が立っている。そのうち10人だけが赤い帽子をかぶっている(病気の人)。検査官が旗を振ると、赤い帽子の8人と、帽子をかぶっていない95人が前に出てくる。前に出た103人の中で、実際に赤い帽子をかぶっているのは8人だけ。
画像生成プロンプト
鳥獣戯画タッチ。広場に小さな人物が大勢立っている。ほとんどが白い着物だが、10人だけ赤い帽子をかぶっている。検査官役の蛙が旗を振り、前に出た一群がいる。その中に赤い帽子は数人しかいない。墨線、和紙テクスチャ、余白多め。
Fig. — 自然頻度で見る基準率。「1000人中」で考えると、構造が一目でわかる。
日常に戻って考えてみよう。採用面接で「この候補者は優秀そうだ」と感じたとき、そのポジションの応募者全体の中で優秀な人がどのくらいの割合でいるかを考慮しているだろうか。SNSで「この健康法は効く」という体験談を見たとき、そもそもその症状が自然に治る確率を考えているだろうか。私たちは常に、目の前の鮮やかな情報に引っ張られ、背景の確率を忘れている。
裁判での基準率の無視
法廷で目撃証言の信頼性が問われるとき、陪審員は証人の正確さだけに注目し、事件が起きる基準率を無視しがちだ。DNA鑑定のような高精度の証拠でさえ、人口の規模次第では偽陽性の問題が生じる。英国では複数のえん罪事件で、基準率の無視が裁判の判断を歪めたことが指摘されている。
基準率の無視は、知っていれば完全に防げるものではない。しかし知っていれば、少なくとも立ち止まることができる。「そもそもの確率はどのくらいだ?」という問いを、判断の前に挟む習慣をつけること。ベイズの定理は計算の道具であると同時に、思考の姿勢でもある。
On the Psychology of Prediction
基準率の無視を実験的に示した最初期の論文。エンジニア・弁護士問題、トムW問題を含む。代表性ヒューリスティクスの提唱。
The Base-Rate Fallacy in Probability Judgments
基準率無視の一般性と頑健性を体系的に検証。因果的基準率と偶発的基準率の区別を導入した重要な論文。
Probabilistic Reasoning in Clinical Medicine
医師100人にマンモグラフィ問題を出題し、95人が事後確率を大幅に過大評価した研究。医療における基準率無視を示した古典。
How to Improve Bayesian Reasoning Without Instruction: Frequency Formats
確率を自然頻度で表現するとベイズ推論の正答率が劇的に向上することを15の課題で実証。認知心理学の転換点となった。
Thinking, Fast and Slow(ファスト&スロー)
認知バイアス研究の集大成。タクシー問題をはじめ、基準率の無視が直感的思考(System 1)の限界として論じられている。