Qualia Journal
認知バイアス
能力の低い人ほど自分を過大評価する——あの有名なグラフの読み方は、本当に正しかったのか。
Kruger & DunningがJournal of Personality and Social Psychologyに原著論文を発表。
同年、ユーロが導入され、NATOがコソボ空爆を開始。映画『マトリックス』が公開された年。
Ig Nobel Prize 2000受賞。「まず笑わせ、それから考えさせる」研究に贈られる賞。論文の引用数は7000を超える。
なにかを始めたばかりの頃、妙に自信に満ちていた経験はないだろうか。プログラミングの入門書を1冊読み終えたとき、語学アプリで100日連続を達成したとき、投資の本を3冊読んだとき。「だいたいわかった」という感覚が湧いてくる。
しばらくして気づく。入門書の先にはもっと広い世界があり、100日で身についたのは挨拶程度で、投資の本に書いてあったことは相場の1割も説明していなかった。あのとき「わかった」と感じたのはなんだったのか。
その感覚には名前がある。そしてその名前自体が、今、揺らいでいる。
自分の能力を自分で見積もる——その行為自体に潜む歪みを、自分の手で確かめる。
1995年1月6日、ペンシルベニア州ピッツバーグで2件の銀行強盗が起きた。犯人のマッカーサー・ウィーラーは、マスクもせず、変装もせず、白昼堂々と防犯カメラに向かって微笑みながらカウンターに歩いていった。その夜のニュースで監視映像が放送されると、通報が殺到し、深夜0時過ぎには逮捕された。
警察が写真を見せると、ウィーラーは心底驚いた顔でこう言ったという。「でも俺はレモン汁を塗ったんだ」("But I wore the juice.")。レモン汁は透明インクに使える。だからレモン汁を顔に塗ればカメラに映らないはずだ——それが彼の論理だった。実行前にポラロイドカメラで「テスト」までしていた。おそらくカメラの向きが悪かったか、フィルムの不具合で、写真に顔は映らなかった。彼はそれを成功の証拠だと解釈した。
イラスト①|レモン汁を顔に塗り、カメラに向かう男
銀行の窓口カウンター。背の低いがっしりした男が、レモン汁で顔をてからせながら防犯カメラに堂々と向き合っている。カメラのレンズは男の顔をはっきりと捉えている。
画像生成AIへのプロンプト
Chojugiga-style ink wash illustration, monochrome sepia, a stout frog character standing at a bank counter confidently smiling at a surveillance camera, lemon juice dripping from his face, the camera clearly capturing his face, Japanese scroll painting aesthetic, no text
イメージ図(画像生成AI使用予定)
この話がコーネル大学の社会心理学者デイヴィッド・ダニングDavid Dunning(1961–)
コーネル大学、現在はミシガン大学の社会心理学者。自己認識と判断の歪みを専門とする。の目に留まった。彼は思った——ウィーラーが銀行強盗として無能なら、おそらく自分が無能であることを知る能力においても無能なのだ。大学院生のジャスティン・クルーガーJustin Kruger
当時コーネル大学大学院生、現在はニューヨーク大学の心理学者。とともに、その直感を科学にする研究が始まった。
1999年、クルーガーとダニングはコーネル大学の学部生を対象に、ユーモア、文法、論理的推論の3つの領域でテストを行った。テストのあと、学生たちに「自分は全体の中でどのくらいの順位だったと思うか」を推定してもらった。
ここで使われたのがパーセンタイルパーセンタイル(percentile)
100人並べたときに下から何番目かを示す数値。50パーセンタイルなら「ちょうど真ん中」、90パーセンタイルなら「100人中90番目に良い=上位10%」という意味。という尺度だ。100人を成績順に並べたとき、下から何番目にいるかを示す数値で、50なら「ちょうど真ん中」、90なら「上位10%」を意味する。結果は明快だった。
原論文の主な発見——下位の学生は自分を「平均より上」の位置だと評価した
下位25%の学生が示した自己評価と実際の成績の差は、約50パーセンタイル。100人中12番目なのに「62番目くらいだろう」と思っていた。以下の表は、原論文の4つのグループごとの結果を整理したものだ。「乖離」の列が、自己評価と実際の順位のずれを示している。
| グループ | 実際の順位 | 本人の予想 | ずれ |
|---|---|---|---|
| 成績下位25% | 12番目 / 100人中 | 62番目 | +50(大幅な過大評価) |
| 成績やや下位 | 36番目 | 57番目 | +21 |
| 成績やや上位 | 62番目 | 64番目 | +2(ほぼ正確) |
| 成績上位25% | 86番目 | 72番目 | −14(やや過小評価) |
※ 数値はパーセンタイル(100人中の順位)。原論文Study 3(論理的推論テスト)のデータに基づく。
クルーガーとダニングはこの現象を「二重の負担」(dual burden)と呼んだ。能力が低いこと自体が、自分の能力の低さを認識する能力をも損なう。これがダニング=クルーガー効果の核心だ。
"Not only do these people reach erroneous conclusions and make unfortunate choices, but their incompetence robs them of the metacognitive ability to realize it."
こうした人々は誤った結論に達し不運な選択をするだけでなく、自らの無能さがメタ認知能力を奪い、それに気づくことすらできない。
— Kruger & Dunning, 1999, p. 1121
論文はさらに興味深い実験を加えている。Study 4では、下位群の学生に論理的推論のトレーニングを施した。すると彼らは自分の成績を正しく評価できるようになった。スキルを身につけた瞬間、自分がそのスキルを持っていなかったことに初めて気づいたのだ。
✗ よくある誤解
「バカほど自信満々」——知能が低い人ほど全般的に自信過剰になるという話
✓ 実際は
知能の話ではなく、特定のスキル領域における自己評価の歪み。同じ人でも得意な分野では正確に自己評価できる
✗ よくある誤解
能力が低い人は高い人より「自信がある」
✓ 実際は
低い人の自信は「過大」だが、高い人の自信レベルよりは低い。下位群が上位群を上回るわけではない
✗ よくある誤解
ネットで見る「自信が山型に上がって谷型に落ちる」グラフが原論文のものだ
✓ 実際は
あのU字型のグラフ(通称「Mt. StupidMt. Stupid(愚かの山)
ネット上で広まった俗称。知識がほんの少しある段階で自信がピークに達し、その後急落するとされる地点。出典不明で、クルーガーもダニングも描いていない。」と呼ばれる)は出典不明。原論文のグラフとはまったく違う
ダニング=クルーガー効果の厄介さは、読んで理解しても「自分には当てはまらない」と感じてしまうところにある。他人の話だと思えてしまう。だからここでは、自己評価の精度を実際に体験してもらう。
以下の5問に答えたあと、「自分は何問正解したか」を予想してほしい。正直に。誰にも見えない。原論文でも学生たちはテストのあとで自己評価を求められた。やることは同じだ。
Q1. 地球上の水のうち、人間が飲める淡水の割合はどのくらいか? 海水や氷河に閉じ込められた水を除いた、利用可能な淡水の割合。
Q2. 100人のうち1人がある病気にかかっている。この病気を調べる検査は、かかっている人を95%の確率で「陽性」と判定する。しかし、かかっていない人も5%の確率で誤って「陽性」と判定してしまう。あなたが検査を受けて「陽性」が出た。実際に病気である確率は? 直感で答えてみてほしい。計算しなくていい。
Q3. コインを5回投げて、5回とも表が出た。6回目に表が出る確率は? 公平なコインだとする。
Q4. 「すべてのバラは花である」「いくつかの花はすぐ枯れる」——この2つの前提から「いくつかのバラはすぐ枯れる」は正しいと言えるか? 日常の感覚ではなく、論理として正しいかどうかを考えてほしい。「すべてのバラは花」であっても、「すぐ枯れる花」の中にバラが含まれるとは限らない。
Q5. ある部屋に23人いる。この中に同じ誕生日の人がいる確率は、50%より高いか低いか? 365日のうちたった23人なので少なく感じるかもしれない。
あなたの結果
このクイズは、原論文の「テスト→自己評価」という構造を借りたものだ(問題自体はオリジナル)。原論文の下位群は平均で約50パーセンタイルの自己評価のずれがあった。あなたの結果がどうであれ、「自分は平均より上だろう」と感じたなら、それ自体がこの効果の入り口かもしれない。
"The first rule of the Dunning-Kruger club is you don't know you're a member of the Dunning-Kruger club."
「ダニング=クルーガー・クラブの第一法則——あなたは自分がメンバーだと知らない。」
— David Dunning
ダニング=クルーガー効果のメカニズムとして、原論文が提唱したのがメタ認知メタ認知(Metacognition)
自分の認知プロセスについての認知。「自分が何を知っていて何を知らないかを知る能力」のこと。の欠如だ。あるスキルの良し悪しを判断するには、まさにそのスキル自体が必要になる。文法のテストで自分の出来を正しく評価するには、文法の知識が必要で、その知識がない人は評価の基準そのものを持っていない。
メタ認知の有無が自己評価を左右する——上位群はスキルがあるぶん「他人もできるだろう」と考える
しかし話はここで終わらない。2000年代に入ると、この「メタ認知の欠如」という説明に対して、統計学の側から強力な反論が出始めた。
あの有名なグラフ、なぜそう見えたのか
成績が極端に低い人は、予想を聞かれると平均に近い値を答えやすい。逆に極端に高い人も同様だ。これは人間の心理に関係なく、統計的に必ず起こる現象で、2つの数値(実力と自己評価)の相関が完全でない限り避けられない。Krueger & Mueller(2002)が最初にこの問題を指摘した。
人間には「自分は平均以上だ」と思い込む一般的な傾向がある。ドライバーの80%が「自分は平均以上の運転技術がある」と回答した有名な調査がその好例だ。この誰もが持つバイアスと平均への回帰を組み合わせるだけで、ダニング=クルーガー効果に似たグラフが再現できる——と2020年にGignac & Zajenkowskiが示した。
原論文のグラフでは、横軸に「実際の成績」、縦軸に「自己評価と実際の成績の差」を取っている。しかしこの2つの変数には同じ数値(「実際の成績」)が含まれており、統計的に独立ではない。Nuhferら(2016, 2017)は完全にランダムなデータでも同じグラフパターンが出現することを示し、グラフの見た目の「劇的な差」の多くは、この測定手法に由来する可能性があると指摘した。
要するに:「能力が低い人が過大評価する」現象は実在する。しかし、あの有名なグラフが示していたほど劇的ではなく、その原因は「メタ認知の欠如」だけでは説明しきれない可能性がある。
● ダニング=クルーガー効果の主な研究 ○ 関連する批判・反論
1995
レモン汁事件
マッカーサー・ウィーラーがレモン汁で「透明人間」になったつもりでピッツバーグの銀行を強盗。ダニングがこの事件から着想を得る。
1999
原論文発表
Kruger & Dunning, "Unskilled and Unaware of It" がJournal of Personality and Social Psychologyに掲載。4つのStudyで効果を実証。
2000
イグノーベル賞受賞
「まず笑わせ、それから考えさせる」研究としてイグノーベル賞心理学部門を受賞。
2002
最初の統計的反論
Krueger & Muellerが「平均への回帰と平均以上効果で説明可能」と反論。同号でKruger & Dunningが再反論を掲載。
2008
実世界での追試
Ehrlingerらが教室外の実世界の課題でも効果が残ることを示す。銃愛好家の銃の安全知識についてのテストなど。
2016–2017
ランダムデータでも再現される
Nuhferらが、ランダムに生成したデータでも原論文と同じグラフパターンが出現することを数学誌Numeracyで発表。
2020
新しい分析手法の提案
Gignac & Zajenkowskiが、原論文の四分位法に代わる多項式回帰分析を提案。「ノイズ+バイアス」モデルで効果の大部分が再現できると報告。
2024–2025
「効果は人口の0.14%」/ 公開論争
Gignac & Zajenkowskiが影響範囲はごく限定的だとする分析を発表。2025年にはBPS誌上でMcIntosh & Della SalaとDunning本人が公開論争。
ここまでを整理しよう。ダニング=クルーガー効果には、少なくとも3つの層がある。
第一の層:自己評価が歪むという現象自体は存在する。これは原論文の発見のうち、最も堅固な部分だ。人間は自分の能力を正確に見積もることが苦手で、特に能力が低い領域ではその傾向が強くなる。これを否定する研究者はほとんどいない。
第二の層:あの有名なグラフが示していた「劇的な差」は、かなりの部分が統計的な見せかけである可能性がある。平均への回帰と平均以上効果を組み合わせるだけで、実際にメタ認知の欠如がなくてもグラフは同じ形になる。Gignac & Zajenkowski(2024)の分析では、ダニング=クルーガー効果と呼べる過大評価が顕著に現れるのはIQ換算で55程度——人口の0.14%という極めて限られた集団に限られると推定されている。
イラスト②|「ネットで広まったグラフ」と「原論文のグラフ」の比較
左:ネットで流布するU字型のグラフ(出典不明、「Mt. Stupid」のラベル付き)。右:原論文の実際のグラフ(4つの四分位群の棒グラフ)。2つがまったく違う形であることが一目でわかる構図。
画像生成AIへのプロンプト
Chojugiga-style ink wash illustration, monochrome sepia, two frog scholars in traditional Japanese robes standing before two different scrolls showing contrasting graph shapes, one scroll shows a dramatic mountain curve the other shows modest bar chart, Japanese scroll painting aesthetic, no text
イメージ図(画像生成AI使用予定)
第三の層:インターネット上で広まった「Mt. Stupid(愚かの山)」のグラフは、原論文とは完全に別物だ。「Mt. Stupid」とは、知識がほんの少しある段階で自信がピークに達するとされる地点のことで、「自信」がまず急上昇し、やがて落ち込み、再び緩やかに上がるU字型のグラフが添えられる。このグラフの出典は不明で、クルーガーもダニングも描いていない。にもかかわらず、これが「ダニング=クルーガー効果のグラフ」として数百万回シェアされている。効果を説明するために使われているグラフ自体が、効果の誤解を広めている。
"When I look back at my papers, including the 1999 paper that caused us to have this interview, there are things I wish I could have done differently. I welcome that feeling."
1999年の論文を含め、自分の論文を振り返ると、もっと違うやり方があったと思うことがある。その感覚を歓迎している。
— David Dunning, OpenMind Magazine, 2024
ダニング本人はこうした批判を認めつつも、「純粋に統計的な説明は、重要な学術的知見の多くを無視している」と反論している。2025年のBritish Psychological Society誌上での公開論争では、心肺蘇生法の実技試験で不合格になった医学生36人のうち不合格を自覚していたのはわずか3人だった事例や、ワクチンに関する知識が最も乏しい層がなぜか医師や科学者と同程度の知識があると自称したデータを引きながら、効果の実在性を主張している。
結局のところ、私たちは何を持ち帰ればいいのか。おそらくこうだ——自分の無知を認識する能力は、自分が思うほど高くない。これはグラフの形がどうであろうと、統計手法がどう改良されようと、変わらない事実だ。あのグラフの読み方は間違っていたかもしれない。しかし、ウィーラーがレモン汁を塗って銀行に向かったとき感じていたであろう確信——その確信は、程度の差こそあれ、私たちの日常にも住みついている。
『The Office』マイケル・スコット(2005–2013)
自分のマネジメント能力を疑わないまま、部下を困惑させ続ける上司。ダニング=クルーガー効果の大衆的なアイコンとして最も頻繁に引用されるキャラクターだが、原論文の「特定スキルの過大評価」とは少しずれている——マイケルは全般的に自信過剰だ。
ジョン・クリーズの解説動画(数百万回再生)
モンティ・パイソンのクリーズ(ダニングの友人)が「何かが得意になるために必要なスキルは、自分がその分野で下手だと気づくために必要なスキルとまったく同じだ」と要約。わかりやすさと引き換えに、統計的な議論はすべて省かれている。
TED-Ed "Why incompetent people think they're amazing"(2017)
ダニング本人が監修したアニメーション。「この効果を他人に対して使う前に、自分にも当てはまることを忘れないでほしい」という結びが印象に残る。
すべての始まり。4つの研究でユーモア・文法・論理の自己評価を検証。読みやすく、心理学論文の古典として価値がある。
最初の体系的反論。平均以上効果と回帰だけで効果を説明できると主張。同号にKruger & Dunningの再反論も掲載。
ランダムデータでダニング=クルーガーのグラフが再現されることを詳細に示した論文。グラフの描き方自体に問題があると指摘。
Rethinking the Dunning-Kruger Effect: Negligible Influence on a Limited Segment of the Population
ダニング=クルーガー効果が顕著に現れるのはIQ 55前後のごく限られた集団であると推定。四分位法に代わる新手法を提案。
The Dunning-Kruger Effect and Its Discontents
McIntosh & Della Salaの「効果は統計的なアーティファクトだ」とする記事への反論。25年分の研究を振り返りながら効果の実在性を擁護。