Qualia Journal

数学・論理

数字の世界の推しは、いつも1

川の面積、人口データ、納税申告書——あらゆる数字の先頭桁は均等に散らばらない。1が30%、9がわずか5%。この偏りは偶然ではなく、対数の必然だった。

Est. 1938

物理学者フランク・ベンフォードが20,229件のデータから先頭数字の偏りを発表。「異常な数の法則」と名づけた。

同年、オーソン・ウェルズ『宇宙戦争』のラジオ放送がアメリカ中をパニックに陥れ、スーパーマンが『Action Comics #1』で初登場した。

先行発見者: 天文学者サイモン・ニューカムが1881年に同じ現象を記録していたが、2ページの短い論文だったため半世紀以上忘れ去られた。スティグラーの名称法則Stigler's law of eponymy
「科学上の発見は、その本当の発見者の名前では呼ばれない」という法則。統計学者スティーブン・スティグラーが1980年に提唱した。この法則自体、社会学者ロバート・マートンが先に指摘していたため、法則自身が法則の好例になっている。
の好例。

家計簿を開いたとき、スーパーの値段を眺めたとき、ニュースで見た人口の数字を思い出すとき——私たちは先頭の数字に注意を払わない。1から9まで均等に散らばっているはずだと、誰もが漠然と思っている。

だが、その直感は驚くほど間違っている。レシートの金額でも、世界の国々の面積でも、企業の決算書でも、先頭が1の数字は9の6倍以上ある。偶然ではない。単位を変えても、通貨を変えても、データの種類を変えても、この比率はほとんど変わらない。

これが「ベンフォードの法則」だ。自然に生まれた数字には、対数のスケールに従った偏りが刻まれている。

難易度
初中級 — 対数を知らなくても読める
読了時間 約 18 分
要点

身の回りの数字を集めて先頭桁先頭桁(leading digit)
ある数の最初の0でない数字のこと。たとえば 17,098,242 の先頭桁は 1、923,768 の先頭桁は 9。ベンフォードの法則はこの先頭桁の出現頻度についての法則。
を数え、「均等に散らばっているはず」という思い込みがどれほど外れるかを体験する。

背景

汚れたページが語った法則

1881年、サイモン・ニューカムSimon Newcomb(1835–1909)
カナダ生まれのアメリカの天文学者・数学者。海軍天文台で天体暦の改訂に尽力した。対数表の摩耗から先頭数字の偏りに気づいた最初の人物。
というカナダ出身の天文学者が、職場の図書室でささやかな異変に気づいた。共用の対数表対数表(table of logarithms)
電卓がない時代、掛け算や割り算を手早くこなすために使われた数値表。対数を使うと掛け算が足し算に変わるため、天文学者や技術者の必需品だった。数字は1.000…から9.999…まで順に並んでいる。
。当時の科学者が複雑な計算を処理するために日常的に使っていた分厚い数値の書物だ。その最初のほうのページだけが、妙に汚れていた。後半のページは比較的きれいなままだった。

よく使われる = 汚い あまり使われない = きれい 1.000 〜 2.999… 7.000 〜 9.999… 1のところだけやたら汚れてるな…

対数表の前半には、先頭が1や2の数字が並んでいる。後半には8や9で始まる数字が並ぶ。つまり、科学者たちは1で始まる数字を圧倒的に多く調べていた。ニューカムはこの観察から、自然界に現れる数字の先頭桁は均等ではなく、小さい数字ほど多く出現するという仮説を導き出した。彼はこの結果を『American Journal of Mathematics』にわずか2ページで発表したが、ほとんど誰にも注目されなかった。

ベンフォードの法則が予測する先頭数字の出現率 均等なら各11.1%のはずが、実際はこう偏る 1: 30.1%1 2: 17.6%2 3: 12.5%3 4: 9.7%4 7.9%5 6.7%6 5.8%7 5.1%8 4.6%9 ← 均等なら 11.1%

半世紀以上あとの1938年、ゼネラル・エレクトリック社の物理学者フランク・ベンフォードFrank Benford(1883–1948)
アメリカの電気工学者・物理学者。GEの研究所で光学測定を専門とし、109の論文を発表。対数表の偏りに気づき、20分野・20,229件のデータで検証した。
がまったく同じ現象に気づいた。ただしベンフォードはニューカムと違い、観察にとどまらなかった。川の面積、都市の人口、物理定数、分子量、Reader's Digest誌の数字、死亡率。20の異なる分野から20,229件のデータを集め、すべてが同じパターンに従うことを示したのだ。1938年、アメリカ哲学会紀要に「異常な数の法則(The Law of Anomalous Numbers)」として発表された。

先頭桁123456789
予測値30.1%17.6%12.5%9.7%7.9%6.7%5.8%5.1%4.6%
均等なら11.1%11.1%11.1%11.1%11.1%11.1%11.1%11.1%11.1%

"It is a general law that in all tables of statistics the weights of different digits are not equal."

「すべての統計表において、各数字の重みが等しくないことは一般的な法則である。」

— Simon Newcomb, "Note on the Frequency of Use of the Different Digits in Natural Numbers" (1881)

Frank Benford

物理学者 / ゼネラル・エレクトリック研究所

1883年ペンシルベニア州ジョンズタウン生まれ。6歳のときにジョンズタウン大洪水で自宅を失う。ミシガン大学卒業後、GEの照明工学研究所で18年、研究所で20年勤務。光学測定の専門家として109の論文と20の特許を残した。対数表の汚れに気づいた「ただの好奇心」が、彼の名を最も広く知らしめることになった。

読む前に確認 — よくある誤解

✗ よくある誤解

すべてのデータがベンフォードの法則に従う

✓ 実際は

身長、電話番号、IQスコアなど範囲が限定されたデータは従わない。法則が成り立つのは複数桁にまたがる自然発生的なデータだ

✗ よくある誤解

ベンフォードの法則に合わなければ不正の証拠になる

✓ 実際は

逸脱は「精査すべき」という旗にすぎない。法則からの逸脱だけでは不正の証明にはならない

✗ よくある誤解

ベンフォードが最初の発見者だ

✓ 実際は

57年前にニューカムが同じ法則を発表していた。ベンフォードが大規模データで検証したため彼の名がついた


体験する

あなたの直感を試す。数字の先頭桁を数えてみよう。

これからいくつかの「数字の集まり」を見せる。それぞれの先頭桁(最初の数字)を抜き出して、1から9がそれぞれ何回出てくるかを数えてほしい。すべて実在のデータだ。先頭桁がどう分布するか、予想してから結果を見てほしい。均等に散らばると思うか、それとも偏ると思うか。

✦ First-Digit Counter

世界の国の面積(km²)から先頭桁を数えよう

以下は実在の国の面積データです。「集計する」を押すと、先頭桁の分布がベンフォードの法則とどれほど一致するかが分かります。

データの種類を変えても、同じパターンが浮かび上がることに気づいただろうか。先頭が1の数字は約30%、9は5%前後。これがベンフォードの法則の核心だ。感覚として体験することに意味がある。「知っている」のと「目で見た」のとでは、納得の深さが違う。


なぜか

対数のものさしで世界を見る

なぜ先頭桁が偏るのか。その鍵は対数(ログ)にある。まず「対数とは何か」を確認しておこう。10を何回掛けたら目的の数になるか、その「回数」を表すのが対数だ。10を2回掛ければ100なので、log₁₀(100)=2。10を3回掛ければ1000なので、log₁₀(1000)=3。つまり対数は「桁数を測るものさし」のようなものだ。100と1000はたった1違いだが、桁がひとつ違う。

ふつうのものさし vs 対数のものさし ふつう 1 2 3 4 9 10 1→2も8→9も、幅は同じ 対数 1 2 3 9 10 1→2 の幅が最大(30.1%) 9→10

私たちが普段使う「ものさし」は等間隔だ。1から2も、8から9も、同じ幅。だが自然界の多くの現象は掛け算で動く。人口は「毎年1000人増える」のではなく「毎年3%増える」。株価は「毎日100円上がる」のではなく「毎日0.5%動く」。掛け算の世界では、対数が自然なものさしになる。そして対数のものさしでは、1から2までの幅が9から10までの幅よりずっと広い。

これがすべての答えだ。対数のものさしの上でランダムに点を打つと、1から2の区間に落ちる確率は約30%。9から10の区間に落ちる確率は約5%。数式で書くと P(d) = log₁₀(1 + 1/d)ベンフォードの公式
先頭桁がdである確率を求める式。dに1を入れると log₁₀(2)≈0.301 で約30%、dに9を入れると log₁₀(10/9)≈0.046 で約5%。log₁₀ は「10を何乗したらその数になるか」を表す。
となる。先頭桁が1になる確率は、9になる確率の6倍以上ある。

もう少し日常的に考えてみよう。銀行口座に100万円があるとする。年利5%で運用すると、100万から200万になるまでに約14年かかる。だが200万から300万になるまでは約8年だ。同じ「100万円の増加」なのに、時間が違う。先頭桁が1である期間は、先頭桁が2である期間より長い。指数関数的指数関数的成長(exponential growth)
一定の「割合」で増え続ける成長のこと。たとえば毎年2倍になるなら、1→2→4→8→16…と加速的に増えていく。人口増加、感染症の拡大、複利の利息などが典型例。
に成長するものは、どの桁帯を通過する「滞在時間」も対数に比例する。

ベンフォードの法則が成り立つ3つの条件

1
データが複数桁にまたがる
桁数のレンジが広いほど法則に近づく

川の面積は数km²から数百万km²まで広がる。人口は数百人から数十億人まで。このように複数の(order of magnitude)にまたがるデータは、対数スケール上で均等に広がりやすく、ベンフォードの法則に合致する。逆に、成人男性の身長(150cm〜200cm)のように狭い範囲に集中するデータは従わない。

2
人為的な上限・下限がない
「決められた数字」は法則に従わない

電話番号、郵便番号、IQスコアなど、あらかじめ範囲が決まっている数値は法則に合わない。時給や金利のように「最低○○、最高○○」と設定されたデータも同様だ。自然に発生し、自由に広がった数値だけが対数的な分布を持つ。

3
単位を変えても法則が保たれる
スケール不変性という美しい性質

川の面積をkm²で測ってもマイル²で測っても、先頭桁の分布は変わらない。スケール不変性と呼ばれるこの性質は、ベンフォードの法則の数学的な根幹をなしている。1995年に数学者テッド・ヒルは、異なるデータ集団からランダムにサンプルを混ぜると、その先頭桁の分布がベンフォードの法則に収束することを証明した。つまりこの法則は、「混合されたデータの自然な帰結」なのだ。


応用

数字の嘘は、先頭桁に現れる

ベンフォードの法則が現代で最も注目される理由は、不正検出への応用だ。1990年代、会計学者マーク・ニグリニMark Nigrini
南アフリカ出身の会計学者。ウェストバージニア大学准教授。1999年にベンフォードの法則を監査ツールとして会計の世界に紹介した先駆者。
が初めてこの法則を会計監査の道具として提案した。着想はシンプルだ。自然に生まれたデータは法則に従う。人間が捏造したデータは従わない。なぜなら、人間は「ランダムな数字」を作ろうとすると、先頭桁を均等に散らばらせてしまうからだ。5、6、7で始まる数字を不自然に多く使い、1を過少にする。この癖が、法則との乖離として浮かび上がる。

ベンフォードの法則による不正検出フロー 財務データ 先頭桁を抽出 法則と比較 予測分布と照合 逸脱を検出 統計的検定 精査対象 監査へ

アメリカの連邦裁判所では、ベンフォードの法則に基づく分析が証拠として認められている。エンロンEnron
アメリカのエネルギー企業。2001年に大規模な会計不正が発覚し破綻。史上最大級の企業スキャンダルとなった。監査法人アーサー・アンダーセンも連鎖的に解散した。
の会計スキャンダルでも、事後分析において収益報告の先頭桁の異常が指摘された。ギリシャがEUに報告したマクロ経済データが法則から大きく逸脱していたことも、研究で報告されている。

歴史

対数表の汚れから、不正検出へ

主要な出来事 関連する出来事

1881

ニューカムの観察

天文学者サイモン・ニューカムが対数表の汚れに気づき、先頭桁の分布法則を2ページの論文で発表。公式 P(d)=log₁₀(1+1/d) を導出したが、学会の関心は得られなかった。

1938

ベンフォードの「異常な数の法則」

GEの物理学者フランク・ベンフォードが、20分野・20,229件のデータで法則を検証。ニューカムの存在を知らなかった。川の面積、人口、分子量、Reader's Digestの数字など多様なデータを網羅。

1961

ピンカムの不変性定理

数学者ロジャー・ピンカムが、スケール不変な分布はベンフォードの法則に従うことを証明。法則に数学的基盤を与えた。

1995

テッド・ヒルのランダムサンプル定理

異なる分布からランダムにサンプルを混合すると先頭桁がベンフォードの法則に収束することを証明。「なぜ自然データが法則に従うのか」への数学的解答。

1999

ニグリニの監査への応用

会計学者マーク・ニグリニが『Journal of Accountancy』でベンフォードの法則を監査ツールとして提案。不正検出の実務への導入の転機。

2001

エンロン事件

史上最大級の会計スキャンダル。事後分析でエンロンの財務データにベンフォードの法則からの逸脱が指摘され、法則の有用性が広く認知された。

2011

ギリシャの経済データ問題

ギリシャがEUに報告したマクロ経済データの先頭桁分布が法則から大きく逸脱していたことが研究で報告された。

2020

SNSボット検出への応用

メリーランド大学のジェニファー・ゴルベックがSNSアカウントのフォロワー数にベンフォードの法則を適用し、ロシアのボットネットワークを検出。Netflixの『Connected』で取り上げられた。


つまり

数字は、生まれた瞬間から対数に従っている

ベンフォードの法則が語っているのは、数字についての法則というよりも、世界のスケールについての法則だ。自然界の多くの量は加法的(足し算)ではなく乗法的(掛け算)に変化する。掛け算の世界では、対数が自然なものさしになる。そして対数のものさしで数字を並べると、小さい先頭桁が広い場所を占める。

先頭桁が1になる確率が30%。
これは偶然ではなく、掛け算の世界が生む必然だ。

— ベンフォードの法則の本質

面白いのは、この法則が「不正の検出」に使えるという事実だ。自然に生まれた数字は法則に従う。人間が頭のなかで「もっともらしい数字」を捏造すると、無意識に先頭桁を均等に散らばらせてしまう。5や7や8を使いすぎ、1を少なくする。この「対数感覚の欠如」が、データの中に痕跡として残る。

ただし、忘れてはならないことがある。ベンフォードの法則は万能ではない。すべてのデータに当てはまるわけではないし、法則からの逸脱が即座に不正を意味するわけでもない。法則は「ここを調べてみろ」と指差す道具であり、答えそのものではない。ニューカムが対数表の汚れに気づいてから140年以上、この素朴な観察は、不正会計からSNSのボット検出まで、意外な場所で力を発揮し続けている。

作品への登場

映画『ザ・コンサルタント』(2016年、ベン・アフレック主演)では、主人公がベンフォードの法則を使ってロボティクス企業の資金横領を暴く。Netflixのドキュメンタリー『Connected: The Hidden Science of Everything』(2020年)のエピソード「Digits」では、法則が火山のサイズから選挙の不正検出、SNSのボット発見まで幅広く取り上げられた。

📊

イラスト①|対数表を前にした天文学者ニューカム

19世紀の書斎で、分厚い対数表の前半ページの汚れに首をかしげるニューカムの姿。後半ページはきれいなまま。

鳥獣戯画タッチ画像プロンプト

Chojugiga-style ink wash illustration, monochrome sepia, an anthropomorphic frog scholar in 19th century study examining a large open book of logarithm tables, the early pages visibly worn and darkened while later pages remain clean, the frog tilts its head curiously, Japanese scroll painting aesthetic, no text

イメージ図(画像生成AI使用予定)

🔍

イラスト②|数字のパレードと対数のものさし

1から9までの数字が行進している。先頭の1が大きく堂々と歩き、後ろに行くほど小さくなる。対数スケールの不均等な目盛りの上を歩いている構図。

鳥獣戯画タッチ画像プロンプト

Chojugiga-style ink wash illustration, monochrome sepia, a parade of anthropomorphic digits 1 through 9 as frogs and rabbits marching on a logarithmic ruler, digit 1 is the tallest and most confident, each subsequent digit progressively smaller, Japanese scroll painting aesthetic, no text

イメージ図(画像生成AI使用予定)

参考文献
論文1881

Note on the Frequency of Use of the Different Digits in Natural Numbers

Simon Newcomb

先頭桁の偏りを最初に記録した2ページの短い論文。American Journal of Mathematics掲載。

論文1938

The Law of Anomalous Numbers

Frank Benford

20分野・20,229件のデータで法則を検証。Proceedings of the American Philosophical Society掲載。

論文1995

A Statistical Derivation of the Significant-Digit Law

Theodore P. Hill

ランダムサンプル混合がベンフォードの法則に収束することの数学的証明。

書籍2012

Benford's Law: Applications for Forensic Accounting, Auditing, and Fraud Detection

Mark J. Nigrini

法則の会計監査・不正検出への応用を体系的にまとめた実務書。

記事2025

What Is Benford's Law? Why This Unexpected Pattern of Numbers Is Everywhere

Scientific American

法則の概説と近年の応用事例をまとめた一般向け解説記事。

📌 この記事について
ベンフォードの法則は1881年のニューカムと1938年のベンフォードの原著論文に遡る、140年以上の歴史を持つ統計的観察だ。法則の数学的基盤は1995年のヒルの定理で示されている。不正検出への応用はニグリニの研究と実務に基づく。数値(30.1%、17.6%等)は公式から導出した理論値であり、広く引用されている。
数学統計学対数不正検出ベンフォードの法則フォレンジック会計

読後の対話

after.sh — 読後の対話ログ(架空)
// ベンフォードの法則 を読み終えた人との対話
reader@curious:~$ 家計簿の先頭桁、ほんとに偏ってるのかな
試してみるといい。レシートを30枚くらい集めて、金額の先頭桁を数えるだけ。1が最多になるはずだ。ならなかったら、それはそれで面白い——なぜ従わないかを考える余地がある。
reader@curious:~$ 不正検出に使えるって、万能なの?
万能ではない。法則は「ここを見ろ」と旗を立てるだけだ。旗が立った場所を調べるのは人間の仕事。道具としてはそういう位置づけ。
reader@curious:~$ 結局なんで1が多いの、一言で言うと
世界は足し算じゃなくて掛け算で動いているから。掛け算の世界では対数が自然なものさしで、そのものさしでは1が占める幅がいちばん広い。
reader@curious:~$ ニューカムがちょっとかわいそう
57年早すぎた。でもスティグラーの法則によれば、発見者の名前が残らないこと自体が法則だ。ニューカム自身がそれを聞いたら、きっと苦笑いするだろうね。
reader@curious:~$ exit # へえ、数字も平等じゃないのか