県道道メモ(2003年11月17日)

ベンフォードの法則は面白い

今日の新聞を読んでいたら、少し面白い記事が載っていました。

大学入試センター試験は、いわゆるマークシートで解答する方式です。その中で数学の問題は、答えの数字の部分が空欄になっていて、正解の数字をマークして解答するようになっています。で、ある大学教授が今までの問題の正解を調べてみると、正解には最上位の数字(2ケタの数字なら十の位、3ケタの数字なら百の位、など)が「1」になっている割合が非常に多い、という統計結果が出たそうです。

つまりセンター試験の数学を受ける人は、わからない問題があったら当てずっぽうで最上位のケタを1にしておけば、正解する確率が高くなるということになります。でもこれを実行して不合格になっても責任は持てないのであしからず。

実は一般的に、企業会計や人口、住所の番地などの数値の統計を取ると、最上位の数字が1になる割合が最も高くて全体の3割程度を占め、2から9へと行くほど出現率が減っていくのだそうです。この傾向は1930年代にアメリカの物理学者が発見し、「ベンフォードの法則」と名付けられているそうです。

「ベンフォードの法則」というのは初めて知りました。昔流行したマーフィーの法則みたいで面白そうなので私も実験してみました。本サイトの茨城県道てんこもり一覧表の「路線別延長」のページのデータ(原資料は茨城県が今年発行した道路現況調書)を使い、茨城県道の全路線の総延長・重用延長・未供用延長・実延長・交通不能区間延長(単位はいずれもメートル)の各データの数値から、値が0であるものを除いた840個の項目をその最上位の数字ごとに分類し、項目数の割合を調べました。ちなみに茨城県道は現在325路線あり、総延長でみると最長のもので67965メートル(県道2号水戸鉾田佐原線゠最上位の数字は6)から、最短で30メートル(県道309号福原停車場線゠最上位の数字は3)まで、多彩なデータが分布しています。結果は次の表のようになりました。

茨城県道の延長データを最上位の数字別に分類した表
最上位の数字項目数割合
124329.0%
214417.1%
39511.3%
4769.1%
5718.5%
6586.9%
7657.7%
8394.6%
9495.8%
840100.0%

結果を見てびっくり。最上位の数字が1である項目が全体の約30%を占め、見事にベンフォードの法則が成り立っています。これは面白い。不思議な法則が世の中にはあるんだなあと思いました。