Страницы

Путеводитель для влюбленных в математику. Закон Бедфорда. Отрывок из книги Эдварда Шейнермана

Принято считать, что математика — наука точная и совершенно скучная, но Эдвард Шейнерман в своей книге «Путеводитель для влюбленных в математику», берется доказать обратное. Он утверждает, что математика бывает не менее увлекательной, чем гуманитарные дисциплины. Как объяснить тот факт, что бо́льшая часть окружающих нас чисел начинается на единицу, а тех, что начинаются на девятку, совсем мало? Каков наилучший путь выиграть выборы, если победителями становятся больше двух кандидатов?
Для нас очевидно, что все цифры сотворены равными. Нет, мы не имеем в виду «равными друг другу» — разумеется, нет! Но внутри нас теплится вера в то, что все десять цифр, от 0 до 9, играют одинаковые роли в мире чисел.

Печальная правда заключается в том, что числа могут быть такими же нескромными, как люди: они все стремятся к первенству. Представьте, что вам приглянулась вещь стоимостью 43,52 доллара. Какая из цифр кажется вам более значимой? Важнее всего для вас цифра четыре, а двойка на конце не играет почти никакой роли. Вы встревожитесь, если четверка вдруг изменится на девятку, а если изменится двойка, вряд ли вас это сильно взволнует.

Тот, кто ждет от Вселенной справедливости, должен верить, что у всех цифр одинаковые шансы сыграть значимую роль, — но бедный, бедный нолик! Он не становится первой значащей цифрой, честь выпала на долю других (скажем, в числе 0,053 первая значащая цифра 5. Когда мы говорим о первой значащей цифре, то подразумеваем первую цифру, отличную от нуля). Все они стремятся быть значительней остальных настолько часто, насколько это возможно.

Мы верим, что цифры от 1 до 9 участвуют в математике на равных правах и каждая начинает одну девятую часть всех существующих чисел (примерно 11%). Разумеется, не может быть большего количества чисел, начинающихся с двойки, чем с пятерки. Ведь так?

Дикорастущие величины

Утверждение о том, что все цифры от 1 до 9 равно представлены в качестве первой значащей цифры, приобретает смысл, если иметь в виду определенный диапазон чисел: скажем, от 1 до 999 999. В этом случае все цифры от 1 до 9 одинаково часто занимают место первой значащей цифры.

Разумеется, на результат влияет, какой именно диапазон мы выбрали. Если мы посмотрим на другой ряд чисел, скажем от 1 до 19, то обнаружим, что здесь все цифры от 2 до 9 занимают первую позицию всего единожды, в то время как 1 становится первой значащей цифрой в 11 случаях.

Ради беспристрастности давайте возьмем какие-нибудь величины из внешнего мира. Мы должны быть аккуратными и не искать числа, сконцентрированные в узком диапазоне. Поэтому мы не станем брать такой параметр, как рост взрослого человека (если измерять рост в футах, почти все результаты будут начинаться с цифр 4, 5 или 6, — прим. Э.Ш), ведь практически все результаты измерений будут начинаться с 1 или 2 (ничтожно малое количество людей имеет рост выше 299 или ниже 100 сантиметров).

Ради уверенности в том, что все цифры имеют одинаковые шансы стать первой значащей цифрой числа, мы будем вести измерения в широком диапазоне. Например, давайте зададимся вопросом, насколько велико население разных стран (я черпаю данные из «Справочника ЦРУ по странам мира»). Это значение будет колебаться от миллиарда с лишним (Китай и Индия) до менее чем десяти тысяч (в случае с карликовым государством на коралловом острове Науру).
Согласно актуальной версии справочника ЦРУ, в Китайской Народной Республике 1 379 302 771 граждан, в Республике Индия 1 281 935 911, в Республике Науру 9642 (все данные проверены в июле 2017). Наименьшее в мире количество граждан у Ватикана: 1000 человек (проверено в 2017 году).
Вдобавок к численности населения давайте выясним следующие параметры для сотен государств:
  • ― валовой внутренний продукт (в долларах США);
  • ― количество аэропортов;
  • ― площадь (в квадратных километрах);
  • ― ежегодную выработку электроэнергии (в киловатт-часах);
  • ― ежегодное потребление продуктов нефтепереработки (в баррелях);
  • ― общую длину всех железных дорог (в километрах);
  • ― количество телефонов.
Таким образом, мы соберем около 2000 параметров и затем подсчитаем, сколько чисел начинается с цифры 1, сколько — с цифры 2 и т. д. Вот что у нас получится:


Невероятно: чаще всего на первой позиции встречается цифра 1 (примерно в 30% случаев) и реже всего — цифра 9 (меньше 5% случаев)!

Мы призываем читателей повторить эксперимент самостоятельно: взять статистический справочник, выписать первые цифры длин рек, высот гор, курсов акций, среднего роста различных видов животных, количества слов в романах, производства риса в разных странах и так далее.
Фрэнк Бенфорд (1883–1948) — американский инженер и физик, бо́льшую часть жизни работал в General Electric. Саймон Ньюком (1835–1909) — американский астроном, математик и экономист. Работал в Морской академии в Вашингтоне и Военно-морской обсерватории США. Двоюродный прапрадед физика Уильяма Ньюкома.
Закон Бенфорда утверждает нечто большее, чем «единица на первой значащей позиции встречается чаще всего, а девятка — реже всего». Закон Бенфорда констатирует (при наличии большого количества данных) следующую частотность (мы приводим округленные значения. На самом деле ожидаемая частотность для 1 составляет 30,102999566398114…%. Скоро мы растолкуем, откуда берется это значение, — прим. Э.Ш.):


Таблицы умножения

Есть и другая область, где обнаруживается неравномерное распределение первых значащих цифр, — это знакомая всем таблица умножения (обычно таблица умножения включает 10 строк и 10 столбцов, но умножение на 10 в нашем случае ничем не отличается от умножения на 1, поэтому один столбец мы выпускаем, — прим. Э.Ш.):


Среди 81 числа в этой таблице 18 начинаются на 1, а именно:


При этом всего 3 числа начинаются на  9: 1 × 9 = 9; 3 × 3 = 9; 9 × 1 = 9.

Вот процентное соотношение первых значащих цифр в обычной таблице умножения.


Мы видим, что цифры поменьше встречаются чаще, чем цифры побольше, но частотность здесь не совсем такая, какую предсказывает закон Бенфорда.

Таблица умножения дает нам все возможные результаты умножения одного однозначного числа на другое от 1 × 1 до 9 × 9. Давайте расширим этот принцип и переберем все варианты умножения трех однозначных чисел. Проделаем следующие вычисления (можно наглядно увидеть трехмерную таблицу умножения на примере кубика Рубика, — прим. Э.Ш.). Некоторые варианты (например, 4 × 7 × 3 = 84) будут скрыты внутри кубика:

1 × 1 × 1, 1 × 1 × 2, …, 9 × 9 × 8, 9 × 9 × 9

В общей сложности это дает 93 = 729 троек. Посмотрим, как часто встречаются разные цифры в первой позиции:

Нет резона останавливаться на перемножении трех чисел. Мы можем составить четырехмерные, пятимерные, шестимерные таблицы умножения и т. д. Давайте сразу посмотрим, что получится с десятимерной таблицей умножения (в десятимерной таблице умножения 910 произведений, то есть чуть меньше 3,5 миллиарда чисел. Она содержит все возможные комбинации произведений десяти чисел от 1 до 9, — прим. Э.Ш.). Другими словами, мы проделываем следующие вычисления:



Занесем в таблицу, как много чисел начинается с 1, 2 и т. д:


Мы увидим, что частотность первых цифр в этом случае уже хорошо согласуется с законом Бенфорда.

Поимка жулика

Перед тем как вникнуть в детали закона Бенфорда, давайте обратим внимание на одно его практическое применение.

Предположим, некий нечистый на руку человек подделывает налоговые декларации (меняет суммы, фабрикует баланс и т. д). Короче говоря, он лжет и выдумывает числа, не имеющие отношения к реальности. Начальные цифры он выбирает случайным образом.

Судебный эксперт может быстро проверить, совпадает ли распределение первых цифр с законом Бенфорда. Если не совпадает, возникают подозрения, что числа подделаны. Но это еще не строгое доказательство вины.







Шейнерман Эдвард / Scheinerman Edward R.,
Профессор прикладной математики и статистики 
в Университете Джонса Хопкинса