Олег Фея

Математика проти шахраїв

23 Лютого 2020
У 2014 році я любив давати своїм знайомим прихильникам Путіна, які мали хорошу технічну освіту, нескладну математичну задачу і дивитися, як їхні погляди вступають у суперечність із сухими цифрами.

Задача полягає ось у чому. Росія проводить «референдум». Неважливо де — у Криму, Донецьку чи Луганську. За день колаборанти «рахують» результати й оголошують відсотки. Наприклад, загальна кількість зареєстрованих у Севастополі — 306 258 осіб. Дані я взяв із відео, де голова виборчкому Севастополя підбиває підсумок «референдуму», є вони й у Вікіпедії. Вперше побачив такі розрахунки в американського фахівця з електоральної статистики Алєксандра Кірєєва. Отже, озвучена РФ явка — 89,5%, або 274 101 особа. Ось тут беріть до рук калькулятор і перевіряйте зі мною. 274 101 поділити на 306 258 — це 89,500%. Вражаюча точність. Ідемо далі. За «воссоединения Крыма с Россией», за даними окупантів, проголосувало 95,6%, або 262 041 особа. Ділимо 262 041 на явку 274 101, виходить 95,600%. Знову бінго! І так із рештою цифр: голосами проти, кількістю недійсних бюлетенів. А тепер що це значить і чому явно свідчить про те, що дані просто вигадані. Не якось там підкручені, а вигадані.


Одна десята відсотка, 0,1%, у цій задачі відповідає 306 зареєстрованим виборцям. Найчастіше загальні результати подають як округлені числа. Це нормально, інакше сприймати їх досить важко. Тобто явка 89,5% може бути округлена як із 89,45%, так і з 89,54%. Крок округлення — та сама одна десята, 300 осіб. Те, що виражена в кількості громадян явка точно дорівнює 89,50%, досить рідкісне явище. За наявних чисел це ймовірність 1 до 300. Та нехай, скажете ви, може, збіг? Можливо. Але дані щодо тих, голосів за — така сама ймовірність. Обидва результати одночасно вже виникнуть в одному на приблизно 90 тис. випадків. Малоймовірно, чи не так? А ще є ті, хто голосує проти. Збіг усіх трьох чисел із такою точністю — один на 27 млн випадків. Я не вірю в такі збіги, інакше відніс би свої доходи в «Космолот», поставив би на такі результати «референдуму» й на кожну гривню виграв би мільйон євро.

 

Читайте також: Бекешкіна: Просування ідеї референдумів або консультативних опитувань є небезпечним


Якщо сюди додати інші незаконні голосування з подібною картиною, то ймовірність збігу всіх чисел — один на трильйони трильйонів трильйонів. Трактувати такі дані інакше, ніж те, що за заздалегідь відомими відсотками вираховували кількість виборців, я не можу. Так от мої знайомі нічого не могли вдіяти з математикою — для них вона була переконливою. І тут починалося… «Секретарка внесла неправильні числа» — ох вже ця невідома секретарка. «Ми не бачимо всієї картини, напевне, вона дещо інакша, ніж оголошені результати». А один чесно сказав, що вірить у такий збіг більше, ніж у можливість шахрайства влади.

Математика дає змогу знайти шахрайство там, де його ретельно приховують. Одне число мало що здатне сказати, а ось масив чисел, відсотків, кількості виборців, фінансових показників, результатів екзаменів для людей, які легко вправляються з формулами та математичною логікою, як місце злочину для Шерлока Голмса


Математика дає змогу знайти шахрайство там, де його ретельно приховують. Одне число мало що здатне сказати, а ось масив чисел, відсотків, кількості виборців, фінансових показників, результатів екзаменів для людей, які легко вправляються з формулами та математичною логікою, як місце злочину для Шерлока Голмса. Вони побачать зв’язок там, де він вислизне від не обізнаної в математиці людини.


Фальсифікації на виборах легко виявляються на статистичних даних. Для партії, яка, скажімо, набрала 30% голосів, на більшості дільниць результати будуть у межах 25–35%. За чесного голосування результати з кожної дільниці описуються гаусівською кривою, або ж нормальним розподілом. Вона як пітон, який проковтнув слона на малюнку Екзюпері, — випукла посередині й сходить нанівець по краях. Коли партія використовує адмінресурс, купує членів виборчкомів, щоб ті написали більші результати, крива розпадається — матиме гострі піки там, де статистика того не передбачає. Це перший дзвіночок: а що ж відбувалося на тих дільницях? Можливо, це місто, де членом партії є улюблений усіма мер, а можливо, фальсифікація.


100 років тому американський фізик Френк Бенфорд, аналізуючи великі масиви даних, пов’язаних із людською діяльністю, встановив емпіричний закон. Цифри в числах трапляються нерівномірно: приблизно третина починається з одиниці, одна п’ята — з двійки. Для інших цифр імовірність менша. Оскільки закон емпіричний, тобто виведений зі спостережень, а потім описаний формулою, він має чимало обмежень. Проте у своїй зоні відповідальності допомагає виявляти шахрайство з фінансовими показниками. Якщо у звіті компанії комбінація перших двох цифр у сумах платежів або доходів істотно перевищує передбачення закону Бенфорда, нею зацікавиться фінансова служба США.

 

Читайте також: Напад гострого плебісциту


Інший приклад, ближчий до нас, — історія з електронним переписом Дмитра Дубілета, підлеглі якого помножили дані Держстату на однаковий коефіцієнт 0,888 і отримали «поточну чисельність населення України». З розмитих відповідей самого Дубілета незрозуміло, чи він використав якісь прогресивні методи оцінки, чи все ж таки це звичайнісінький непрофесіоналізм, як його й сприйняли соціологи та математики.


Найнебезпечніші супротивники Голмса, як-от Джеймс Моріарті, уявляли хід його думок, щоб надурити сталеву логіку видатного детектива. Якщо ви хочете шахраювати в сучасному світі, то без глибокого знання математики не обійтися. Адже саме її і використають, щоб вас спіймати на гарячому.