Диссертация (1147112), страница 25
Текст из файла (страница 25)
50). Приэтом равновероятное распределение не только начинает соответствовать наблюдающимся частотам, но и описывать большее количество случаев, чем закон Бенфорда. Тест на соответствиеравновероятному распределению прошли 17 случаев (таблица 15), распределению по законуБенфорда (для получения итоговой ожидаемой вероятности используется методика ЛееманнаБохслера) — 10 (таблица 16), и распределению по закону Бенфорда с поправкой Перикки-Торреса — 3 случая (таблица 17).113Рисунок 50: Частота появления различных цифр в последнем разряде чисел и эталонныераспределения.Таблица 15: Случаи, прошедшие тест по последней цифре — равновероятное распределение(df=10).СтранаГодТур GВероятность H0Болгария 2011 215,682 0,074Литва1997 26,6730,671Литва2002 25,9020,750Литва2004 112,627 0,180Литва2004 26,4210,697Литва2014 27,5370,581Польша2005 28,3450,500Польша2010 213,952 0,124Польша2015 24,6770,861Румыния 1992 213,439 0,144Румыния 1996 212,712 0,176Румыния 2000 210,170 0,337Румыния 2004 24,3620,886Румыния 2014 25,3400,804Словакия 2014 212,651 0,179Украина5,6902010 20,770114СтранаГодТур GЧехия2013 2Вероятность H013,009 0,162Таблица 16: Случаи, прошедшие тест по последней цифре — закон Бенфорда (df=10).СтранаГодТур GВероятность H0Болгария 2011 213,451 0,143Латвия200213,307 0,149Латвия201412,224 0,201Литва1997 216,642 0,055Литва2002 216,287 0,061Литва2004 115,330 0,082Литва2004 26,0360,736Литва2014 27,4500,590Чехия2013 28,7360,462Эстония 201513,811 0,129Таблица 17: Случаи, прошедшие тест по последней цифре — закон Бенфорда с поправкойПерикки-Торреса (df=10).Страна ГодТур GВероятность H0Литва19972 14,410 0,106Литва20042 12,834 0,170Литва20142 16,477 0,058Три случая из Литвы (1997, 2004 и 2014 гг, вторые туры президентских выборов) прошливсе три теста.
Чехия (2013 г., второй тур) и Болгария (2011 г., второй тур) прошли тесты на равномерное распределение и бенфордовское распределение. Интересно заметить, что все случаи,прошедшие тест на равновероятное распределение — вторые (за единственным исключениемпервого тура в Литве в 2004 г.) туры президентских выборов. Как мы видели на сегментированном треугольнике Нагаямы, в большинстве случаев в исследуемых странах президентские выборы во втором туре проходят в обстановке напряжённого соперничества двух примерно равных по силе кандидатов. Это подталкивает к мысли о том, что помимо размера УИК и числакандидатов на распределение влияет и уровень фрагментации на электоральном уровне, что никак не учитывается в рамках известных опытов бенфордианского анализа.Для окончательной оценки поправки Перикки-Торреса, следует обратиться к подмножеству из 59 случаев, для которых удалось вычислить все ожидаемые распределения.
На этом ма-115териале можно оценить, имеет ли смысл подобного рода корректировка. Результаты по указанному подмножеству случаев представлены в таблице 18. Из этих данных следует, что поправкаПерикки-Торреса оказалась малоэффективной в любой формулировке.Таблица 18: Количество полностью сравнимых случаев, прошедших тесты на сравнение сожидаемыми пропорциями.РаспределениеПервая цифра Вторая цифра Последняя цифраРавновероятное0011Бенфорд2138Бенфорд + П.-Т. (по максимуму)063Бенфорд + П.-Т. (по кластерам)010Бенфорд + П.-Т. (точно)031Помимо анализа отдельных разрядов, существует также метод, в рамках которого анализируется частота появления парных цифр в двух младших разрядах чисел, предложенный Б.
Бебером и А. Скакко. В отличие от бенфордианского анализа, этот метод опирается на данные психологических исследований о восприятии случайных чисел человеком. Подобные исследованияпоказали, что ряд характеристик чисел воспринимается людьми как признак «неслучайности».Среди таких черт выделяются повторяющиеся цифры (пары, триплеты). С точки зрения человека, такое событие носит «неслучайный» характер, и если человек будет пытаться построить рядслучайных чисел, то будет избегать подобных повторений (применительно к методу БебераСкакко — в конце числа) — хотя в общем массиве натуральных чисел такие повторения встречаются в одной десятой части случаев.В своём исследовании Б.
Бебер и А. Скакко предложили считать образцовым распределением равновероятное. Соответственно, в полученных естественным путём данных о результатахголосования парные цифры должны встречаться в одной десятой случаев (где это применимо,т. е. одноразрядные числа не рассматриваются); если же в получение этих чисел вмешивался человек (числа подделывались или подгонялись, с установкой на сохранение видимости случайности), то пар будет существенно меньше.
Поскольку гипотеза о равновероятном распределениина данном этапе представляется сомнительной, в рамках настоящего исследования были получены ожидаемые вероятности для парных цифр, исходя из всех вышеперечисленных распределений (за исключением закона Стиглера). Наблюдаемая частота парных цифр в конце чиселпредставлена на рис. 51. Средняя частота (0,106) несколько выше ожидаемой в методе БебераСкакко от равновероятного распределения, к тому же налицо существенный разброс значений116(от 0,093 до 0,118).Рисунок 51: Частота появления парных цифр в двух последних разрядах чисел, по всем случаям.Наблюдаемые частоты сравнивались с пятью вариантами ожидаемого распределения:равновероятным, и четырьмя вариантами вероятности по методу Лееманна-Бохслера: для законаБенфорда, для закона Бенфорда с поправкой Перрики-Торреса по максимальной списочной численности, максимальной по кластерам и точной для всех УИК. В результате тест на совпадениес ожидаемой пропорцией (в рамках 59 случаев, где известны все значения) был на 5% уровнепройден 26 случаями для равновероятного распределения, 8 случаями для закона Бенфорда, 33случаями для поправки Перикки-Торреса по максимальному значению, и 9 случаями для поправки Перикки-Торреса по кластерам и по каждому УИК в отдельности.
Для всех 98 случаевтест был пройден для равновероятного распределения в 37, для закона Бенфорда в 11 и для закона Бенфорда с поправкой Перикки-Торреса по максимуму в 47 случаях соответственно. Подробно результаты по случаям с полным покрытием представлены в таблице 19.Таблица 19: Результаты тестов на совпадение пропорций парных цифр по 59 полностьюсравнимым случаям.СлучайСтранаГодТурАрмения2007Армения2008 1Равно-По законувероятноеБенфордаGH0GH010,773 0,001516,890 0,0000,003 0,95675,966 0,000Бенфорд с поправкой Перикки-ТорресаПоПомаксимумукластерамGH0GH0ТочноGH01,428 0,232 1695,280 0,000 1778,067 0,0000,679 0,410336,492 0,000351,664 0,000117СлучайАрмения2012АрменияРавно-По законувероятноеБенфордаБенфорд с поправкой Перикки-ТорресаПоПомаксимумукластерамТочно1,568 0,210220,974 0,0002,765 0,096484,689 0,000440,635 0,0002013 111,609 0,0013,059 0,0800,657 0,418198,892 0,000228,740 0,000Болгария 2006 20,804 0,370218,632 0,000 33,251 0,00054,848 0,00013,494 0,000Болгария 2011 24,452 0,0350,002 0,9640,070 0,7920,827 0,3632,464 0,116Болгария 2013185,390 0,000 4612,420 0,0000,258 0,611 2507,116 0,000 1804,121 0,000Болгария 201461,462 0,000 1367,269 0,0002,664 0,103 5754,484 0,000 2495,234 0,000Венгрия20103,265 0,071 1115,117 0,000 22,085 0,000348,995 0,000174,703 0,000Венгрия20141,088 0,297177,349 0,0006,179 0,013900,843 0,000689,529 0,000Грузия20127,413 0,00679,728 0,0003,412 0,065398,430 0,000353,436 0,000Грузия2013 12,887 0,089101,638 0,0002,205 0,138650,079 0,000750,804 0,000Литва1997 12,541 0,111160,178 0,0000,014 0,90542,209 0,000116,781 0,000Литва1997 20,212 0,6450,603 0,4370,318 0,5730,774 0,3790,452 0,501Литва20005,460 0,019834,256 0,0000,150 0,699306,125 0,000653,058 0,000Литва2002 18,579 0,003 1163,824 0,0002,199 0,138397,213 0,000783,242 0,000Литва2002 22,022 0,1556,230 0,0133,060 0,0802,914 0,0883,342 0,068Литва20042,730 0,09990,547 0,0001,577 0,209435,701 0,000599,995 0,000Литва2004 10,498 0,4815,279 0,0227,411 0,00643,585 0,00012,247 0,000Литва2004 20,046 0,8300,282 0,5950,259 0,6110,283 0,5950,415 0,519Литва200810,180 0,001304,438 0,0000,699 0,403 1157,032 0,000741,983 0,000Литва2009 14,216 0,040100,115 0,0000,089 0,766284,074 0,000205,567 0,000Литва20129,701 0,002203,995 0,0000,638 0,424617,373 0,000864,413 0,000Литва2014 10,122 0,72737,034 0,0001,248 0,26492,081 0,000145,217 0,000Литва2014 20,006 0,9370,034 0,8540,037 0,8471,513 0,2190,375 0,54013,870 0,000470,229 0,000Молдавия 20141,136 0,287 1170,490 0,000 1108,472 0,000Румыния 1992 13,460 0,063 1009,072 0,000 14,918 0,000Румыния 1992 20,092 0,7622,528 0,112Румыния 1996 20,028 0,866Румыния 2000 2Словакия 2014 2377,933 0,000565,294 0,0000,936 0,3331,685 0,1942,417 0,1200,273 0,6010,017 0,8960,329 0,5660,504 0,4780,047 0,8291,581 0,2090,421 0,5161,144 0,2851,946 0,1630,414 0,52077,865 0,0000,997 0,3180,254 0,6150,315 0,575Чехия2006Чехия2013 22,887 0,0897,838 0,0055,449 0,02016,207 0,00018,941 0,000Эстония19923,448 0,063196,553 0,0000,059 0,808101,207 0,000107,370 0,000Эстония19954,984 0,02659,674 0,0000,096 0,757101,734 0,000151,593 0,00027,239 0,000 3482,853 0,0001,328 0,249 2757,283 0,000 3039,605 0,000118СлучайРавно-По законувероятноеБенфордаБенфорд с поправкой Перикки-ТорресаПоПомаксимумукластерамТочноЭстония19992,224 0,13664,970 0,0000,095 0,75871,228 0,000105,354 0,000Эстония20030,969 0,32539,283 0,0005,859 0,015204,607 0,000132,008 0,000Эстония20070,496 0,48118,970 0,0000,634 0,42658,789 0,00085,751 0,000Эстония20111,187 0,27621,692 0,0000,001 0,97167,361 0,000102,074 0,000Эстония20150,007 0,9354,472 0,0340,200 0,65564,838 0,00091,464 0,000Оставшиеся случаи, которые не могут продемонстрировать все используемые методы,представлены в таблице 20.
Для случаев в Латвии вычисление поправки Перикки-Торреса невозможно в силу отсутствия данных о списочной численности избирателей.Таблица 20: Дополнительные случаи (без модификаций поправки Перикки-Торреса).СлучайСтранаГодРавновероятное По закону Бенфорда Бенфорд + П.-Т. (макс.)ТурGH0GH0GH0Латвия20022,448 0,11864,9050,000Латвия20110,593 0,44122,4120,000Латвия20140,844 0,35836,6290,000Польша20001 126,048 0,000479,5690,0002,9310,087Польша2005189,469 0,000329,2440,0000,1280,720Польша200520,595 0,44015,5100,0005,3540,021Польша201021,176 0,2781,9900,1580,0130,908Польша201522,052 0,1521,3160,2510,0360,849Румыния 200420,005 0,9446,3140,0120,6000,439Румыния 2009129,575 0,000516,5500,0001,3220,250Румыния 200920,543 0,46126,0980,0004,5100,03424,512 0,000318,0850,0000,1250,724Румыния 2012Румыния 2014165,910 0,000812,9460,0000,3890,533Румыния 201420,094 0,7593,3220,0681,0390,308Украина 20041 126,775 0,000494,6940,0000,1250,724Украина 200420,824 0,36412,7840,0000,0300,863Украина 200432,487 0,11514,7860,0000,3900,532Украина 2007121,102 0,000 1047,6250,0000,0800,777Украина 20141 243,780 0,000 1251,1510,0000,7310,393119Полученные результаты свидетельствуют о том, что применение закона Бенфорда едва лиявляется оправданным направлением для поиска аномальных результатов.
Если обратиться канализу частот для первых разрядов, то становится ясно, что совпадение с предсказанным законом Бенфорда распределением является событием аномальным, а существенное различие наблюдаемой и ожидаемой пропорции — обычным положением вещей. Если, следуя основномупринципу бенфордианского анализа, предполагать, что отклонение есть признак вмешательствав ход электорального процесса, то придётся признать подавляющее большинство выборов вВосточной Европе фальсифицированными.