Секей Г. Парадоксы в теории вероятностей и математической статистике (1990) (1151962), страница 42
Текст из файла (страница 42)
(имеется перевод: Эрдеш П., Спенсер Дкг, Вероятностные методы в комбинаторике. — Мл Наука, 1978.) Маслова Ы. Б. 70 распределении числа вещественных корней случайных полииомов", Теория вероитп. и ее примеи., т. Х!Х, вып. 3, 488 — 500, !974. Меща М. 1.. Яолиогл Могпгга, Асайетк Ргевв, Нем Уогй, 1987. 6. Парадокс математического ожидания а) История парадокса Одна известная теорема в теории вероятностей утверждает, что если Х н У вЂ” случайные величины с конечными математнческнмн ожиданиями, то математическое ожидание нх суммы существует н равно сумме нх математических ожиданий Е(Х+ У) =Е(Х) +Е(У).
Легко показать, что даже если математические ожидания Е(Х) н Е(У) не существуют, но существует Е(Х+ У), то Е(Х+ У) зависит только от распределений случайных величин Х н У, т. е, Е(Х+ У) можно полностью определять, не зная совместного распределения Х н У. Уднвнтельно, но для трех случайных величин это неверно. б) Парадокс .Если Х, У н Х вЂ” произвольные случайные величины, для которых Е(Х+ У+ 2) существует, то это математическое ожнданне не всегда определяется лишь индивидуальными распределен х, Унг.
е) Объяснение парадокса Определим случайные величины Х, У н 2 двумя различными способами. В обоих случаях нх распределения будут одннаковымн, но математнческне ожидания Е(Х + У + Я) различными. Пусть (7 — случайная величина, равномерно распределенная на интервале (О, 1). Тогда ясно, что 1 — () н У = (2() — 1) так же равномерно распределены на (О, 1). Если Х=У=(й( — 9П) н Я= — 2Х, то Х+ У+2=0, н поэтому Е(Х+ У+Я) =О.
С другой стороны, если Х=(й( — ",(7), У=(дЯ(1 — Ц) 2= — 21д( — 'У), то неравенство Х+ У+ Я ) 0 справедливо с вероятностью 1, следовательно, математическое ожидание Е(Х+ У+Я) также положительно, точнее Е (Х + У + Х) = — (и 2. 4 г) Замечания (!) Поскольку Е(Х+ У+ Х) = Е((Х+ У) + Х) н Е(Х+ У+ + л + (рг) = Е ( (Х+ У) + (с + (!г) ), математические ожидания сумм трех н четырех случайных величин однозначно определяются двумерными распределениями. Однако неизвестно, остается лн это справедливым, когда число слагаемых в сумме больше четырех.
(й) Ружа н Секей показали, что для каждой случайной величины Х можно так определить действительное число Е(Х), что это число равно математическому ожиданию этой случайной величины, если оно существует н конечно, прн этом для незавн снмых Х н У всегда справедливо равенство Е(Х + У) = Е(Х) + Е(У). Наш парадокс показывает, что такое обобщенное математнческое ожидание не существует у сумм случайных величин, которые не обязательно являются независимыми [для случайных величин, определенных в части е), величина Е(Х+ У+Я) равнялась бы нулю, так как Е(Х) =Е(У) н Е(Х) = — 2Е(Х)]. д) Литература йшаа 1. 2., за!хе!7 С.
Л. "Ап ех1епа!оп о1 ехрес!а!(оп", хеиасл' В'алгась' Шеоде оегес Оеь., 53, 17 — 20, (!980). злпопа С. "Ап опехрес!ей ехрес1а1шп", Аллее о! Ргоь., 5, 157 — !58, (1977). 7. Парадокс первой цифры а) История парадокса Приблизительно сто лет назад, в 188! г., Саймон Ньюкомб в «Амернканском математическом журнале» (Ап!ег. 3. Ма!)!.) обратил внимание читателей на один ннтерссный эмпирический факт. Однако вскоре это открытие было забыто н сделано вновь спустя 60 лет физиком Фрэнком Бенгрордом, работавшим в компаннн «Дженерал Электрик».
Закон получил нмя Бенфорда. (Ньюкомб — не единственный ученый, с которым обошлись несправедливо. Закон эпоннмнн саркастически утвсрждает, что нн одна теорема, нн одно научное открытие не были названы нме- нем первооткрывателя.) У. Уивер в «Леди Удача» изложил историю Бенфорда: «Мне рассказали, что приблизительно двадцать пять лет назад один инженер, работавший в компании «Дженерал Электрик», по дороге на службу нес книгу, содержавшую подробную таблицу логарифмов.
Он держал книгу сбоку корешком вниз. Взглянув на книгу, он заметил, что наиболее загрязнены края страниц в начале книги, затем они становится чище — как будто чаще всего смотрят первые страницы, реже— страницы в середине книги и совсем редко — последние страницы.
«Это странно,— подумал он.— Это означает, что людям чаще всего приходится искать логарифмы чисел, которые начинаются с 1, чуть реже — чисел, начинающихся с 2 и так далее и, наконец, реже всего — логарифмы чисел, начинающихся с 9. Но это совершенно невозможно, так как людям нужны значения логарифмов самых разных чисел, поэтому различные цифры должны быть представлены одинаково.» б) Парадокс Рассмотрим какую-нибудь таблицу, например таблицу целых степеней двойки или любую таблицу физических постоянных или таблицы демографической статистики.
Как правило, окажется, что первая цифра (чьО) чисел в таблице не будет равномерно распределена на множестве 1, 2, 3, ..., 9. Цифра 1 встречается чаще всего, затем идет 2 н так далее, 9 будет самой редкой цифрой. Согласно закону Бенфорда относительная частота первых цифр, не превосходящих А, равна не )г/9 (что означало бы равномерность распределения), а !д(А+ 1) (где !п означает !опм). Следовательно, относительные частоты для 1, 2, ..., 9 приблизительно равны 30%, 17%, ..., 5 7«. (Закон Бенфорда можно сформулировать иным образом, а именно, мантиссы логарифмов распределены почти равномерно на интервале (О, 1).) Закон Бенфорда не утверждает, что 1 — наиболее часто встречающаяся первая цифра во всех таблицах (каждый может придумать таблицу, в которой единиц вообще нс будет), но все-таки единица как первая цифра в таблицах появляется обычно чаще, чем, например, девятка.
е) Объяснение парадокса Существуют несколько вероятностных и невсроятностных подходов к объяснению закона Бенфорда. Сначала рассмотрим невероятностный подход. Проанализируем таблицу степеней двойки. Первой цифрой числа 2" является 1, если существует такое целое число з, что 1О* ( 2' ( 2 !О'. Если и (и, следовательно, з) достаточно велико, то з/и приблизительно равно 1а 2.
Это означает, что среди первых п степеней двойки каждая 1и2-я начинается с 1. Аналогично, по закону Бенфорда доля степеней двойки, которые начинаются с цифры, не превосходящей й, приблизительно равна 1д(й+ 1). Вероятностный подход немного сложнее. Опять иам нужно начать с того факта, что первая ненулевая цифра положительного случайного числа Х не превосходит я, если существует целое число з, для которого 1О'(Х ( (я + 1) 1О'. Следовательно, закон Бенфорда имеет место только тогда, когда вероятность того, что дробная часть (1д Х) не превосходит (д(й + 1), в точности равна 1д(й + 1). Для этого достаточно, чтобы дробная часть (1иХ) была равномерно распределена на интервале (О, !).
Теперь рассмотрим первый вопрос: при каких условиях на распределение случайной величины Х распределение (1иХ) приблизительно равномерно? Во-вторых, почему таблицы очень часто обладают этим свойством? Хотя первый вопрос изучался несколькими математиками (например, Р. Пинкхэмом и Дж. Кемяерманом) и получены достаточно хорошие результаты, на второй вопрос удовлетворительных ответов нет. Они часто приводят к путаной «философии» и даже к числовому мистицизму. По закону Бенфорда человек, например, считает арифметически: 1, 2, 3, ..., природа же автоматически берет логарифм от чисел и считает е', е", ез", ....
Бенфорд утверждает, что числовые характеристики в природе складываются из геометрических прогрессий, для которых (как и для степеней двойки) закон Бенфорда справедлив. Бенфорд приводит несколько примеров из различных областей науки и производства, которые иллюстрируют закон Вебера — Фехнера, открытый в Х1Х веке.
Согласно этому закону зависимость между раздражителем и ощущением — логарифмическая. К сожалению, аналогии, приводимые Бенфордом, удовлетворительного ответа на второй вопрос тоже не дают. Дальнейшие подробности можно найти в обзорной статье Р. Райми, в которой содержится обширная библиография. г) Замечания (1) Если иам нужно найти вероятность р» того, что й (й = = 1, 2, ..., 9) есть первая цифра числа, наугад взятого из числовой таблицы, и мы предполагаем существование определенного решения и его инвариантность относительно изменения масштаба (о масштабе единиц данных в таблице ничего не говорится), то мы приходим к логравномсриому распределению р,=(и(й+1) — 1ий.