В.Ю. Королев - Теория вероятностей и математическая статистика (1115266), страница 15
Текст из файла (страница 15)
Построим функцию г(л) для последовательности (Хи), определяемой соотношением (9.1.2). Пусп г(л) — некоторая последовательность положительных чисел. Рассмотрим поведение случайных веги У =— г(л) при л -ь оо. Интуитивно ясно, что функция г(л) характеризует скорость сходимости последовательности (Уи) к нулю, если последовательность (Уи) имеет отличный от нуля и от бесконечности предел. Но мы рассмат- ' риваем последовательность случайных величин, а случайные величины являются не числами, ио фулкьреяьеи злементарньсг исходов, и потому понятие предела таюй последовательности отличается от понятия предела числовой последовательности. Предел последовательности случайных величин можно трактовать по-разному.
Не ставя цели перечислить все подходы, мы будем следовать такому, при котором рассматриваются не сами случайные величины, а их распределения. Соотношение (9.1.2) означает, что 1.9. Центральная нредеяьная теорема Эта функция рас деления, очевидно, не является вырожденной (она соответствует айной величине У = ~У~, где У вЂ” случайная величина, имеющая нор альное распределение с нулевым ожиданием и дисперсией „з) Таким, образом, мы можем заключить, что разность средних арнфметичесю)я независимых одинаково распределенных случайных величин и мвгематичесизго ожидания стремится к нулю примерно как 1/~/и.
Другими словами, скорость сходимости в законе больших чисел равна 1/~/л. Обратим внимание, что такое заключение мы можем сделать только если в дополнение к условию справедливости заюна больших чисел (сущеспюванию математичесюго ожидания) выполнено условие справедливости центральной предельной теоремы (существование дисперсии случайной величины Х1).
Можно показать, что из существования дисперсии вытекает существование математического ожидания, но не наоборот. Ответ на вопрос о скорости сходимости в законе болыпих чисел, когда математическое ожидание случайной величины Х1 существует, а дисперсия — нет, требует привлечения более тонкой техники. Точность приближенного равенства (9.1.1) можно оценить.
А именно, если известны значения величин а = ЕХп о = ~/1УХ1 и 1л = Е)Х1 — а~з, то наибольшее по х значение величины Р ~~~ Хь <х — Ф не превосходит так называемой дроби Лелунова Со1л гз-=— о' /л' где Со — абсолютная положителыия постоянная, 0,4 < Со < 0,7655. Другими словами, точность приближения (9.1.1) обратно пропорциональна квадратному корню из числа слагаемых в сумме. Кстати, такая закономерность типична для большинства статистических задач. К обсуждению точности нормальной аппроксимации мы вернемся в разделе 2.2.4. Нормаш ное (гауссово) распределение вероятностей хорошо изучено. Термин "нормальное распределение вероятностей" впервые возник в конце Х1Х в. Его предложил Чарлз Пирсон (1857-1936) для описания распределения вероятностей, впервые встретившегося в работах Абрахама де Муавра (1667-1754).
Это распределение связывают также с именами 1.9. Ценеральиал предельллл лмоуема Пьера Симона Лапласа (1749-1827), Карла Фридриха Гаусса (1777-1855) и Роберта Эдрейна (1755-1843), чьи исследования дали первые обоснования важности применения этого распределения в прикладных исследо- ' В некоторых нематематических областях знания, например, в физике, экономике, биологии или социологии, нормальное распределение часто называют норллалъным законом. С таким термином, к сожалению, связано одно довольно серьезное заблуждение. К сожалению, нормальному закону часто ошибочно придают некий универсальный характер, что проявляется в том, что если результаты наблюдений (стагнстнчесдне данные) согласуются с нормальным распределением, то считается, что все хорошо, все правильно, а если же распределение данных не соответствует нормальному, то делается вывод о том, что эксперимент поставлен неудачно, данные имеют неправильный характер.
Возможно, это заблуждение имеет "лингвистические" причины, которые можно описать следующим обраюм. Нормальный закон — зто закон природы, вроде закона всемирного тяготения. А закон природы должен выполняться. К тому же это не просто закон, а нормальный закон. Более того, плохое хорошим словом не назовут, а "нормальное" — конечно же, '"хорошее" слово, ибо "не нормальное" — значит "ненормальное", а со словом "ненормальное" у большинства нормальных людей смзаны нехорошие ассоциации. Ясно, что такие "лингвистические" рассуждения нельзя считать серьезными.
В математике известны многие понятия, связанные с термином "нормальное". Например, нормальным называется направление, перпендикулярное (ортогональное) к поверхности в данной точке. При этом ясно, что категории "хорошее" н/илн "плохое" являются относительными и, вообще товоря, без дополнительных пояснений к направлению, равно как и к распределению вероятностей, вообще говоря, применены быть не могут. Точно так же можно заключить, что нормальный закон является правильным в не большей степени, нежели другие корректно доказанные математические утверждения. Точно так же, другие, не нормальные, распределения вероятностей, возникающие в соответствующих математических моделях стохастическнх ситуаций, являются не менее правильными, чем нормальное.
Доверие большинства серьезных исследователей к нормальному закону имеет, естественно, не лингвистические, а математические корни, 84 1.9. Цеитрааьноя ерооельное теорема базирующвеся иа некоторых известных свойствах вормапьиого распределеиие и соответствующих математических утверждениях, главным из юторых, юиечио же, является центральная предельная теорема теории вероятностей (опять-таки обратим внимание иа лингвистическую особеиность: именно центральная, то есп основная предельиел теорема).
Это ,.утверждеиие описывает есимптотическую нормальность распределений сумм случайных величии при неограниченно увеличивающемся числе слагаемых. Часто для обоснования использования иормальиого распределения иа центральную предельную теорему ссылаются чисто мехаиически, ие задумываясь о возможных обстоятельствах, препятствующих адекватности нормального распределеиия в тех или иных юикретиых условиюс.
Здесь необходимо быль чрезвычайно осторожным. Дело в том, что иногда (иапример, югда используется теорема Муавра-Лапласа, являющаяся частным случаем цеитральиой предельной теоремы) при исполыоваиии нормального распределения для аппроюимщии дискретного распределения происходит подмена распределения дискретной характеристики (иапример, бииомиапьио распределенной случайной величины) нелрерывныи распределением, то есть истинное распределеиие подменяется таким, каким оио не может быть никогда ло самой своей сути, то есп заведомо неадекватной моделью.
При этом одиовремеиио возиикает "проблема хвостов". Эта проблема наглядно проявляется, например, в теореме Муавра-Лапласа: вероятность того, что аппроксимируемая ограниченная бииомиальиая случайиав величина примет отрицательное зиачеиие, равно как и зиачеиие, превосходящее число испытаний Бериулли, с юторыми связала зта бииомиальиая сяучайиая величина, очевидио, равна нулю. В то же время, согласно нормальному распределеивю, вероятности любых как угодно больших отклонений аппроксимирующей неограниченной иормальвой случайной величины от среднего зиачеиия лаеажительны.
А это обстоятельство очень серьезно, например, в юриспрудеипии, где действует правило, гласящее, что если вероятность события строго положительиа, то это событие возможно, как бы мала ви была его вероатиосп. Поэтому иногда возникают курьезные ситуации, "казусы", подобные слещнощему. С помощью "высоюиаучиых" рассуждеиий, осиоваииых иа центральной предельной теореме, можно сделать вывод о том, что продолжи- 1.9. Цтянральнаа предельная теорема тельность беременности у человека имеет нормальное распределение с математическим ожиданием 268 дней (действительно, на продолжительность беременности влияют многие факторы, и отклонение действительной продолжительности беременности от ожидаемого срока в 268 дней обусловлено суммарным нх воздействием).
Основываясь на подобных рассуждениях адвокатов н меднцннском заключении, один из судов НьюЙорка в целях установления законности рождения ребенка у некой истицы признал, что беременность у нее длилась 365 дней. И действительно, ведь при нормальном распределении длительности беременности вероятносп такого отклонения случайной величины от ожидаемого значения иоложктельна (см. (Кнмбл, 1982)). Прн зтом, естественно, адвокаты истицы скорее всего умолчали о том, что в ташм случае положительными следует считать и вероятности любых сроков беременности, в том числе н отрицательных! (Справедливости ради необходимо отмеппь, что, как бы абсурдно иногда нн проявлялось упомянутое правило, совсем отказаться от него также нельзя. Например, недавно один из англнйских судов приговорил к тюремному заключению по обвинению в.убийстве троих своих детей некую женщину.
Прямых улик по атому делу не было. Более того, дети погибали в разное время. Едннственным основанием для обвинительного решения суда стало заключение некоего "спецналнсЫ' по статистике, который, "используя методы теории вероятностей и статнстнческнй анализ данных" о детской смертности подсчитал, что вероятность случайных смертей троих детей в одной семье чрезвычайно мала, н, стало быль, их смерть не случайна, так влк никаких официально зарегнстрнрованных жалоб на нх здоровье не было. Естественно, что принятое решение по меньшей мере небесспорно, так как вполне возможно, что у всех смертей есть одна глубинная прнчнна Эта причина вполне может иметь генетнческий характер, и тогда, наоборот, упомянутые трагические события в одной семье вполне вероятны.) Подобный прием, основанный на апелляциях к результатам теории вероятностей н/нлн математической статистики, далеко не нов.
К сожалению, очень часто за упомянутые выше "высоконаучные фразы" авторы неюторых выводов или статей прячут либо недобросовестно подтасованные выводы, либо свою некомпетентное п. 86 1.9. Цантраньнан нрадельнан нторама Однако имеются ситуации, когда о недобросовестности или некомпетентности говорить не приходится. В финансовой математике нормальное распределение является официально признанным фепппем. "Проблема хвостов" проявляется в финансовой математике как проблема распределений приращений биржевых цен. Ниже мы обсудим зту щюблему, весьма сходную с проблемой приращений процессов, наблюдаемых в турбулентной плазме. Здесь же мы лишь упомянем, что более ста лет назад, основываясь на рассуждениях, связанных с центральной предельной теоремой, Л.