М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 3
Текст из файла (страница 3)
В соответствии с аксиоматикой Колмогорова требуется, чтобы система событий была замкяута относительно перехода к дополнению и конечяому или счетному объединению: А ея ~4 ф А (в: м я А) ея ~4, А~яка, 1=1, 2, ... фЦА~яи 4, а также содержала все И: Иевлев и притом У(Я) =1 (легко видеть, что конечное нли счетное пересечение событий также являетея событием); вероятностная мера У должна обладать свойством счетной аддитивности: если АДА~=Я прн 1Ф), то Е'Я А) -ЯУ(Ад, где индекс 1 пробегает конечное или счетное множество. Вероятюстная модель явления ставит в соответствие результатам наблюдений хь хь...,х (3) последовательность случайных величин (сл. в.) — функций на Я: Х~(в), Хз(ы)....,Хь(ы). (4) Полагают, что наблюдения (3) являются значениями величин (4) при осуществлении е.
Несмотря на различие объектов (3) и (4), в математической статистяке принято называть и то н другое выборкой. Статистическим закономерностям числовых данных реального вксперимента (3) отвечают вероятностные утверждения для случайных величин (4), 6. Заков больших чисел. Табл. 1 составлена по результатам испытаний, порождающих последовательность «случайных» цифр. Здесь лаев(0, 1, 2,...,9), Х~(е) — независимые сл. в., принимающие зяачения О, 1, 2,...,9 с равными вероятностями р-1/10.
Обозначим через и„гнело появлений цифры О в первых л испытаниях. Анализ последнего столбца 1 привел нас к заключению, что частота нуля и /л с ростом л совершает затухающие колебания вблизи 1/10, Это— выражение змпнряческого закона устойчивости частот. Соответствующее математическое утверждение — закоя больших чисел (3.
Б.Ч) для сл. в. Хь Введем индикаторную сл. в. ( 1, если Хс(в)= О, 11 О, если Х (~) ~ О, "=Е'(;.-) с-з Тогда З.В.Ч. в уснлеяной форме выражается соотношением Р(1пп т„/л =р) = 1. Для практических целей полезно иметь оценки вероятностей Р((т,/л — р( <б) при конечных л. Это можяо сделать, используя распределение вероятностей величины т: У(тварю) ~С~Рр"'(1 р)~, ш~ООе 1 2е ° ° ° л, (5) где р-1/1О. Для л-10 расчет по формуле (5) дает следующие значения (см.
табл. 6.1 биномиального распределеяия в [1)): При я=100 непосредственные вычисления по формуле (5) нецелесообразны. Хорошее приближение к бнномиальному распре- 13 делеапо (5) дает в этом случае распределение Пуассона: хФн Ф(т„=ш) эн — е-", т=б, 1, 2, ..., и! где А лр 10. По табл. 5.3 пуассоиовского распределения в [11 находим приближенные значения вероятностей рт У (~ т„— 10(~<1) У(1т~/» — 0,1(~(1 О 01): Пря л-1000 для расчета (5) надо воспользоваться нормальным приближением Р (-"з:-"~-<л1 ы Ф(л)== ( е — "гу/.
Выпишем для нескольких значений к приближенные значеняя вероятностей ,У((тл/л — 0,1(~4'„с 0,0095) ~рх из таблицы зкачений функции нормального распределения: Подведем итог приведенным расчетам в форме следующего соотношения: У((т„/» — 0,1) >б) жанн 0,01, (6) где при »= 10 следует брать 5=0,3; прн л= 100 в 6-0,08; прн л =1000 — б 0,025. Статистический смысл неравенства (6) выясняется пря много- Д к атном повторении опыта, порождающего л случайных цифр. опустим, результаты большого числа У таких опытов предетавлепы последовательностями хР, лР, ..., х!л, /=1, 2, ..., й!, (7) н пусть т~ — число нулей в (7), Обозначим через М, число В тех последовательяостей (7), для которых выполнено неравенство !ш~/» — р)~ б.
14 Тогда имеет место прпблвженное равенство М,/Упв1-о, выражающее закон устойчивости частот в применении к событию (~т /л-р~<б). й з. эмпнрнчвскюв рдспрвдвлвннв ввронтпоствп 1. Эмиирическее распределение дискретией случайной вела- Предположим сначала, что Х днскретна и принимает значения а, Ь, с,... свероятиостямй р(а), р(Ь), р(с),.... По ряду наблюдений хь хь...,х, (1) вычисляем частоты р(х) лв„(х)/л исходов х а, Ь, с,....
Набор (р(а) ° р(Ь). ..) (2) представляет собой дискретное распределение вероятностей: оар(х)а.1, р(а)+р(Ь)+ ... -1| ° го называют эмлярячвскии раслрсделеиявм (э.р.), отвечающим наблюдениям (1). Э.р. (2] является оценкой теоретического распределения сл. в. Х: (р(а), р(Ь),...). П р я и е р !. Пусть теоретическое распределение — биномнальяое: рЦ)-С,~р~(1-р)~-~, 1-0, 1,...,Ь. (4) Смоделнруем выборку объема л 40 ю распределения (4) с параметрамп Ь 250, р О,1, объединяя первые 10000 случайных цифр пз [Ц в л 40 групп по 260 пифр н подсчитывак число х~ нулей в 1-2 группе, 1 1, 2,...,40. Результаты представлены ниже: а а з1 а з1 1з а и з4 а а а а 1в и ю 1в а а и а и за зт з1 з4 в и и а зо а з4 и а ю а з4 зз ю Эмпирическое и теоретическое распределения представлены в табл.
2. Таблица 3 Эниирнческаи и ееобстическан фуикцнн расиренцеенкн Р(,с), Р(х) цан амба(иие иа биионнааьносо ресннецеаенна; Ь(х) 1Р(х) — Р(х)! Таблица 2 Вероатностн р (/) = С(р!(1 — р)» й л збо: р=0,1 иик оценки рД) но инборке объела и=40 йи) еш <13 !3 0,0 0,025 Теоретическое распределение рассчитано приближенно с помощью локальной предельной теоремы Муавра †Лапла: р(1)= !р( р ), ~р(х)==а; (5) значение р(13) вычислено непосредственно по формуле (4) (в скобках указано приближенное значение по формуле (5)). Как видно нз табл.
2, относительная погрешность оценки ((б(1) — р(1))(р(1)) )бо% в интервале 17~/~~32 достигает 150%. Очевидно, для хорошей оценки распределения (3) необходимо, чтобы доля наблюдений, приходящихся на каждую из представляющих интерес вероятностей, была достаточно велика. Этого можно добиться группировкой, оценивая вероятности не отдельных значений, а группы значений. С теоретической точки зрения намного более полезным являетея представление эмпирической информации и виде функции распределения (ф.
р.) Р(х)= ~„р(1). Ш 15 17 18 19 20 21 22 23 24 25 26 27 28 Зо 31 32 32 0,05 0,(лб 0,05 О, 025 0,025 0,075 0,05 О,!5 0,1 0,075 0,025 0,05 0,025 0,1 О,! 0,05 0,0 0,0019 (о,'ооз) 0,020 0,028 О, 038 0,048 0,059 0,068 0,076 0,081 0,083 0,08! 0,076 0,068 0,0$9 0,048 0,038 0,028 !3 17 18 19 20 2! 22 23 24 25 26 27 28 29 30 31 32 0,025 0,075 О.! О,!5 0,175 0,2 0 275 0,325 0,475 0,575 0,65 0,67$ 0,725 0,75 0,8$ 0,95 1 0,01 0,05 0,07 О,Ю 0,15 0,21 0,27 0,34 0,42 0,5 0,58 0,66 0.73 0,79 0,8$ 0,89 0,92 О,ОИ 0,1лб 0,03 0,04 0,(лб 0,01 0,005 0,0!5 0,055 0,075 0,07 О,ОИ 0,005 0,04 0,00 0,06 0,08 2.
Эмпирическая фуякция распределения. Рис. 1. Эмпирическая функция распределения выборки из бнипмпаяь- Распределение вероятностей ного Риепрехеаеиня РО! се'Р'(1— произвольной случайной величн миеьипе прпбяиженне иы Х характеризуют функцией распределения (ф.р.) Р(х). Прн фиксярованиом х Р(х) определяется как вероятность события (Х(х), н ее можно оценить частотой этого события в ряду наблюдений (1), Соответствующую частоту принято обозначать Р (х). Иногда желательно отметить в обозначениях зависимость Р„(х) от х (хь хм...,х )1 Р йх) Р„(х; хь хя,...,х ) Р (х; х).
Используя индикаторы, получаем следующую формулу: и 1 %Ч Р„(х) = — р 7(,,,к,) г-г (!а=1, если утверждение А истинно, и /а=0- в противном случае). Функция Р (х), так, как она определена, есть функция распределения дискретной сл.в.. принимающей значения хь хь... ...,х„с вероятностью 1/л (если какие-то Й из х; совпадают между собой, то их общему значению приписывается вероятность й(п), и ее называют эмпирической функцией распределения (э.
ф. р.). Перейдем к вероятностной модели повторных ислытамий— последовательности Х„Х,...,Х„ (6) независимых сл.в. с одинаковой ф. р. Р(х). В математической статистике принято употреблять одни и те же термины для характеристик последовательности сл.в. (6) и принятых ими в ре- 17 В табл. 3 и на рнс. 1 проводится сравнение Р(х) с Р(х)=Р(Х~ ах), рассчитанной с помощью интегральной теоремы Муавра— Лапласа. Абсолютная погрешность Ь(х) = !Р(х) — Р(х) 1 достигает 0,08 при 13~х с32, а относительная погрешность (Ь(х)/Р(х))Х Х!00% при 17~х~32 не превосходят 407р.
4У 48 47 44 йб 44 4У 42 41 я" 12 74 и 72 24 22 24 2б 2э уб 7224 зультате опыта значений (1). В частности, Р„(х; Х) == — ~ )(х.~,», Х =-(Х,, ..., Х„), ! ! 1 также называют з.ф.р. Подчеркнем, что Р (х; Х) прн каждом фиксированном х — случайная велнчнна. Так как л МР„(х; Х) = — !» М)(х мг ) =- Р(х), г л г=! и РР„(х, Х) = — ~ыО)(лгал» вЂ”вЂ” 1 ч.ч Е(л)(! — Е(л)) ! ! то нз неравенства Чебышева получаем следующую оценку для отклонения Р (х) от Р(х): У(Чи1Р„(х; Х) — Р(х) 3>!)~Р(х) (1 — Р(х))(-з. (7) Лучшую оценку для вероятности в левой части соотношения (7) прп больших и можно получить применением ннтегральной теоремы Муавра — Лапласа: У!$ а »Р„(х; Х) — Е(х)»,з !) яв2(1 — гР(ггу'Р(х)(1 — Р(х)))». (8) Заметим, что правые частя (7) и (8) зависят от велпчпны Р(х), которую мы как раз н пытаемся оценить по результатам наблюденнй.