В.П. Чистяков - Курс теории вероятностей (1115342), страница 29
Текст из файла (страница 29)
Доля белых шаров х в выборке может быть вычислена по формуле Я = (х, + х, +... + сс„))п. При измерении числовых характеристик часто оказывается, что результат кап<лого измерения можно рассматривать как значение $ (ы) некоторой случайной величнны $, которое зта величина принимает в данном исходе опыта со. Функция распределения рь (х) величины $ характеризует используемый для измерений прибор. Несколько независимых измерений, проводимых в одинаковых условиях, можно описать соответствующим количеством случайных величин, каждая из которых имеет функцию распределения рз (х). Назовем случайной выборкой объема п (или просто выборкой) случайный вектор (х„х„..., х„), где хю й = = 1, ..., и, независимы и одинаково распределены с Р (хх ( л) = Рх (х).
Случайная выборка является математической моделью независимых измерений, проводимых в одинаковых условиях. Иногда в задачах, связанных с измерениями, оказывается, что величины х„..., х„можно считать нормально распределенными. В вадаче с подбрасыванием двух монет (см. з 3 гл. 1) имеем дискретные величины Р (хг — — 1) = =рОР(х„=О)=1 — рп (=1,2, гдехе=1,если в й-м испытании монеты выпали одинаковыми сторонами; р, = 2/3, р, = 1/2. При оценке доли брака в партии из- 1В8 элвмкнты млтвмлтичвскои стлтистики ~гл. г делий по схеме случайного выбора без возвращения величины, входящие в выборку, оказываются зависимыми.
Обычно мы будем рассматривать случай независимых измерений. Одной из основных характеристик выборки является эмпирическая функция распределения Р„ (х), определяемая формулой (2.1) Р„(х) =- где р„(х) — число значений среди х„..., х„, меньших х. Таким образом, при любом х величины р„(х), а следовательно, и Р„(х) являются случайными. Случайные величины выборки х„хг,..., х„, расположенные при каждом ю в порядке возрастания их значений: хсв ~( хов ~(...
~~ х<„>, определяют новые случайные величины, называемые га- риационным рядом. В частности, хсв — — ш1п (х„..., х„), хсв — — шах (х„х„..., х„). Покажем, что при больших и эмпирическая функция распределения Р„(х) близка к функции распределения р' (х). Теорема 2.1 Для любого х ( — оо ( х ( со) и лю- бого е ) 0 11ш Р (~ Р,*, (х) — Р (х) ~ ( з) = 1. ч ю Д о к а з а т е л ь с т в о.
С каждым х„(й = 1,..., и) можно связать двз события: (хг ( х) и (хг г х). Веро- ятности этих событий, очевидно, равны р = Р (х„ ( х) = Р (х), д = Р (хг..г х) = 1 — Р (т). Если событие (х„ ( х) назвать успехом, то р„ (х) являет- ся числом успехов в серии из и независимых испытаний. Так как в рассматриваемой последовательности испыта- ний Р„ (х) = рн (х)!и является частотой успеха, то ут- верждение доказываемой теоремы сразу следует из теоре- мы 5.6 гл.
6. Иногда для наглядного представления выборки ис- польвуется гиспюгра.кма, получаемая следующим обра- зом. Числовая ось разбивается на несколько непере- Г секающихся колуинтервалов: ( — о, со) = () (гю гг г), аз~ Вывогочные моменты 169 где — ос=г,<г,<г,«...г„<г„,= о. Далее вычисляются частоты р»Ч = Ре (г„л,) — Рн (г„) попадания злементов выборки в зти полуинтервалы.
Затем над каждым отрезком (гю г»л,! строится прямоугольник, площадь которого пропорциональна частоте ре». Так же как при доказательстве теоремы 2 1, можно показать, что р$ при больших п близки к р„= Р (г„+,) — Р (г„) или (если Р (х) имеет плотность распределения р (х)) к р» = »»ы ~ р (х) Ых.
Таким образом, при удачном выборе ширины интервалов гистограмма может напоминать график плотности распределения р (х). Рассмотрение графинов змпирической функции распределения и гистограммы может дать некоторое предварительное представление о неиавестной функции распределения Р (х). Более точные выводы о неиавестной функции распределения Р (х) могут быть сделаны на основе следующей теоремы А. Н.
Колмогорова. Т е о р е м а 2.2. Если функция Р (х) непрерывна, то при и- со Р (у'и ( зир ~Р„(х) — Р(х)))(г)-+К (г)= ао (х(с О при г< О, ( — 1)" е-'»"' при г) О. »-— Теорема А. Н. Колмогорова позволяет указать границы, в которых с большой вероятностью будет заключена неизвестная функция распределения. Если г„ подобрано так, что 1 — К (г„) = сг, то неравенства Р„(х) — ( Р (х) ( Р„(х) + —" 1/в ун выполняются сразу для всех х с вероятностью, близкой к 1 — а.
б 3. Выборочные моменты 3.1. Математическое ожидание и дисперсия выборочных моментов. Для каждой реализации измерений х, (е»), х» (ы),..., х„(»з) эмпирическая функция распределения 1то ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЕ СТАТИСТИКИ ИГЛ. 9 « « Чч 1 ЧЧ ач= — у хк, т» = — ~~(хк — х)', (3.1) и к-ь к=ь где 1 ч ь х= як= — т х„ л (3.2) к — выборочное математическое ожидание (или выборочное среднее).
Можно показать, что при достаточно общих ограничениях на неизвестную функцию распределения рь (х) выборочные характеристики (3.1) бливки к соответствующим теоретическим характеристикам рз (х): а»=МЗ» Р»=М(З М$)» (3.3) Найдем сначала математическое ожидание и дисперсию выборочных моментов. Так как хк независимы и распределены так же, как $, то г~ Мх= — у Мхк=М$=а1, В А~.Ь к=ь « тч Ох= —, у Охк= — 0$=рк/и. ик 7 Таким образом, Мх=ам Аналогично находим (3.4) и,„— ач $ Ма, = а„, Оа„= и (3.5) «) Если какое-либо авачевое встретится в выборке а раа, то :тому ввачеввю соответствует воров»вость к/и. р«(х) является функцией распределения некоторой дискретной случайной величины, принимающей и значений: х, (ы), х, (ы), ..., х„(ьо) — с вероятностями, равными 1/и«). При различных ы соответствуьощне функции Р„" (х) различны.
При каждом ы можно ввести различные числовые характеристики соответствующего данному ы ззкопв распределения, определяемого р«(х). Эти характерястнкв будем называть выборочными. Выборочные моменты и центральные выборочные моменты порядка ч вычисляются по формулам ВЫБОРОЧНЫЕ МОМЕНТЫ и и тз = — л (у, — у)'= — ~ у» — у', ( .6) »=1 где у=(ул+... -~-у„)(п. Поскотьку Му, =О, Му»=12 и Му»ул — — Му» Му, = 0 ()4 ~1), то МУ2 = 1, Х Му»у, = — — '. Р» ЛЬ 1-1 Отсюда и из (3.6) находим и — л Мт2 = )41. (3.7) В формуле (3.5) математическое ожидание а» совпало с соответствующим теоретическим моментом. В (3.7) правая часть смещена относительно р,. Если вместо т, ввести величину 22 = — т» = — р (х» — х), и 2 %1 2 (3.8) И вЂ” 1 И вЂ” $ и~Л л.
1 то для нее получим м, =)л,, (3.9) Перейдем к вычислению От». Из (3.6) находим — — ( ~~~',У») — — У ~~ У» + У ° (3.16) »=1 Так как случайные величины у», й = 1, ..., и, независи- мы и Му„ = О, то в правой части равенства 4 Л му = —, ~~ му,,у,,у,,уд лил„1„1,=1 отличны от нуля только и слагаемых Мул = р4 и СсС42 = 3п (п — 1) слагаемых Му,ул = р»„1 Ф й. Поэтому Несколько слоя»нее вычисляются математическое ожидание и дисперсия центральных выборочных моментов.
Ограничимся вычислением Мт, н 0т» Положив у„= = л» вЂ” Мх», Й = 1, ..., и, запишем вторую формулу (3.1) при т = 2 з виде $72 ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ [ГЛ. 9 Му» = ()»9+ 3 (и — 1) )»1)/пз. Аналогично находим в в М [( ~~у»») /п1 = п»М [ — у»~~у„')) =(»9+(и — 1)р». »=1 »=1 Отсюда и из (3.10) по формуле От» = Мт» — (Мт,)' получим Р» — Р1 з (Рч — ЕР») Р» — ЕР» От» = — + Л п» Л» Можно показать (соответствующие вычисления см. в книге НО], 1 27.5), что для любого» при и -» оо Мт =р»+ О( — ), М(т» — 1»»)1»=0 ( — „) . (3.12) Вторая из этих формул верна, если конечен момент р,»,.
Из неравенства Чебышева и формул (3.4), (3.9) и (3.11) следует, что для любого е > 0 при и -~ оо Р (( е — а1 ( ( з) -» 1, Р (( в' — р, ( ( е) -~ 1, (3.13) где величина 1-' определена формулой (3.8). Аналогичные утверждения верны и для а», т» при любых» ь 2. 3.2. Асимптотическое распределения.
Найдем сначала асимптотические при и -~ со распределения выборочных » ч»» моментов а,. Величина па„= ~, х» является суммой не»=1 зависимых одинаково распределенных случайных величин. Если конечен момент»х»» = МЕ»», то к этой сумме можно применить теорему 4.1 гл. 7. Так как Мх»1 = а», Ох» = а»» — а», то величина » 9 асимптотическн нормальна с параметрами (О, 1). Таким образом, справедлива следующая теорема.