1625915145-5b3debabab98d9e994cc3a1bc8da0f5b (843876), страница 2
Текст из файла (страница 2)
В теории вероятностей рассматриваются случайныевеличины с заданным распределением. Но откуда берутся знания о распределениях и вероятностях в практических экспериментах? С какой вероятностью выпадает герб на данной монете? Основная проблема состоит в том,что выводы приходится делать по результатам конечного числа наблюдений.Так, наблюдая 5 035 гербов после 10 000 бросаний монеты, нельзя сделатьточный вывод о вероятности выпадения герба: даже если эта монета несимметрична, герб может выпасть 5035 раз. Точные выводы о распределенииможно делать лишь тогда, когда проведено бесконечное число испытаний,что неосуществимо. Математическая статистика позволяет по результатамконечного числа экспериментов делать более-менее точные выводы о распределениях случайных величин, наблюдаемых в этих экспериментах.§ 1.
Основные понятия выборочного методаПредположим, что мы повторяем один и тот же случайный эксперимент в одинаковых условиях и получаем некоторый набор данных (числовых или каких-то иных). При этом возникают следующие вопросы.1. Если мы наблюдаем одну случайную величину — как по набору еёзначений в нескольких опытах сделать как можно более точный выводо распределении этой случайной величины?2. Если мы наблюдаем одновременно проявление двух или более признаков, т.
е. имеем набор значений нескольких случайных величин,— чтоможно сказать об их зависимости или о совместном распределении этихслучайных величин?Часто бывает возможно высказать некие предположения о наблюдаемом распределении или о его свойствах. В этом случае по опытным данным требуется подтвердить или опровергнуть эти предположения («гипотезы»). При этом надо помнить, что ответ «да» или «нет» может быть дан8ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИлишь с определённой степенью достоверности, и чем дольше мы можемпродолжать эксперимент, тем точнее могут быть выводы. Часто оказываются заранее известными некоторые свойства наблюдаемого эксперимента и можно сформулировать какие-то априорные выводы о распределении: о наличии функциональной зависимости между наблюдаемымивеличинами, о нормальности распределения, о его симметричности, о наличии у распределения плотности или о его дискретном характере и т.
д.Наличие таких знаний помогает на основании результатов экспериментаделать выводы о прочих, неизвестных, свойствах распределения.Итак, математическая статистика работает там, где есть случайныйэксперимент, свойства которого частично или полностью неизвестны и который мы умеем воспроизводить в одних и тех же условиях некоторое(а лучше — неограниченное) число раз.Пусть ξ : Ω → R — случайная величина, наблюдаемая в случайномэксперименте. Предполагается, что вероятностное пространство заданои не будет нас интересовать.Проведя n раз этот эксперимент в одинаковых условиях, получим числа X1 , X2 , . . .
, Xn — значения наблюдаемой случайной величины в первом, втором и т. д. экспериментах. Случайная величина ξ имеет некоторое распределение F, которое нам частично или полностью неизвестно .⃗ = (X1 , . . . , Xn ), называемый выборкой .Рассмотрим подробнее набор XВ серии уже произведённых экспериментов выборка — это набор чисел.До того как эксперимент проведён, имеет смысл считать выборку набором случайных величин (независимых и распределённых так же, как ξ).Действительно, до проведения опытов мы не можем сказать, какие значения примут элементы выборки: это будут какие-то из значений случайнойвеличины ξ. Поэтому имеет смысл считать, что до опыта Xi — случайнаявеличина, одинаково распределённая с ξ, а после опыта — число, котороемы наблюдаем в i -м по счёту эксперименте, т.
е. одно из возможных значений случайной величины Xi .⃗ = (X1 , . . . , Xn ) объёма n из расО п р е д е л е н и е 1. Выборкой Xпределения F называется набор из n независимых и одинаково распределённых случайных величин, имеющих распределение F.Что значит «по выборке сделать вывод о распределении»? Распределение характеризуется функцией распределения, плотностью или таблицей,набором числовых характеристик — E ξ, D ξ, E ξk и т. д. По выборке нужно уметь строить приближения для всех этих характеристик.§ 2. Выборочные характеристики9§ 2.
Выборочные характеристикиВыборочное распределение. Рассмотрим реализацию выборки на одном элементарном исходе — числа X1 = X1 (ω0 ), . . . , Xn = Xn (ω0 ).Разыграем новую случайную величину ξ∗ , которая принимает значенияX1 , . . . , Xn с одинаковыми вероятностями (например, с помощью правильного n-гранного кубика). Эта случайная величина определена на совсем ином вероятностном пространстве, чем изначальные случайные величины (на пространстве, связанном с бросанием кубика), поэтому будемвероятностную меру на нём обозначать P̃ (соответственно, математическое ожидание — Ẽ и т.
п.).Запишем таблицу и функцию распределения случайной величины ξ∗ :∑ 1X1...Xnξ∗количество Xi ∈ (−∞, y), Fn∗ (y) ==.11nnP̃...nnXi < yРаспределение величины ξ∗ называют эмпирическим, или выборочнымраспределением. Введём обозначения для числовых характеристик выборочного распределения. Математическое ожидание величины ξ∗ равноnn∑11 ∑∗Ẽ ξ =Xi =Xi = X.i=1nni=1Дисперсия этой случайной величины равнаnn∑11 ∑∗∗ 2D̃ ξ =(Xi − Ẽ ξ ) =(Xi − X)2 = S 2 .i=1nni=1Точно так же вычислим и момент порядка knn∑1 ∑ k1∗ kkẼ (ξ ) =Xi =Xi = X k .i=1nni=1В общем случае обозначим через g(X) числоn1 ∑g(Xi ) = g(X).Ẽg(ξ ) =n∗i=1Если теперь мы позволим элементарному исходу ω0 меняться, то всеперечисленные выше характеристики Fn∗ (y), X, S 2 , X k , g(X) станутвеличинами случайными, поскольку каждая из них будет функцией от nслучайных величин X1 , .
. . , Xn .10ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИЭти характеристики выборочного распределения используют для оценки (приближения) соответствующих неизвестных характеристик истинного распределения. Причина использования характеристик распределенияξ∗ для оценки характеристик истинного распределения ξ (или X1 ) — законы больших чисел. Все построенные нами выборочные характеристикиявляются средними арифметическими независимых и одинаково распределённых случайных величин и с ростом объёма выборки сходятся повероятности к истинным характеристикам: математическому ожиданию,моментам, дисперсиям, вероятностям и т. п.Познакомимся подробно с каждой из введённых выше характеристики исследуем её свойства, в том числе поведение с ростом объёма выборки.Эмпирическая функция распределения.
Неизвестное истинное распределение F можно полностью описать с помощью его функции распределения F (y) = P(X1 < y). Рассмотрим оценку для этой функции.О п р е д е л е н и е 2. Эмпирической функцией распределения, постро⃗ = (X1 , . . . , Xn ) объёма n, называется случайнаяенной по выборке Xфункция Fn∗ : R × Ω → [0, 1], при каждом y ∈ R равнаяFn∗ (y)n1 ∑количество Xi ∈ (−∞, y)=I(Xi < y).=nni=1Напомним, что случайная функция переменной y{1, если Xi < y,I(Xi < y) =0иначеназывается индикатором события {Xi < y}. При каждом y этот индикатор является случайной величиной из распределения Бернулли с параметром p = P(Xi < y) = F (y) (почему?).Если элементы выборки X1 , .
. . , Xn упорядочить по возрастанию накаждом элементарном исходе, получится новый набор случайных величин, называемый вариационным рядом:X(1) ⩽ X(2) ⩽ . . . ⩽ X(n−1) ⩽ X(n) .ЗдесьX(1) = min{X1 , . . . , Xn },X(n) = max{X1 , . . . , Xn }.Элемент X(k) называется k -м членом вариационного ряда или k -й порядковой статистикой.11§ 2. Выборочные характеристикиП р и м е р 1.
Пусть дана числовая выборка⃗ = (0; 2; 1; 2,6; 3,1; 4,6; 1; 4,6; 6; 2,6; 6; 7; 9; 9; 2,6).XПостроим по ней вариационный ряд(0; 1; 1; 2; 2,6; 2,6; 2,6; 3,1; 4,6; 4,6; 6; 6; 7; 9; 9)и эмпирическую функцию распределения (рис. 1).∗Fn (y)1 60-12345678910yРис. 1. Эмпирическая функция распределенияЭта функция является функцией распределения случайной величины,1принимающей значение 0 с вероятностью, значение 1 с вероятно1521стью, значение 2 с вероятностьюи т. д.1515Эмпирическая функция распределения имеет скачки в точках выборкиm, где m — ко(вариационного ряда), величина скачка в точке Xi равнаnличество элементов выборки, совпадающих с Xi .
Эмпирическая функцияраспределения по вариационному ряду строится так:0, если y ⩽ X(1) ,kFn∗ (y) =, если X(k) < y ⩽ X(k+1) ,n1при y > X .(n)Гистограмма. Другой характеристикой распределения является таблица для дискретных распределений или плотность — для абсолютно непрерывных. Эмпирическим аналогом таблицы или плотности является такназываемая гистограмма.Гистограмма строится по группированным данным. Предполагаемуюобласть значений случайной величины ξ (или область выборочных данных) делят на некоторое количество не обязательно одинаковых интерва-12ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИлов. Пусть A1 , . . . , Ak — интервалы на прямой, называемые интервалами группировки.
Обозначим для j = 1, . . . , k через νj число элементоввыборки, попавших в интервал Aj :νj = {число Xi ∈ Aj } =n∑I(Xi ∈ Aj ),n=i=1k∑νj .(1)j=1На каждом из интервалов Aj строят прямоугольник, площадь которого пропорциональна νj . Общая площадь всех прямоугольников должнаравняться единице. Если lj — длина интервала Aj , то высота fj прямоугольника над этим интервалом равнаfj =νjn lj.Полученная фигура, состоящая из объединения прямоугольников, называется гистограммой.П р и м е р 2.