Н.И. Чернова - Математическая статистика, страница 2
Описание файла
PDF-файл из архива "Н.И. Чернова - Математическая статистика", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Основные понятия выборочного методаПредположим, что мы повторяем один и тот же случайный экспериментв одинаковых условиях и получаем некоторый набор данных (числовыхили каких-то иных). При этом возникают следующие вопросы.1. Если мы наблюдаем одну случайную величину — как по набору еёзначений в нескольких опытах сделать как можно более точный выводо распределении этой случайной величины?2. Если мы наблюдаем одновременно проявление двух или более признаков, т. е. имеем набор значений нескольких случайных величин,— чтоможно сказать об их зависимости или о совместном распределении этихслучайных величин?Часто бывает возможно высказать некие предположения о наблюдаемом распределении или о его свойствах.
В этом случае по опытным данным требуется подтвердить или опровергнуть эти предположения («гипотезы»). При этом надо помнить, что ответ «да» или «нет» может быть дан8ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИлишь с определённой степенью достоверности, и чем дольше мы можемпродолжать эксперимент, тем точнее могут быть выводы. Часто оказываются заранее известными некоторые свойства наблюдаемого экспериментаи можно сформулировать какие-то априорные выводы о распределении:о наличии функциональной зависимости между наблюдаемыми величинами, о нормальности распределения, о его симметричности, о наличииу распределения плотности или о его дискретном характере и т.
д. Наличие таких знаний помогает на основании результатов эксперимента делатьвыводы о прочих, неизвестных, свойствах распределения.Итак, математическая статистика работает там, где есть случайныйэксперимент, свойства которого частично или полностью неизвестны и который мы умеем воспроизводить в одних и тех же условиях некоторое(а лучше — неограниченное) число раз.Пусть ξ : Ω → R — случайная величина, наблюдаемая в случайном эксперименте.
Предполагается, что вероятностное пространство задано и небудет нас интересовать.Проведя n раз этот эксперимент в одинаковых условиях, получим числа X1 , X2 , . . . , Xn — значения наблюдаемой случайной величины в первом, втором и т.
д. экспериментах. Случайная величина ξ имеет некоторое распределение F, которое нам частично или полностью неизвестно .~ = (X1 , . . . , Xn ), называемый выборкой .Рассмотрим подробнее набор XВ серии уже произведённых экспериментов выборка — это набор чисел.До того как эксперимент проведён, имеет смысл считать выборку наборомслучайных величин (независимых и распределённых так же, как ξ). Действительно, до проведения опытов мы не можем сказать, какие значенияпримут элементы выборки: это будут какие-то из значений случайной величины ξ.
Поэтому имеет смысл считать, что до опыта Xi — случайнаявеличина, одинаково распределённая с ξ, а после опыта — число, котороемы наблюдаем в i -м по счёту эксперименте, т. е. одно из возможных значений случайной величины Xi .~ = (X1 , . . . , Xn ) объёма n из расО п р е д е л е н и е 1. Выборкой Xпределения F называется набор из n независимых и одинаково распределённых случайных величин, имеющих распределение F.Что значит «по выборке сделать вывод о распределении»? Распределение характеризуется функцией распределения, плотностью или таблицей,набором числовых характеристик — E ξ, D ξ, E ξk и т.
д. По выборке нужноуметь строить приближения для всех этих характеристик.§ 2. Выборочные характеристики9§ 2. Выборочные характеристикиВыборочное распределение. Рассмотрим реализацию выборки на одном элементарном исходе — числа X1 = X1 (ω0 ), . . . , Xn = Xn (ω0 ).Разыграем новую случайную величину ξ∗ , которая принимает значенияX1 , .
. . , Xn с одинаковыми вероятностями (например, с помощью правильного n-гранного кубика). Эта случайная величина определена на совсем ином вероятностном пространстве, чем изначальные случайные величины (на пространстве, связанном с бросанием кубика), поэтому будемвероятностную меру на нём обозначать P̃ (соответственно, математическое ожидание — Ẽ и т.
п.).Запишем таблицу и функцию распределения случайной величины ξ∗ :X 1ξ∗X1...Xnколичество Xi ∈ (−∞, y), Fn∗ (y) ==.11nnP̃...nnXi < yРаспределение величины ξ∗ называют эмпирическим, или выборочнымраспределением. Введём обозначения для числовых характеристик выборочного распределения. Математическое ожидание величины ξ∗ равноnnX11 X∗Ẽ ξ =Xi =Xi = X.i=1nni=1Дисперсия этой случайной величины равнаnnX1 X1∗ 2∗D̃ ξ =(Xi − Ẽ ξ ) =(Xi − X)2 = S 2 .i=1nni=1Точно так же вычислим и момент порядка knnX11 X k∗ kkẼ (ξ ) =Xi =Xi = X k .i=1nni=1В общем случае обозначим через g(X) числоn1 XẼg(ξ ) =g(Xi ) = g(X).n∗i=1Если теперь мы позволим элементарному исходу ω0 меняться, то всеперечисленные выше характеристики Fn∗ (y), X, S 2 , X k , g(X) станутвеличинами случайными, поскольку каждая из них будет функцией от nслучайных величин X1 , . . .
, Xn .10ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИЭти характеристики выборочного распределения используют для оценки (приближения) соответствующих неизвестных характеристик истинного распределения. Причина использования характеристик распределенияξ∗ для оценки характеристик истинного распределения ξ (или X1 ) — законы больших чисел.
Все построенные нами выборочные характеристики являются средними арифметическими независимых и одинаково распределённых случайных величин и с ростом объёма выборки сходятся повероятности к истинным характеристикам: математическому ожиданию,моментам, дисперсиям, вероятностям и т. п.Познакомимся подробно с каждой из введённых выше характеристики исследуем её свойства, в том числе поведение с ростом объёма выборки.Эмпирическая функция распределения. Неизвестное истинное распределение F можно полностью описать с помощью его функции распределения F (y) = P(X1 < y).
Рассмотрим оценку для этой функции.О п р е д е л е н и е 2. Эмпирической функцией распределения, постро~ = (X1 , . . . , Xn ) объёма n, называется случайнаяенной по выборке Xфункция Fn∗ : R × Ω → [0, 1], при каждом y ∈ R равнаяFn∗ (y)nколичество Xi ∈ (−∞, y)1 X==I(Xi < y).nni=1Напомним, что случайная функция переменной y(1, если Xi < y,I(Xi < y) =0иначеназывается индикатором события {Xi < y}. При каждом y этот индикатор является случайной величиной из распределения Бернулли с параметром p = P(Xi < y) = F (y) (почему?).Если элементы выборки X1 , . .
. , Xn упорядочить по возрастанию накаждом элементарном исходе, получится новый набор случайных величин,называемый вариационным рядом:X(1) 6 X(2) 6 . . . 6 X(n−1) 6 X(n) .ЗдесьX(1) = min{X1 , . . . , Xn },X(n) = max{X1 , . . . , Xn }.Элемент X(k) называется k -м членом вариационного ряда или k -й порядковой статистикой.11§ 2. Выборочные характеристикиП р и м е р 1. Пусть дана числовая выборка~ = (0; 2; 1; 2,6; 3,1; 4,6; 1; 4,6; 6; 2,6; 6; 7; 9; 9; 2,6).XПостроим по ней вариационный ряд(0; 1; 1; 2; 2,6; 2,6; 2,6; 3,1; 4,6; 4,6; 6; 6; 7; 9; 9)и эмпирическую функцию распределения (рис. 1).Fn∗ (y)61-012345678910yРис. 1.
Эмпирическая функция распределенияЭта функция является функцией распределения случайной величины,1принимающей значение 0 с вероятностью, значение 1 с вероятно-1521стью, значение 2 с вероятностьюи т. д.1515Эмпирическая функция распределения имеет скачки в точках выборкиm(вариационного ряда), величина скачка в точке Xi равна, где m — коnличество элементов выборки, совпадающих с Xi . Эмпирическая функцияраспределения по вариационному ряду строится так:0, если y 6 X(1) ,kFn∗ (y) =, если X(k) < y 6 X(k+1) ,n1при y > X .(n)Гистограмма. Другой характеристикой распределения является таблица для дискретных распределений или плотность — для абсолютно непрерывных.
Эмпирическим аналогом таблицы или плотности является такназываемая гистограмма.Гистограмма строится по группированным данным. Предполагаемуюобласть значений случайной величины ξ (или область выборочных данных) делят на некоторое количество не обязательно одинаковых интерва-12ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИлов. Пусть A1 , . . . , Ak — интервалы на прямой, называемые интервалами группировки. Обозначим для j = 1, .