4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 2
Текст из файла (страница 2)
Здесь в шутливой форме дзн типичный пример статистического вывода: если бы кости были симметричны. то наблюдаемое событие (5 раз подряд выпали 3 шестерки) имело бы ничтожно малую вероятность (ЦБ»)»=а.т( ° (О-г« и, поскольку в эксперименте наблюдалось такое событие, нполне логично сделать вывод, что априорная модель (симметричность костей) ложна. Первыми крупными работами, относящимися к математической статистике, были исследования Я. Бернулли н П. Лапласа, К. Гаусс разработал теорию ошибок наблюдений.
Научноеобоснование закономерностей случайного рассеивания связано с именами русских математиков П. Л. Чебышева, А. А. Маркова и А. М. Ля. пунова, значительно углубивших результаты известных к тому времени классических исследований. Ряд важнейших современных понятий и методов, оказавших большое влияние на развитие современной теории математической статистики, предложил Р. Фишер (метод максимума правдоподобия, дисперсионный анализ, понятия состоятельности, достаточности, эффективности и др.). Систематическое развитие теории проверки статистических гипотез началось с работ К. Пирсона по критерию хи-квадрат.
Основной вклад в построение этой теории внесли Ю. Нейман н Э. Пирсон, которые ввели понятия ошибок первого и второго рода и показали общность и значение метода отношения правдоподобия для построения критериев. Общая теория статистических решающих функций, охватывающая как теорию проверки статистических гипотез, так и теорию оценивацня, создана А. Вальдом. Большую роль в развитии математической статистики сыграли работы Г.
Крамера, Э. Лемана, С. Рао, М. Кендалла, А. Стьюарта, С. Уилкса, а также советских ученых А. Н. Колмогорова, Б. В. Гнеденко, Ю. В, Линника, Е. Е. Слуцкого, Н. В. Смирнова, В. И. Романовского, Л. Н. Большева, Ю. В, Прохорова и др. Математическая статистика — это непрерывно и интенсивно развивающаяся наука. В последние годы появилось большое количество глубоких результатов, охватывающих, по существу, все основные направления современной теории математической статистики.
Крупный вклад в развитие новых методов этой теории вносит советская математическая школа. 2. Терминология и обозначения. В большинстве случаев исходные статистические данные †результ наблюдения некоторой конечной совокупности случайных величин Х =(Х„ ..., Х„), характеризующей исход изучаемого эксперимента. Обычно в этих случаях говорят, что эксперимент состоит в проведении и испытаний, в которых результат г-го испытания описывается случайной величиной Хо г' = 1, ..., и. Совокупность наблюдаемых случайных величин Х = (Х„ ..., Х,) называется выборкой, сами величины Х„ ( = 1, ..., п, †элемента во»борки, а их число и — ее объемом.
Реализации выборки Х будем обозначать соответ- ствующимн строчными буквами х =- (х„..., х,). Иногда для обозначения наблюдаемь!х случайных величин используются прописные буквы У, Л, (2', 12 и т, д., а для их наблюдавшихся значений — соответствующие строчные буквы у, г, и, о и т. д. Пусть $'= (х) — множество, на котором задано распределение случайного вектора Х, т.
е. множество всех возможных значений выборки Х. В статистике множество Ю называется выборочным просгпранспиола (при этом имеется в виду, что на Х задан класс а е подмножеств, образующих о-алгебру, однако в дальнейшем изложении нет необходимости выделять такой класс). Выборочное пространство может быть либо всем и-мерным евклидовым пространством Я«нли его частью (если случайная величина Х непрерывна), либо состоять из конечного или счетного числа точек в Я«(если случайная величина Х дискретна). В данном случае под статистической моделью эксперимента понимается набор (Х, К), где У вЂ” класс допустимых распределений случайной величины Х, заданных на 2".
Распределение вероятностей любой случайной величины однозначно определяется ее функцией распределения, поэтому обычно статистическая модель задается в терминах допустимых функций распределения выборки Х. Таким образом, далее предполагается, что статистическая модель определяется выборочным пространством Х и семейством функций распределения р, которому принадлежит неизвестная функция распределения гх(х», ..., х„) = Р(Х,~х„..., Х«:.х„), — оо<х„..., х„<со, выборка Х=(Хо ..., Х,). Часто рассматриваются ситуации, когда компоненты Х,, ..., Х, независимы и все распределены так же, как и некоторая случайная величина $, Этот случай соответствует эксперименту, в котором проводятся повторные независимые наблюдения над случайной величиной ". Здесь Рх,(хД=Рт(х) для всех (=1, ..., п и гх(х) = = рь(х»)...гз(х„).
Такую модель можно задать в терминах функции распределения Рт, и в этом случае говорят, что Х = =.= (Х„..., Х,) — выборка нз распределения случайной величины $. Иногда множество возможных значений $ с распределением Рь называя!т генеральной совокупностью (или просто совокупностью) имеющей функцию распределения Рь(х), а величину Х вЂ” выборкой из этой совокупности. В дальнейшем распределение $ обозначается символом с ($). В этих обозначениях предыдущую фразу можно записывать кратко так: «Х=(Х„..., Х,) есть выборка нз Ж($)». В данном пособии в основном рассматриваются именно такие модели, хотя в ряде задач предположения независимости и одинаковой распределенности компонент Х; не выполняются.
Статистическая модель для повторных независимых наблюдений будет обозначаться кратко в виде,р =(Рь), т. е. указанием лишь класса допустимых функций распределения исходной случайной величины $. Там, где это не приведет к недоразумениям, индекс у Рь для краткости будет опускаться. Если функции распределения из класса Г заданы с точностью до значений некоторого параметра 6 с множеством возможных О значений В, то такая модель обозначается У'=(Р(х; 8), 8 ей 6» н называется паралгеп2ричеслой. Говорят, что в этом случае известен тнп распределения наблюдаемой случайной величины, а неизвестен только параметр, от которого зависит распределение. Параметр 6 может быть как скалярным, так н векторным, множество В называется параметрическим. Например, пусть известно, что ь ($) — нормальное распределение с известной дисперсией н неизвестным средним.
Тогда статистическая модель имеет вид В =(г" (х; 6), 6 ен В =( — со, оо)», где функция распределения г (х; 8) имеет плотность ) (». 6) е — (к — э)чо«'! со <» < оо ! 'г'2а а Если и дисперсия неизвестна, то статистическая модель имеет внд,7 =(г (х; 6), 6=(6„~) ен В), где 8=((8,, Ое): — со<9,<со, 0<8,<со), и г" (х; 8) имеет плотность )(х; 6) = е (" д й2 !), — со<х<со.
г'2а б» Модель У =(сь) называется абсолютно непрерывной или дискрептной, если таковымп соответственно являются все составляющие класс У функции распределения. В дальнейшем используется единое обозначение )ь(х) =1(х) (для параметрических моделей 1(х; 6)) как для плотности распределения случайной величины 8 в случае абсолютно непрерывной модели, так и для вероятности Р (» = х) в случае дискретной модели. Приведем один пример дискретной модели.
Предположим, что Х'(8) — пуассоновское распределение с неизвестным параметром. Тогда статистическая модель имеег вид 8 = (р(х; 6), 9 ев В = = (О, оо)), где г (х; 8) определяется вероятностями ь« 1(х; 8)=Р($=х)=е-в;т, х=О, 1, 2, .... В данном пособии рассматриваются только модели этих двух типов, которые наиболее распространены в приложениях. В случае параметрической модели распределение вероятностей на выборочном пространстве .Т, отвечающее параметру О, обозначается символом Рь. Аналогично, индекс 8 при символах матема тпческого ожидания, дисперсии и т. д.
означает, что соответствующие величины вычисляются для распределения Рв. Например, ЕвТ(Х), РвТ(Х) — обозначения соответствующих моментов заданной функции Т(Х) от выборки Х в случае, когда функция распределения выборки есть сх(х; 8). При этом для единообразия иногда используется сокращенная заппсь через интеграл Стнлтьеса: ЕвТ (Х) = ~ Т (х) йРх (х; 6). Здесь интеграл понимается как и-мерный интеграл по всему выборочному пространству .Т, который в случае абсолютно не- обо»н»хенн» 1 Е п»р»в»тря»еское модели с»унннэя 1 !»1 Е! ином»ст»о а И»н»мне»анне модели ."о (в) »м эх (6, а-) гх — Е) ° 1 =е Вхйла — СО ( Х ( СО !х а!» 1 =е В'2пе со < Х < со (к — во' 1 — е Зе» )г2це» СО (Х СО х».— 1 -~/Е , х)0 Г ()») еь —, О<ххме 1 6' 1 —, 01<к==в» е,— в' 1 1 ц 1, (х — 6)»* СО ( и ( СО Схвх (! — 6)н х=о, 1,...,л 6» е-" —, х!' х=о, 1, 2, ...
Сх Ех (! 0)г х=о, 1,2, Нормальная-1 (6: — оз < 6 < со) (В: О ( Е ( Оз) Нормальная-2 Ж(ч)»м ву" (р 6») (0=(6,, вй1 — са ( 61 ( со~ о(е,( (6: О<0< ) Общая нормаль. Х(»)»ц мг" (01. 01) пая ХЕ мг(Е, й) Гам "ха «0:0(6(оз» Равно»»ерная-1 Ж(й) ш Й (О, 8) Общая равномер- О' (6) ш )с (6,, О,) ная (6 (81, О»): — со<8»<0 < з) (01 — с (0 <СО) (е:о(6< Н (0: О ( 6 ( со) Х (8) щ »З (0) Коши Биноыиальная ХЩ 1ц В1(л, 6) Пуассонавская о' П) щ П (8) (е:о(е< !1 Ж(») ВРЛ (г, Е) Отрицательная бнномиальная прерывной модели вычисляется как обычный интеграл Римана ()Т(х„..., х„)1(х»; 9)...((х,; 6) бх,...с(х„, а в случаедискретной модели — как соответствующая сумма д'„Т(хз» ..., хл) 7(хг; 6)...
...((х,к 6). Во многих задачах математической статистики рассматриваются последовательности случайных величин «т)„[, сходящиеся в том илн ином смысле к некоторому пределу т) (случайиой величине или константе)„когда л-ьоо. В настоящей книге используются два вида сходнмости: сходимость по вероятности н сходимость по распределению, или слабая сходимость. Напомним, что последовательность «1)„[ называется сходящейся по вероятности к»), если 11п1 Р(~т)„— т!')е)-+.О, !»е)0, что кратко записывается так: »)л — »). Под сходимостью по распределению [иля кратко: Х (»)„) Ж (»))) понимается сходнмость Таблица В.! соответствующих функций распределения в каждой точке непрерывности предельной функции. Известно, что из сходимостя по вероятности следует слабая сходимость.
Остальные обозначеипя и понятия вводятся по тексту. 3. Некоторые типичные статистические модели, В теории вероятностей наиболее часто встречающиеся законы распределения имеют общепринятое наименование и обозначенне. Так, например, нормальный закон со средним р и дисперсией ов обозначается символом Ф (р, о'); пуассоновский закон со средним )ь — символом П()ь) и т. д. Если наблюдаемая случайная величина $ имеет распределение некоторого стандартного типа, то соответствующая статистическая модель имеет такое же наименование. Например, говорят о нормальной модели, пуассоновской модели н т.