М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 20
Текст из файла (страница 20)
Вычисляем !1пр, азизу!!э==!!пр, У!!э — !!приз ! !!э=-.~~ и!р!- — и)'е. Таким образом, статистика критерия равняется Г!рпведем численный пример, заимствованный пз Я. Пропзводплпсь измерения окружностей головы и=142 черепов, принадлежащих и г=-О! сериям, при этом / ! ==83, из=51, из=8.
Результаты измерений приведены пижс в виде суммарных характеристик: 114 а> ) уз! = 11277; Я у ! = 7049; 11 у'! = 1102: г '); ~ (уз — у ) =4616,64, ! 1/ ! откуда р, = 135,87; р = 138,22; р = 137,75; 1 ! ~~„У!1 = 19428; У = 136,817. ! 1!=! Дальнейшие вычисления удобно провести по формулам Г 1 Ю. Я и!р,'-.' — пуо = ~~ (р! — У) ~)'„ //!;, ! ! з=! / 1 l Г ! 1 яя„з ог прз ~;~;(уз у) ~~яр~ и„-.,) ! !! ! ! ! ! !/ ! ! ! которые приводят соответственно к значениям 238,59 и 4616,4— — 238,59 4378; Е„,„о, — — — 238,59/ 1 — 4378 ! = 119,29/31,50 =- 3,79. 2 / 1139 Найдем р-квантнль Езззо-распределения для р!=0,95 и рз=0,975 по табл. 3.5 111.
Ил!еем по таблице хо,(Ез,!зо) =3,0718; х„(Гз,„)=.2,9957; х„, (Ез,!зо) = 3,8046; хзч (Ез,„) =- 3,6889. Значения хо(Е .„) для л=!39 вычислим линейной интерполяцией по аргументу 1/и: хр,(Ез.!зо) =хр,(Е лоо) +(хо,(Ез „) — хр,(Ез,!зо))х х ~ — — — 1/ — — Г =3 0718 — (3 0718 — 2,9957) О,!367= 139 120 /~ 120 / = 3,0614; хзь (Е!. !зэ) = 3,8046 — (3,8046 — 3,6889) 0,1367 = 3,7888. Итак, наблюденный уровень значимости а, оз=р(Е~Е!,:оз) ав 0025, что можно рассматривать как неудовлетворительное согласие с гипотезой. Во всяком случае для уровня значимости о=0,05 Ео:о.
3,79 значительно превосходит границу хооз=30614, и на этом уровне гипотеза должна быть отвергнута. 115 ГЛАВА !П аоСтдтОЧНЫВ СтлтИСтИКИ 4 14. СТАТИСТИЧЕСКАЯ МОДЕЛЬ, ПОДОБНЫЕ СТАТИСТИКИ 1. Статистическая модель. В предыдущих главах были приведены примеры реальных статистических данных и предложены вероятностные модели для их описания. Объектом исследования являлась последовательность сл.в.
Х;=Х,(ы), 1= 1, 2, ..., определенных иа основном вероятностном пространстве (й, вй, (У)) (см. п. 4 5 1). Вектор наблюдений К = (Х» Хь ., Х„) определяет вероятностную меру Р: Р (В) = У(м. Х, (ы) ~В), (1) заданную на системе Я„ так называемых борелевских множеств Й': ߄— наименьшая система подмножеств лг", включающая множества вида (х,=(хь ..., х„): а;(х;~Ь» 1=1, ..., л), а;м. <б; — произвольные числа, н замкнутая относительно перехода к дополнению и образования счетного объединения.
Меру Р(В) мы будем называть распределением вероятностей вектора Х„. В последующем мы встретимся с моделямн, в которых число наблюдений и заранее ие фиксировано и результатамн наблюдений могут оказаться числовые векторы х„=(х» ..., х„) разной размерности и. Имея в виду это обстоятельство, введем отдельное обозначение Я (х) для пространства выборок х, не накладывая ограничений иа структуру этого множества, хотя, как правило, речь будет идти о лс' =)с", х=х„ = (хь ..., х„).
В случае выборочного множества Я произвольнои структуры будем считать, что в ла выделена система Я так называемых измеримых множеств. Система Я должна содержать Ж как свой элемент, должна быть замкнута относительно перехода к дополнению и образованию счетного объединения. Отображение Х(ы) множества (л в вГ, такое, что лля любого В~Я (и>: Х (ы) ее В)~.Ф называется измеримым; в случае, когда фиксирована мера У па (1Е;-й), функи'иб Х(ы) называют случайным элел~ентом на (Я, Я). Пару из множества и системы измеримых подмножеств называют изл~еримым нространстволк таковы пары (й, вй) ° (2', Я).
Название связано с возможностью задать меру иа систе- 11б ме измеримых подмножеств — это мера Я в случае (11, вэ) н мера Р, определяемая формулой Р(В) =У(ьтХ(ы)яВ), (2) в сл чае пространства (М',Я). Я редметом изучения теории вероятностей является отдельное веронгностное пространство ((),,Ф, .У). Как мы могли убедиться в предшествующих главах, в матемьтической статнстнке вероятностная модель, которая предлагается для описания опыта, определена не полностью. И как раз задача статистики — уточнить эту модель по результатам испытаний. Другими словамн, модель математической статистики определяет.я целым семейством вероятностных мер (Р) на ((),,Ф), н тем самым объектом изучения в математической статистике оказывпетс ~ семейство вероятностных пространств ((Й,,Ф, У))„где Я принадлежит некоторому заданному множеству (У).
Формула (2) порождает семейство вероятностных мер (Р) на измеримом пространстве (Ф, Я). Тройку (М, Я, (Р)) называют статистической моделью. Прн фиксированном Р вероятностное пространство (М', Я, Р) назовем выборочным. Если семейство (Р) параметризоваио н имеет вид (Р,:0~6), где 9 — скалярный или векторный параметр, то модель (Ы, Я, (Ре.'ОенЩ) называют параметрической.
Приведем некоторые примеры уже известных нам статистических моделей. (1) Ф=)1"; Я=߄— система борелевских множеств в )1"; мера Рт, где Š— одномерная непрерывная ф. р., задается и-мерной ф,р. вида Е(х~) ... Е(х„), что соответствует независимой выборке с ф.р. отдельного наблюдения Е(х). Семейство (Рт) образуется из всех Рт с непрерывной ф.р. Е. К этой модели мы по существу обращалпсь прп доверительном оценивании теоретической ф.р. через э.ф.р. с помощью статпстпкц Колмогорова (5 2), а также при построении доверительных интервалов для кваптплей ($3).
(11) Измеримое пространство (Ф, Я) и мера Рт те же, что н в (!), но Е пробегает множество ф.р., отличающихся сдвигом и масштабом от некоторой заданной ф.р. Ео(х). (Например, Ео(х) = =1 — е-", х>0 илн Ео(х) =Ф(х).) Семейство (Р) в данном случае параметрнзовано: каждое Р„,. задается парой чисел (р, о), — оо( <р<оо, о>0.
(1П) ео, Я вЂ” те же, что и выше, семейство (Р) состоит нз мер Р следующего вида. Пусть Е(хь ..., х„) — соответствующая Р и-мерпая ф. р., Е;(х;), Ен(т„х;) — наборы одномерных и двумерных ф.рл Е~ (х~) = Е ( + оо, ° ° ° ° -г оо хь — оо ° ° ° ° '+ оо). Еп(х„хг) =Е(+оо, ..., +оо, хи +оо, ..., +оо, хи +оо, ...,+оо).
117 Предполагается, что выполнены следующие соотношения: х~хгг(рп (х~ х ) ) хю ~(Р ' (х~) ~ АР~ (х~) 1 < О О х~ ИР, (х~) = О,хп +... + О,хо ж Оэ ) (х, — Ч~)з 4Е; (гй) =- оз, где хп, ..., х;„1=1, ..., л, — некоторые заданные числа (одни и те же для всех Р), Оь ..., О„аз — числовые параметры, свои для каждого Р. Множество всех распределений Р с указанными ограничениями на первые два момента н составляет семейство (Р). Легко понять, что в данном случае речь идет о линейной статистической модели с некоррелированными наблюдениями, с равнымн дисперсиями и матрицей модели Х=[хп, 1=1, ..., и; 1' =1, ..., г].
Следует подчеркнуть, что каждому элементу Р сопоставзен набор параметров (Оь ..., О„о'), однако это соответствие. не является взаимно-однозначным. Поэтому семейство (Р) ие является параметризованным. (1Ч) В условиях предыдущего примера предположим дополнительно, что Р— и-мерное нормальное распределение.
В результате получаем параметрическую модель (см. $13), где Рв,. есть Ж„(ОХ', оЧ), О=(Оь ..., О,), — со<6~<со, 1=1, ..., г, о>О. Проведенное нами различие между вероятностной и статистической моделями приводит к различию в понятиях и обозначениях, которое раньше не всегда явно отмечалось.
Это относится, в частности, к понятию статистики. Определение 1. Статистикой назовем любую функпию Т(х), задающую измеримое отображение пространства (М, Я) в (й', Я~), т. е. такую, что для любого ВепЯ~ (х: Т(х) епВ)епЯ. Векторной статистикой назовем упорядочеНный набор статистик: (Т~(х), ..., Тх(х)) Т~(х). Таким образом, понятие статистики оказывается не связанным с семейством мер (Р).
Переход от статистики к случайной величине — функции от выборки — производится подстановкой в Т(х) вместо х случайного элемента Х. К сожалению, уступая традиини, не всегда удается отказаться от употребления термина статистика по отношению к сл.
в. Т(Х). Заметим, что обозначение Т(Х) ие отражает зависимости от распределения .У (илн Р). Это не приводит к путанике, когда речь идет о вероятностях У(Т(Х)епВ), но для математического ожидания мы введем явное указание на распределение: Мг илк М,, если семейство параметрическое. 118 2.
Подобные статистики. Существуют статистики Т(х), для которых распределение ве- роятностей Т(Х) одно и то же для всех Р пз заданного семейства (Р). Такие статистики называются подобными (они подобны слу- чайным величинам). Рассмотрим несколько примеров. (1) Пусть )г"- — выборочное пространство, Ре — мера в Я"-'::, задаваемая непрерывной ф. р., имеющей впд г"(х!) ... г"(хо) !о(хо+!) ° ....Р(х„+ ), (Рг) — семейство всех таких мер.
Пзаожнм х!'! (х!, ..., хо), х!'г= (х„+!...,, х„+ ), х= (х!'>, х!'!) и введем э. ф. р. Р„(х; х!'!), !ом(т; х'о!). При фоиксггрованном х каж; !я нз этих э. ф. р. является статистикой. Образуем статистики Сми! нова: Т+ (х) = зпР (г „(х~ хн !) — Р,о (х; хго!)), Т(х) =знр1Р„(х; х!'!) — Р (х; хго!)1. Совершенно аналогично статистике Колмогорова (см. п. 3 $2) проверяется, что распределение каждой из статистик Т+, Т одно и то же для всех Р~(Р!).
и, следовательно, обе эти статистики подобные. (П) Пусть (Р„: — ое<р<оо) — семейство распределений в Я" с параметром сдвига и: Р„задается ф. р, го(х! — р) То(ха — Р) ". п ... го(х„— р). Статистика Т(х) =Я (х! — х)' — подобная.
г-! (1П) Для семейства (Р.:0<о<+ее) в йг", где Р, задается ф. р. Ро(хг/о)Ра(хо/а) ... Ро(хо/о), подобной статистикой будет о Т(х„) =х /~„(х! — х)'. г+! (1!г) В линейной статистической модели с нормальными наблюдениями (см. п. 3 $!3) статистика — 11прг г9то т1! /~ — !1пряоеэ! т1! ) является подобной в предположении, что верна гипотеза Н: векгор среднего лежит в У'. (!Г) В модели сдвига-масштаба статистики о! ~1 ! к"ч (х — р )о/ д„(х! — х) н — «~ (х! — Х)о ео ! ! г ! буду! подобпымн ьрп выполнении гипотезы и- — ро для первой статистики и оь по — для второй. Поскольку распределение подобной статистики одно и то же глг! всех мер Р в пределах рассматриваемого семейства (Р), по- 119 добная статистика не помогает уточнить вопрос о том, какое именно из распределений Р лучше всего соответствует наблюденным денным.