Г.И. Ивченко, Ю.И. Медведев - Математическая статистика (1115270), страница 23
Текст из файла (страница 23)
Пусть л, Х и 5з — соответственно объем, выборочное среднее и дисперсия выборки нз нормального распределения с неизвестными параметрами. Показать, что с вероятностью у результат следующего, (и+!)-го испытания нахоДнтсв в интеРвале (Х чс Г э, „, т5 )' (л+(У(л — !)). У к а з а н н е. Прр ить теорему 1.10, согласво которой Ж ()' (и — 1)/(и+1) (Л" — Х„ы)/5) = = 5 (л !). ! ! ! '.46. результате пяти независимых взвешиваний одного н того же тела полу следующие результаты (в граммах): 4,12; 3,92; 4,55; 4,04; 4,35. Считая погрешности измереяий нормальными м/'(О, оз) случайиыыи велнчи- нами, указать доверительные граншты для результата гредстоащего шестого эззентйвйпия [/Юзеритечьный уровень пршгять равны Оо м,.б].
д~хг ' ° У~о Результатам и -== 2 независнмь!х нзкереанй диаыетра круга по стра оптимальную онениу его площади (погрешности измерений рзспреде. лены по закону о:Ф" (О„оз) с неизвестным о'-). Ук аз а н ие. Исгользозагь тот факт, что выборочные среднее Х и дисперсия 5з образуют полн ю достаточную статистику. Оглзгль Т [Л', 5е)=(л/4) (Хз — 5"-/(л — !)), 51.
Доказать, что оптимальная оценка всегда является склгметрнческой функцией паоэюдений. У к аз а и не. Волк Т=Т (Х) — несмещенная оценка т. то рассмотреть симметрическу!о статистику Т = — - ч Т (, Х), и. =-1-, и где и= !» рестановка нз л элемсцтгэ, пХ: — Х... Х. и сумьирваииз производится по всем и( перестановкам, Показать, что ЮгТ . ()Т. Проаерка статистических гипотез Гпава Этв глава представляет собой введение в теорию проверки статистических гипотез. Здесь приводятся основные понятна этой теории (статистической гипотезы, статистического критерия, критической области, функции мощности и др.).
Сформулированы типичные и наиболее распространенные в прююткеннях статистические гипотезы и на примерах рещения задач проверки этих гипотез излагаются общие принципы построения и исследования нрнтериев согласия. Рассматривается метод группировки наблюдений с последующим применением классического критерия согласия Хт. Излагаются некоторые результаты для схемы группировки с растущим числом интервалов.
$ 3.1, Понятие статистической гипотезы и статистического критерия. Критерии согласия 1. Статистические гипотезы. Задача разработкп рациональных методов проверки статистических гипотез— одна нз основных задач математической статистики. Статиглшчгской гипагпгзой (или просто гипоямзой) называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Такие утверждения можно делать на основйнии теоретических соображений илн статистических исследований других наблюдений. Пусть, например, эксперимент состоит в многократном измерении некоторой физической величины, точное значение а которой не известно и в процессе измерений не меняется. На результаты измерений влияют многие случайные факторы (точность настройки измерительного прибора, погрешность округления при считывании данных и т.
д.), поэтому результат Рго изменения Х, можно записать в виде Х,=а+еь где ет — случайная погрешность измеренвя. Обычно считают, что общая ошибка ет складывается из большого числа ошибок, каждая из которых невелика. На основании центральной предельной теоремы можно предположить, что случайные величины Х; имеют нормальное распределение. Такое предположение является статистической гипотезой о виде распределения наблюдаемых случайных величин. 102 Если для исследуемого явления (процесса, ситуации т. д ) сформулирована та нли иная гипотеза (обычно ее называ ной или нулевой гипотезой и обозначают символом Н) состоит в том, чтобы сформулировать такое правило, которое позволяло бы по результатам соответствующих наблюдений (по имеющимся статистическим данным) принять илн отклонить эту гипотезу. Правило, согласно которому проверяемая гипотеза Йа принимается или отвергается, называется статистическим критерием (или просто критерием) проверки гипотезы На.
Разработка таких правил и их обоснование с тачки зрения требований оптимальности и составляют предмет теории проверки статистических гипотез. Приведем несколько примеров математических формулировок наиболее распространенных в приложениях статистических гипотез, Пример 3.1 (гипотеза о виде распределения). Пусть производится и независимых наблюдений над некоторой случайной величиной $ с неизвестной функцией распределения Рт(х). Гипотезой, подлежжцей проверке, может быть утверждение тйпа Н: Р (х) = = Р(х) а. 'эх Н: х ( )„где функция Р(х) полностью задана, либо типа е.
Рз(х) ен Р, где Р— заданное семейство функций распределения. При этом обычно семейство Р задается в параметрическом виде: Ф"=(Р(х; В), 0 ~ В). Например, наблюдается неотрицательная целочисленная случайная величина $ и требуется проверить гипотезу На: Ж($) ~ П(0), где П(6) — семейство всех пуассоновских распределений. Во всех этих случаях Н, — это гипотеза о виде Распределения наблюдаемой случайной величины. В других ные ха случаях гипотеза состоит в том, что фиксируются некоторые р чистхарактеристнки функции распределения Р- (л). Например, она может иметь вид Н,:Рт.(йг)=рь 1=1, ..., я, где — оо~ «=ьт<...(~а~со н 0(р,(...~ра<! — заданные числа, Здесь Нв — это гипотеза о том, что распределение 3'($) имеет заданные квантнли ь; для заданных уровней рь Пример 3.2 (гипотеза одяородноспш).
Произведено й серий независимых наблюдений, результаты которых таковы: (хд, ..., хм), 1=1, ..., Й. Имеются ли основания рассматривать эти данные как результаты наблюдений над одной и той же случайной величиной, или, другими словами, можно ли с достаточной надежностью считать, что закон распределения наблюдений от серии к серии не менялсяр Если это так. то говорят, что статистические данные однородны. Пусть Рт(х) — функция (вообще говоря, неизвестная) распределения наблюдений Рй серии, 1=1,... ..., й. Тогда задача состоит в проверке гипотезы однородности На - 'Рх (х) = — ° ° . — Р* (х). Пример З.З (гштотгза независимости). В эксперименте наблюдается двумерная случайная величина $=(5ь Ят) с неизвестной функцией распределения Рт (х, 1г) и есть основания предполагать, что компоненты йт и 5з независимы.
В этом случае надо проверить гипогпгзу независимости На . Рг (х, р) = Рм (х) Р~, (у), где Р1,(х) и Рт,(у) — некоторые одномерные функции распределения. 103 В общем случае можно рассматривать й-мерную случайную величину .- и проверять гипотезу независимости ее компонент. Пример ЗА (гитяигза случайности). Результат эксперимента описывается и-мерной случайной величиной Х=-(Х„..., Х.) с неизвестной функцией распределения Гх(х), х=(х„..., х„).
Можно лп рассматривать Х как случайную выборку из распределения некоторой случайной величины с (т. е. являются ли компоненты Х[ независимыми и одинаково распределенными)? В данном случае требуется проверить гипогп зу случайное[пи Н». Рх(х)=-Г.(хс)... ...Г:(х„), где Гх(х) — некоторая одномерная функция распределения. Эти примеры ие охватыва:.от ватника.о*.цих в приложениях задач проверки статистических гипотез.
В частности, бываю~ довольно часто ситуации, когда проверяемая гипотеза состоит в том, что некоторый параметр семейства распределений соответствующей совокупности, например среднее значение, дисперсия и т. п., имеет наперед заданное значение или множество значений. Так[се гипотезы называются паоамгтрическими. Более подробно оип будут рассмотрены ниже. Рассмотрим общие методы проверки гипотез описанных выше типов.
Во всех эпгх случаяк формулируется только одна гипотеза Н» и требуется проверить, согласуются ли имеющиеся статистические данные с этой гипотезой или же оии ее опровергают. Соответствующие критерии называют критериями согласия. Введем понятие простой и сложной гипотезы. Если гипотеза Н, однозначно фиксирует распределение наблюдений, то ее называют прсют[й, в противном случае — сложной. В предыдущих примерах только гипотеза Н„: Ге(х) =[к(х) является простой, а остальные— сложные. 2. Критерии согласия н основные их характеристики.
Рассмотрим общий метод построения критериев согласия. Пусть о распределении случайной величины Х=(Х,, ..., Х„), описывающей Р уезультат изучаемого эксперимента, сформулирована некоторая гипотеза Нсь Чтобы построить критерий проверки этой гипотезь, 1, в большйнстве случаев поступают следующим образом. Пытаются найти такую статистику Т= Т(Х), характеризующую отклонение эмпирических данных от соответствующих (гипотезе Н») гипотетических значений (обычно такие статистики неотрицательны)„ распределение которой в случае справедливости Н» можно было бы определить (точно или приближенно).
В частности, если Н,— сложная гипотеза, то распределение Т(Х) должно быть одним н тем же для всех простых гипотез, составляющих Н,. Предположим, что такая статистика и ее распределение при гипотезе Н, найдены. Пусть сХ = ([ с ( = Т (х), х ен Х) — множество всех возможных значений статистики Т; определим для фиксированного заранее достаточно малого числа сс'- 0 подмножество [т,„~ .У так, чтобы вероятность осуществления события (Т(Х) ~ г~,ч) в случае справедливости гипотезы Н, (в дальнейшем для обозначения этой вероятности используется символиче- 104 (' ) = х ш: Н[)) удовлетворяла условию Р ([ (Х) ~ ~-„(Н,) - „ рки гипс[таз[[ Н со,кн ф гУющпм обР - - Н[/ > ь х — и;,Он[од„,[иаж и[ни[ Х и(т я реализа[(ин случайной [ичины и = .