Учебник_Бочаров_Печинкин (846435), страница 44
Текст из файла (страница 44)
Уравнения ! 2г! = х!(д) = 6!ха д 2 1 х2 = х2(д) = 6! — д п представляют собой уравнения двух лучей, исходящих из начала координат (рис. 6), и, значит, границы симметричного доверительного интервала доверительной вероятности м для неизвестной дисперсии д зада- в" ются формулами од* н пд' Рис, б '-6,. ' -6,. — т- Пример 30, Рассмотрим, наконец, случай, когда в выборке из нормальной генеральной совокупности неизвестны оба параметра: среднее д! и дисперсия дз. В качестве их оценок воспользуемся выборочным средним 1 д! — — пь* = — (Х! Ч-... Ч- Х„) и 206 Гл.
2. Оценки неизвеежных парамегпров которая, как говорилось в параграфе 4 гл. 1, имеет 1-распределение с и — ! степенями свободы. Обозначим через !1,ь„жз и !0 ьмз (1 + о)/2- и (!в — о)/2-квантили т-распределения (см. !1), табл. 3.2). Тогда значение оценки среднего д,* с вероятностью о будет лежать в пределах !е.*, )е.,* " * ='"=-1 — " *'=""'-У— п п Продолжая рассуждения, как и в случае известной дисперсии, и учитывая равенство гнь Ыв = — 10 11з, получаем окончательные выражения для границ д~ и ьэ" ,симметричного доверительного интервала доверительной вероятности ее и Я = А* !ьси ~/ А = б! ! !ьиа 1~— ,— ')) ° Доверительный интервал )дз, д.,") доверительной вероятности о для неизвестной дисперсии ьэз строится точно так же, как и в примере 29; !и 1) дз и (и 1) дз 6~.,„' ла ! 2 При этом нужно учитывать, что квантили Ьне„ы и 60 „)Гз берутся для д -распределения с и — ! степенями свободы, поскольку одна степень свободы з уходит на определение неизвестного среднего дь П В заключение отметим, что в современной математической статистике доверительные интервалы строят так же, основываясь на критериях значимости.
Глава 3 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ В этой главе мы обратимся ко второму направлению в математической статистике — проверке статистических гипотез. Сначала определим понятия статистической гипотезы и критерия, а затем рассмотрим некоторые наиболее часто встречающиеся на практике гипотезы н приведены критерии для нх проверки. 1. Статистическая гипотеза. Критерий Снова предположим, что в результате эксперимента мы получили выборку Хы ...,Хя из генеральной совокупности с неизвестной теоретической функцией распределения с(ю). Статистической гипотезой (в дальнейшем для краткости вместо «статистическая гнпотезая будем говорить просто «гипотезая) назовем любое предположение о виде теоретической функции распределения с'(х).
Так, в схеме Бернулли гипотезами будут являться следующие предположения: «вероятность успеха равна !/2э; «вероятность успеха больше 1/Зя; «вероятность успеха заключена между 0,4 и 0,7я и т.д. С нормальным распределением можно связать такие гипотезы: лтеоретическая функция распределения нормальна со средним, равным нулю»; «теоретическая функция распределения нормальна с дисперсией, не превосходящей квадрата среднего значения», и т. д. Все перечисленные выше гипотезы являются параметрическими, поскольку в них предположения делаются относительно области изменения неизвестного параметра (или нескольких параметров) для заданных параметрических семейств функций распределения.
Примерами непараметрических гипотез служат высказывания: «теоретическая функция распределения является нормальнойя; «теоретическая функция распределения не является нормальной»; етеоретическая функция распределения имеет положительное математическое ожидание». Гипотезы будем обозначать буквой Н, снабжая при необходимости индексами. Всюду в дальнейшем будем предполагать, что у нас имеются две непересекающиеся гипотезы: Но и Ны Гипотезу Но будем называть основной, а гипотезу Н1 — конкурирующей или альтернативной.
Выбор названия условен, но, как правило, удобно основной гипотезой Но называть более конкретное предположение о виде теоретической функции распределения или предположение, влекущее за собой более важные практические последствия. Задача проверки статисти- 208 Гл. 3. Проверка статистических гипотез чггких гипотез состоит в том, чтобы на основе вьюорки Хн ...,Х„ принять (т.е. считать справедливой) либо основную гипотезу Но, либо конкурирующую гипотезу Нь Различают простую и сложную гипотезы.
Простая гипотеза полностью определяет теоретическую функцию распределения х'(х). Так, простыми будут гипотезы: «вероятность успеха в схеме Бернулли равна 1/2«; «теоретическая функция распределения является нормальной с нулевым средним и единичной дисперсией». Гипотеза, не являющаяся простой, носит название сложной.
Примерами сложных гипотез будут: «вероятность успеха в схеме Бернулли заключена между 0,4 и 0,7»; «теоретическая функция распределения является нормальной с нулевым средним, но произвольной дисперсиейгп «теоретическая функция распределения не является нормальной«. Сложная гипотеза среди возможных функций распределения выделяет некоторое подмножество Уш содержащее более одной функции распределения. При этом если мы имеем сложную параметрическую гипотезу, то заранее в силу каких-то уже проверенных соображений ограничиваемся рассмотрением некоторого параметрического семейства функций распределения х(х; д) с неизвестным параметром (или параметрами) д, а сама гипотеза выделяет среди всех функций распределения данного семейства те, у которых д е Оо, где Оо в свою очередь — некоторое подмножество области О всех возможных значений неизвестного параметра д.
Статистическим критерием (или просто критерием) называется правило, позволяющее, основываясь только на выборке Хы..., Х„, принять либо основную гипотезу Но, либо конкурирующую Нн Каждый критерий характеризуется допустимой областью И'«, т.е. областью в п-мерном пространстве Л"', попадание в которую выборки Хн,..,Х„ влечет за собой принятие основной гипотезы Но. Дополнительная область И', =.
Л" ) Иг„, попадание в которую выборки Хн...,Х„приводит к принятию конкурирующей гипотезы Ны носит название критической области. Предположим теперь, что у нас имеется две гипотезы Но и Ны т.е. в множестве всех функций распределения выделены два непересекающихся подмножества Уо и Ум при этом основная гипотеза Но заключается в том, что выборка Хн..., Х„произведена из генеральной совокупности с теоретической функцией распределения х'(х), принадлежащей подмножеству Уо, а конкурирующая гипотеза Н~ — с теоретической функцией распределения Е(х), принадлежащей подмножеству Ун Пусть также задан критерий для проверки этих гипотез, т.е. разбиение и;мерного пространства Л" на две области: допустимую Ил и критическую И', = Л" '1 И;. В силу случайности выборки какой бы критерий мы не взяли, обязательно возможно появление ошибок двух родов.
Ошибка первого рода возникает тогда, когда имеет место основная гипотеза Но, но выборка Хн ...,Х„ попадает в критическую область 14г«и мы принимаем конкурирующую гипотезу Нь Вероят- К Статистическая гипотеза. Критерий 209 ность о ошибки первого рода называется уровнем значимости крите- рия и определяется формулой о = Р~(Хы...,Х„) е И',) = ~ Р(х|) Р(х„) в дискретном случае и гг = Р((Хы...,Х ) е Иг,) = ')...') р(х1).
р(х„) дх1 дх„ в непрерывном, где Р(х) или р(х) ряд распределения или плотность распределения наблюдаемой случайной величины Х при условии справедливости основной гипотезьз Нз, а суммирование илн интегрирование, как обычно, ведется по всем точкам (хь ...,х„) е И; (в дискретном случае каждое х, может принимать только значения Ьы ...,Ьг). В случае, когда гипотеза Но сложная, уровень значимости сг =- сг(Р(х)), естественно, будет зависеть от реальной теоретической функции распределения Р(х) из подмножества Уо. Кроме того, если гипотеза Нз параметрическая, т.е.
подмножество Уо представляет собой параметрическое семейство функций распределения Г(х; д), зависящее от неизвестного параметра д с областью изменения Оо, являющейся подобластью области О всех возможных значений параметра д, то будем вместо записи о(Р(х)) употреблять запись о(д), предполагая при этом, что д е Оо. Пусть теперь справедлива конкурирующая гипотеза Нь но выборка Хы ...,Х„ попала в допустимую область Игл и мы приняли основную гипотезу Но.
Тогда мы имеем дело с ошибкой второго рода. Вероятность ошибки второго рода д' носит название оперативной характеристики критерия. Однако обычно в статистике предпочитают иметь дело с мощностью критерия д = 1 —,д' (т. е. вероятностью того, что при справедливой конкурирующей гипотезе Н1 мы ее примем), задаваемой формулой ,д = Р((Хы..., Х„) Е И;) = ~ Р(г,) "Р(х„) в дискретном случае и ,3 = Р((Хы..., Хь) е И;) = ~...~р(х~)" р(хь) г)хш дхь в непрерывном, где так же, как н при определении уровня значимости, суммирование или интегрирование ведется по всем (хы..., х„) Е И'„ однако ряд распределения Р(х) или плотность распределения р(х) берутся при условии справедливости конкурирующей гипотезы Нь Разумеется, в случае сложной гипотезы Н1 мощность,З =,3(Г(х)) будет зависеть от реального теоретического распределения Р(х) из подмножества У~.
Если конкурирующая гипотеза Но параметрическая, то вместо д(Г(х)) будем писать,д(д), считая при этом, что д Е Оы где 01 область изменения неизвестного параметра д при условии справедливости гипотезы Нь 210 Гм 3. Проверка статистилеских гипотез Таким образом, и уровень значимости, и мощность критерия задаются одной н той же формулой и их различие состоит в том, что уровень значимости о(Г(л)) определяется только для теоретических функций распределения Г(х), принадлежащих подмножеству Уо, а мощность ДГ(х)) — подмножеству Ун Впрочем, иногда эти два понятия объединяют в одно, называя Функцией мощности критерия,З = — о(Г(х)) величину, равную уровню значимости о(Г(ю)) при Г(л) е Уо и мощности 3(Г(к)) при Г(к) е Гн Отметим, что уровень значимости и оперативная характеристика критерия могут иметь совершенно разную физическую природу.
Так, пропуск партии бракованных изделий влечет за собой, как правило, более тяжелые последствия, чем выбраковка партии годных изделий. Естественное желание каждого исследователя состоит в предоставлении ему такого критерия, который позволил бы как можно реже делать ошибки н первого и второго рода (в идеале — совсем не ошибаться!), т.е.минимизировал бы и уровень значимости ео и оперативную характеристику П( Но такое желание невыполнимо, поскольку требование делать реже ошибку первого рода влечет за собой увеличение допустимой области И'л, в то время как требование реже делать ошибку второго рода предписывает увеличить критическую область Игг.
Поэтому обьшно поступают следующим образом: фиксируют уровень значимости (как более важный с практической точки зрения) и среди нескольких критериев, имеющих заданный уровень значимости, предпочтение отдают более мощному. Остановимся на этом несколько подробнее. Назовем размером критерия оо максимальное значение вероятности ошибки первого рода при использовании данного критерия, т.е. сто =- зцр сх(Г(л)). Гцл)ЕУа Отметим, что в дальнейшем нам довольно часто оудут встречаться критерии, уровень значимости о(Г(к)) которых не зависит от конкретной функции распределения Г(л) (нз подмножества У~) и, естественно, совпадает с размером критерия оо.
В таких случаях мы будем говорить просто об уровне значимости, не связывая его с конкретным распределением Г(л), а в скобках писать «размер». Разномерно наиболее мощным критерием заданного размера оо будем называть критерий, имеющий среди всех критериев размера оо наибольшую мощность д =,3(Г(к)) при любом распределении Г(л) с Ун Равномерно наиболее мощные критерии существуют в крайне редких случаях, наиболее известными из которых являются случай простых гипотез Но и Н, и случай односторонней н двусторонней параметрических гипотез для некоторых однопараметрических семейств Г(к; д) (см. параграфы 2 и 3 данной главы). В ряде задач, хотя и не существует равномерно наиболее мощный критерий, можно построить равномерно наиболее мощный несме- К Стаглнетичееказ гилотегш Критерий 211 щенный критерий.














