Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 22
Текст из файла (страница 22)
В то же время, чем больше значение p, тем больше108вероятность этого события. Так, при p = 0.9 P (S 7 | H3 ) = 0.9872.Поэтому разумно именно с помощью этого события судить о справедли"вости H — если альтернативой к H выступает H1 : p > 1/3.Предположим, что мы провели обсуждаемый эксперимент и получи"ли для S конкретное значение.
Обозначим это наблюденное значениекак Sнабл. , чтобы отличать случайную величину S от ее реализацииSнабл. . Пусть, к примеру, Sнабл. = 7. Тем самым осуществилось собы"тие {S 7}. Поэтому мы отвергаем гипотезу H : p = 1/3 на уровнезначимости 0.02 в пользу альтернативы H1 : p > 1/3.Упоминание уровня значимости в заключительном решении суще"ственно — от его величины зависит, отвергаем мы гипотезу или нет.Пусть, например, ε = 0.005. Тогда критическое множество есть {S 8},и опыт, в котором Sнабл. = 7 не отвергает гипотезу H : p = 1/3 на уровнезначимости 0.005 против альтернативы H1 : p > 1/3.можно заранее указать направление изменения p при отступлении отH0 , приходится рассматривать альтернативу вида H : p = p0 . Руковод"ствуясь изложенными принципами проверки статистических гипотез ихарактером изменения распределения вероятностей между возможны"ми значениями S (числом успехов) при разных p, мы заключаем, что вданном случае следует отвергнуть гипотезу H0 и тогда, когда Sнабл.
не"правдоподобно велико, и тогда, когда оно неправдоподобно мало. Напо"мним, что все эти вероятности вычисляются так, как это предписываетпроверяемая гипотеза H0 .Следовательно, надо выбрать два критических значения для S, аименно верхнее и нижнее, скажем, x и y. Выбрать их необходимотак, чтобы P (S y | H0 ) + P (S x | H0 ) была малой. Гипотеза H0отвергается, если Sнабл. y, либо Sнабл. x. Уровень значимости этогокритерия есть P (S y | H0 ) + P (S x | H0 ).Выбор уровня значимости всегда произволен.
Неприятно, что отэтого произвола зависит решение — отвергнуть или нет гипотезу. Вданном примере (и во многих других случаях) есть более гибкий способдействий — указать минимальный уровень значимости, на которомможно отвергнуть гипотезу.Критическое событие в нашей задаче имеет вид {S C}, где C —некоторое критическое значение. Чем больше число C, тем менее ве"роятно при гипотезе H событие {S C}. Тем больше поэтому уверен"ность, что H надо отвергнуть, если Sнабл.
C. Наибольшей достижимойуверенности соответствует наименьший возможный уровень значимо"сти, который в нашей задаче есть P (S Sнабл. | H).Наименьший уровень значимости полезно вычислять во всех случа"ях, так как он характеризует, насколько сильно наблюденное значениеSнабл. противоречит гипотезе H.Замечание. Обычно описанное правило оформляют несколько иначе, следяза отклонением наблюдаемого S от его ожидаемого значения np0 . Напомним, чтоматематическое ожидание числа успехов в схеме Бернулли равно M S = np0 .С помощью таблиц выбирают число z так, что вероятность P (|Snp0 | z | H0 )оказывается малой.
Гипотезу H0 : p = p0 отвергают, если |Sнабл. − np0 | z.В этом случае статистикой критерия служит уже не S, а |S − np0 |. Здесьтакже можно вычислять минимальный уровень значимости, на котором можноотвергнуть H0 : p = p0 против двусторонней альтернативы p = p0 . Он равенP (|S − np0 | |Sнабл. − np0 | | H).Виды альтернатив. В примере испытаний Бернулли, которые обсу"ждались выше, разумный класс альтернатив к гипотезе H : p = 1/3 былопределен как p > 1/3. Такие альтернативы называют односторонними (в данном случае, правосторонними).
Встречаются статистическиезадачи и с левосторонними альтернативами. Основную гипотезу в этомслучае приходится отвергать, если успехов в опыте зарегистрированонеестественно мало с точки зрения гипотезы H. Иначе говоря, крити"ческое множество A имеет вид A = {S C}, а число C выбираетсятак, чтобы P (S C | H) была малой.Наиболее общими альтернативами являются двусторонние альтер"нативы. Пусть основная (нулевая, как часто говорят) гипотеза имеетвид H0 : p = p0 , где p — некоторое определенное число.
Если невоз"1093.4.2. ƒ… … На изложенном выше способе проверки статистических гипотез всхеме Бернулли основан широко распространенный критерий знаков.Для его применения достаточны очень слабые предположения о законераспределения данных, такие как независимость наблюдений и одно"значная определенность медианы. Напомним, что медианой распреде"ления случайной величины ξ называется такое число θ, для которогоP (ξ < θ) = P (ξ > θ) = 1/2.Предположим, что в результате многочисленных измерений арте"риального кровяного давления у пациентов некой поликлиники былоустановлено его медианное значение θ.
Эти измерения возобновилисьпосле летних отпусков. У первых N пациентов были зарегистрированызначения давления крови x1 , . . . , xN . Можно ли считать, что медианныйуровень давления понизился после летнего отдыха?Как обычно, проще проверить гипотезу о том, что значение медианыθ не изменилось. При этом надо рассматривать только односторонниеальтернативы — в данном случае, левосторонние (как будет описано110ниже). Если гипотеза будет отвергнута, это будет означать положитель"ный ответ на поставленный выше вопрос.Проверка этой гипотезы с помощью критерия знаков проводитсяследующим образом. Рассмотрим случайную величину X − θ. Так как,согласно гипотезе, med X = θ , то P {(X − θ) > 0} = P {(X − θ) < 0} =1/2.
В выборке xi − θ, i = 1, . . . , N , подсчитаем число положительныхразностей и обозначим его через S. Для формализации этого алгоритмаудобно ввести функцию1,при x > 0,s(x) =0,при x < 0.NТогда S =i=1 s(xi − θ). Случайная величина s(x) принимает двазначения: 0 и 1. Согласно выдвинутой гипотезе, вероятность каждого изэтих значений равна 1/2.
Таким образом, видно, что задача сводится ксхеме испытаний Бернулли, в которой через S обозначено число «успе"хов», и следует проверить гипотезу H : p = 1/2. В нашем примере надорассматривать левосторонние альтернативы, но вообще альтернативымогут быть как односторонними, так и двусторонними, в зависимостиот решаемой задачи.Отметим важное обстоятельство в приведенном примере. Гипотезао значении медианы случайной величины, выдвинутая нами первона"чально, не определяла однозначно закон распределения X, и тем са"мым не позволяла вычислить вероятность произвольных значений X.В связи с этим мы были вынуждены перейти к случайной величинеs(x − θ), которая задает только знак разности x − θ.
При этом веро"ятностное распределение s(x − θ) определяется уже однозначно. Из"ложенный критерий получил название критерия знаков, так как онработает фактически только со знаками преобразованных некоторымобразом случайных величин. Этот критерий хорош именно тем, что тре"бует очень немногого от функции распределения случайной величиныи очень прост в применении.3.5. ƒ … ƒОбласть применения. Рассмотрим часто встречающуюся на прак"тике задачу сравнения двух выборочных совокупностей.
В духе основ"ной статистической предпосылки мы будем рассматривать эти совокуп"ности как случайные. Например, нас может интересовать сравнениедвух методов обработки, т.е. двух разных действий, направленных к од"111ной цели: двух лекарств, двух рационов питания, двух методик обученияили профессиональной подготовки и т.д.Данные. Для исследования нужны однородные объекты, разде"ленные на две группы.
Взаимные влияния и взаимодействия объектовдолжны быть исключены. Для каждого объекта регистрируется некото"рая его числовая характеристика. Возникающие при этом две группычисел можно рассматривать как две независимые выборки.Постановка задачи. Рассмотрим вопрос о том, какие задачи целе"сообразно рассматривать при сравнении двух выборок. Вспомним, чтообычно две выборки получаются как характеристики двух обработок,то есть как результаты применения различных условий экспериментак двум группам однородных объектов. Опыт применения статистикипоказывает, что изменение условий эксперимента обычно сказывает"ся прежде всего на изменении положения распределения измеряемойчисловой характеристики на числовой прямой.
Масштаб и форма рас"пределения при малых изменениях условий эксперимента обычно оста"ются практически неизменными. При больших различиях в условияхэксперимента наряду с изменением положения распределения изменя"ется и его разброс (дисперсия). И совсем редко происходит измене"ние самой формы распределения. Поэтому при исследовании различийв двух выборках часто предполагают, что законы распределения двуханализируемых выборок отличаются только сдвигом, т.е.
принадлежатсдвиговому семейству распределений.Определение. Распределение G(x) принадлежит сдвиговому семейству распределений F , задаваемому распределением F (x), еслисуществует такая θ, что для любого x : F (x) = G(x − θ).Другими словами, если случайная величина ξ имеет распределениеF (x), то распределение G(x) случайной величины η принадлежит сдви"говому семейству F тогда и только тогда, когда для некоторого неслу"чайного числа θ распределения случайных величин η и ξ + θ совпадают.Для некоторых сдвиговых семейств (например, для семейства, поро"жденного нормальным распределением) построены весьма эффективныекритерии для проверки гипотезы H против альтернатив сдвига θ = 0(см., например, гл. 5).
Однако эти критерии предполагают, что F иG принадлежат определенному семейству, а поэтому могут давать не"правильные результаты при невыполнении этого условия. Другой класскритериев — непараметрические критерии, — не требует этого пред"положения. Такие критерии не зависят от распределений F и G (еслиэти распределения непрерывны), и эффективно работают при более ши"роком классе альтернатив. В частности, с их помощью можно найти112различия в случайных величинах при альтернативах F G и F G.Дадим определения этих понятий.Определение.
Мы говорим, что F G, где F и G — функциираспределения, если для любого числа x выполняется F (x) G(x).Мы говорим, что F G, если для любого числа x выполняетсяF (x) G(x).Смысл этого определения состоит в том, что при F G случайная величинаX, имеющая закон распределения F , имеет тенденцию принимать меньшиезначения, чем случайная величина Y с законом распределения G, т.е. длялюбого x выполняется P (X < x) P (Y < x).Методы.