XVII Математическая статистика (1081432), страница 44
Текст из файла (страница 44)
Это сдерживало их применение, хотя многие из них появились еще в 1930-1940-е годы. Однако после появления компьютеров положение изменилось, и теперь во всех наиболее распространенных пакетах прикладных статистических программ реализованы и непараметрические процедуры. 9.1. Одновыборочная задача о сдвиге Выше (см. 2) рассмотрена задача оценивании математического ожидания случайной иеличины Х ° И(~ы,ол) по данным случайной выборки Хм ..., Х„из ее еенеральной совокунносгни. Что делать, если предположение Х.
Ж(р,~тз) не выполняется? 368 9. НЕПАРАМЕТРИЧЕСКИЕ МЕГОДЫ СТАТИС ГИКИ Например, в примере 4.26 предполагается, что продолжительность времени работы лампы до отказа распределена по нормальному закону. Между тем „время жизни" различных технических устройств обычно описывается не нормальным, а другими распределениями, н прежде всего экспоненциальным'. Можно привести ряд других примеров, когда возникающие при решении практических задач непрерывные случайные величины не имеют нормального распределения, и, следовательно, методы проверки статистических еииопиз о математическом ожидании, изложенные в примерах 4.10 — 4.14, для них не применимы.
Все эти задачи можно описать следующей схемой. Пусть е1, ..., е — последовательность независимых одинаково распределенных с нулевым математическим ожиданием ненаблюдаемых случайных величин, которые можно интерпретировать как случайные о~аибни наблюдений некоторой неслучайной величины В. В этом случае простейшая нате.иатичеснал модель наблюдений может быть представлена в виде Х;=В+с;, 1=1,и, ВЕ1й, (9.1) где случайные величины Хы ..., Х„являются независимыми и имеют один и тот же закон распределения, т.е. их совокупность можно рассматривать как случайную выборку из генеральной совокупности некоторой случайной величины Х с математическим ожиданием В (если оно существует).
Рассмотрим задачу проверки статистической гипотезы (9.2) Но. В=Во при одной из альтернативных гипотез Ню. В<Во, Нз. В>Во, Нз: ВфВо (9.3) по данным случайной выборки Хы ..., Х„, где Во — некоторое известное значение параметра В. Предположим, что при различных значениях параметра В функции распределения г'(х;В) 'Сил Гнеденко В.Б., Бвллвв Ю.К., Соловьев А.Д. 9. Ь Одвовыеорачвав эадача о сдвиге и плотности распределения р(л; д) каждого элемента Х;, г = 1, и, случайной выборки отличаются сдвигом на величину д.
Тем самым параметр д, не изменяя формы графиков функций г'(л;д) и р(я;д), определяет их положение на плоскости (рис. 9.1). Рмс. 9.1 Как правило, д совпадает с математическим ожиданием случайной величины Х;, а при его отсутствии — с медианой нли модой. Поэтому задачу (9.2)-(9.3) называют одповыборочмоб эодочеб о сдввее. Если независимые случайные величины еы ..., е„распределены по нормальному закону с нулевым математическим ожиданием и неизвестной дисперсией сгз, то, согласно (9.1), случайные величины Хы ..., Х„также являются независимыми, причем Х; Ф(д,ол), 1= 1, и. Таким образом, закон распределения случайной выборки Хм ..., Х„известен с точностью до параметров, и мепюд проверки статистической гипотезы (9.2) будет параметрическим (см.
пример 4.14). Предположим теперь, что о плотности распределения вероятностей независимых одинаково распределенных случайных величин е;, г = 1, и, известно лишь то, что она является четной функцией. Оказывается, что даже в такой общей постановке существуют простые методы проверки статистических гипотез о параметре д и оценивания этого параметра. Остановимся на двух наиболее распространенных из этих методов. Критерий знаков.
Обозначим через Ко множество функций распределения непрерывных случайных величин, имеющих единственную медиану, которая расположена в точке 0: За- 370 9. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ метим, что функция распределения случайной величины Х ° Ф(0,аз) принадлежит множеству IСа, и поэтому предлагаемый ниже критерий знаков применим и для решения задач, традиционно решаемых параметрическими методами. Предположим, что Хд, ..., Մ— случайная выборка из генеральной совокупности случайной величины Х с функцией распределения г (х;д) = Р(х — д), Р Е 1Св.
Рассмотрим задачу проверки статистической гипотезы Нд (9.2) при альтернативной гипотезе НА одного из видов (9.3). Как и для проверки любой статистической гипотезы (см. 4) гипотезу На естественно отклонить в пользу альтернативной гипотезы Нд, если в результате случайного эксперимента наблюдается некоторое случайное событие, появление которого „практически невозможно" при истинности Но и вероятность появления которого „достаточно велика", если верна Нд.
Построение статистическохо критерия проверки Нв при альтернативной гипотезе Нд и заключается в выборе такого события. Одним из событий, появление которого „практически невозможно" при истинности Но, является появление очень большого количества чисел одного знака в последовательности Хд — Вв, ..., Մ— ро, или, что то же самое, в последовательности Х1П вЂ” Ио1 "и Х1в1 — дои (9 4) где Х1д1, ..., Х1„1 — вариациоииыдд рлд случайной выборки х, ..., х„. Действительно, г'(х;д), как и всякая функция распределения, является неубывающей, а из единственности медианы следует, что в окрестности нуля она строго возрастает. Поэтому при д > до Р (Х; < до) = Е(до, д) = Цдо — Ц <— 1 2' анри 9<да Р(Хд > ддо) =1 г(до и) < 1 2 371 ц Ь Одвовыборочнаа эадача о сдвиге Отметим, что распределение случайных величин Хм ..., Х„ определено функцией г'(х;д) и зависит от параметра 9.
Во избежание путаницы здесь и в дальнейшем вероятность различных событий, порожденных случайной выборкой Хм ..., Х„, будем обозначать символом Ра, где индекс В явно указывает на эту зависимость. Итак, если верна альтернативная гипотеза Нд, то при Нд = Н1 большинство чисел последовательности (9.4) должны быть положительными, при Нд = Нэ — отрицательными, а при Нд = Но количество положительных и отрицательных чисел должно быть приблизительно равным, так как в этом случае 1 Р (Х, > Оо) — Рв(Х, < до)— Именно зто свойство наблюдений н лежит в основе критерия знаков. Определим случааную величину (9.5) где П(1) — функция Хевисайда, а т Е ль — фиксированный параметр.
Случайная величина Б(т) принимает свои значения л(г) на множестве целых чисел в диапазоне от 0 до и. Очевидно, что ее закон распределения зависит и от т, и от истинного значения параметра д функции распределения г'(х;В) случайной величины Х. Можно показать, что распределение случайной величины Х; — т, 1 = 1,п, зависит только от разности  — т. Поэтому от разности  — т будет зависеть и распределение случайной величины Б(т). Следовательно, если о — истинное значение параметра функции г'(х;д), то закон распределения сгпагписшики Б Я не зависит от д. Обозначим символом л квантиль уровня 7 (О < 7 < 1) распределения случайной величины Б(до) при условии, что верна 372 н ненАРАметрические метОДы стАтистики гипотеза Но.
Другими словами, в определяется как решение уравнения Рв, (Я(Во) < вч ) = 'у, О < 'у < 1. (9.6) Заметим, что случайная величина Я(до) дискретна, позтому решение в уравнения (9.6) для некоторых 1 может не существовать. Статистику Я(до) называют скзатвкскзекой кригаерил зкаков для задачи (9.2) — (9.3), а сам криткереб зкаков уровня о определяют следующим образом: гипотеза Но отклоняется в пользу альтернативной гипотезы НА (зто одна из гипотез (9.3) ) на уровне значимости о, если: в) в(до) )~ в1 ~ в случае НА = Н~ ~ б) в(оо) < в~„в случае НА = Нг', в) в(до) < в,„уз или в(до) 3 в1 (з в случае НА = Нз. Смысл критерия знаков прозрачен.
Из (9Л) следует, что значение в(до) статистики 5(до). — зто количество положительных чисел в (9.4). Если в(до) приблизительно равно п/2, т.е. количество положительных чисел приблизительно равно количеству отрицательных, то разумно принять Но. Если же в(до) близко к и, т.е. почти все числа положительные, то Но естественно отклонить в пользу Н1. Малые значения в(до) говорят о том, что, по-видимому, верна альтернативная гипотеза Нз. И наконец, если статистика 5(Во) принимает значения, существенно отличающиеся от о/2, Но следует отклонить в пользу Нз. Конечно же, для практического использования критерия необходимо уметь находить квантили в, т.е. знать распределение статистики 5(до) при истинности статистической гипотезы Но. Ответ на зтот вопрос дает следующая теорема.