05_2 Проверка гипотез о параметрах (Лекции)
Описание файла
Файл "05_2 Проверка гипотез о параметрах" внутри архива находится в следующих папках: Лекции, Матстат 2 конспект. Документ из архива "Лекции", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Онлайн просмотр документа "05_2 Проверка гипотез о параметрах"
Текст из документа "05_2 Проверка гипотез о параметрах"
Статистическая проверка статистических гипотез
Статистической наз. Гипотеза о виде з-на распределения или о параметрах распределения.
Проверять справедливость гипотезы можно только по выборочным данным. С. данные, вошедшие в выборку. Подсчитанные по ним величины тоже случайны.
Статистическим критерием К наз. С.в., служащая для проверки гипотезы (это ф-ла, зависящая от хi ):
К=К(х1,х2…хn) - (1)
Нулевой гипотезой М0 наз.выдвинутая гипотеза, кот. Нужно проверить ( напр.: с.в. – норм с mx=2.5, σx=3.1 ) Конкурирующей или альтернативной наз. Гипотеза, противоречащая М0, М1 (mx≠2.5, σx>3,1).
Проверка гипотезы производится след.образом: по выборке подсчитывают значение К наблюдаемого и по его величине решают, принять гипотезу или нет.
Те значения К, при кот. Гипотеза принимается, образуют область принятия гипотезы; при кот. Отвергается – критическую область. Точки, разделяющие эти области, наз-ся критическими точками.
В зависимости от гипотезы и критерия критические области бывают:
-
Д вусторонняя Кср лев Ксрправ К
-
П равосторонняя Кср К
-
Л евосторонняя Кср К
Критерий – с.в. и при проверке гипотезы возможны случайные ошибки.
-
М0 верна, но мы ее отвергаем, т.к. кнабл попал в критическую область. Это ошибка 1-го рода.
P(ош I рода) =α (2)
-
М0 неверна, но мы ее принимаем , т.к. Кнабл попал в область принятия гипотезы. Это ошибка П-го рода.
P(ош П рода) =β (2)
Для проверки гипотезы можно предложить разные ф-лы. Лучшей из них считают ту, кот. Позволяет принять М0 , если она верна, и отвергнуть М1 , если она неверна.
Мощностью критерия наз-ся вер-ть принять гипотезу М0, если она верна.
М=P(М0 верна и принята) = 1-β (4)
Вер-ти α и β стараются сделать как можно меньше.
Проверка гипотезы о равенстве мат.ожиданий
двух нормальных распределений
Ставились опыты над двумя норм.с.в. Хi . Получены две выборки разного V:
(х1,х2…хn) n
(y1,y2…ym) m
По ним подсчитаны средние. Например, =12,5 и =14,1.
Гипотеза М0: mx=my (различие средних незначимо)
М1: mx≠my (различие средних значимо)
Построим критерий для проверки гипотезы К:
Чем больше разность между и , тем больше шансов, что гипотезу нужно отвергать; если эта разница небольшая, то гипотезу принимаем. Чтобы исключить влияние разброса и , ввели в знаменатель величину, характеризующую этот разброс. Найдем з-н распр-я критерия К:
-
Теоретические Dx и Dy известны:
D[ - ] = D[ ] + D[ ] = D[ ] + D[ ] =
Если дисперсии известны, то знаменатель критерия (5) – постоянное число.
= все хi – нормальные - нормальная
= все yi – нормальные - нормальная
- - нормальная , а значит и К имеет нормальное распределение.
Найдем параметры этого распределения:
Критерий К имеет норм. Распред-ие с Dk =1 и mk =
Dk =1
Пусть гипотеза M0 верна (mx=my) , тогда mk =0, Dk =1. Тогда критерий К имеет стандартное норм. распред-е Z.
Z
Критерий для проверки гипотезы о равенстве мат.ожиданй при известных дисперсиях
= (8) –
f(z) f(z)
z
-zкр zкр
область принятия
двусторонняя критическая область
Если гипотеза верна, а мы ее отвергаем из-за того, что z набл. Попала в критическую область, то мы совершаем ошибку 1-го рода. Ее вер-ть =α. Посчитаем ее вер-ть и приравняем к α.
Р(/z/> zкрит) = 1-2Ф (zкрит)
1-2Ф (zкрит) =α (9)
Ф-ла (9) позволяет найти крит.точку, если задан уровень значимости α.
2Ф (zкрит) =1-α
Ф-1(x) – обратная ф-ии Лапласа
Порядок проверки гипотезы:
-
по таблице ф-ции Лапласа по заданному уровню значимости α (0,1; 0,01; 0,05) находят Zкрит (ф-ла 10);
-
если /Zнабл /> Zкрит , то гипотезу М0 отвергаем;
если /Zнабл/< Zкрит, , то гипотезу М0 принимаем (имеющиеся данные не дают основания ее отвергать).
Вероятность ошибки II-го рода: Пусть гипотеза M0 неверна и на самом деле mx≠my, тогда z-критерий имеет нормальное распределение, но математическое ожидание ≠0.
F(z)
mz≠0
вероятность того, что m0 принимаем =β
вероятность ошибки 1-го рода =α
По заданному α находим z кр. Если α уменьшить, то z кр будет сдвигаться вправо, но одновременно будет возрастать β – вероятность ошибки 2-го рода. И наоборот, уменьшая β, увеличиваем α. Уменьшать обе площади вместе можно только, отодвигая график f(z) вправо, т.е. увеличивая mz. Увеличить mz можно только увеличивая объемы выборок n и m. При этом количество обрабатываемой информации увеличивается и выводы становятся более достоверными, т.е. вероятность ошибки уменьшается.
-
Дисперсии неизвестны, но равны.
-Ткр Ткр
Порядок проверки гипотезы:
-
по выборке находим Тнабл (ф-ла 11)
-
по таблице крит. точек распределения Стьюдента находим Ткр(α,β); к – число степеней свободы; к=m+n-2;
Замечание 1:Т – критерием можно пользоваться не только для нормального распределения, но и для выборок большого объема.
Замечание 2:Т – критерием можно пользоваться если дисперсии равны. Предварительно надо проверять гипотезу о равенстве дисперсий (по критерию Фишера).
Проверка гипотезы о равенстве математического ожидания нормального распределения предполагаемому значению.
Для с.в. Х получена выборка (х1, х2 ..хn). Найдено ( =13,2; а=15)
-
Dx известна.
Порядок проверки:
если |Zнабл|< Zкрит, , то гипотезу принимаем
-
Dx неизвестна.
Порядок проверки:
-
Tнабл (ф-ла 13)
-
по таблицам Tкр (α, К)
-
если |Tнабл |> Tкрит , то гипотезу отвергаем;
если |Tнабл|< Tкрит, , то гипотезу принимаем
Сравнение мат.ожиданий двух нормальных распределений с неизвестными дисперсиями (для малых зависимых выборок)
Выборки для Х и Y зависимы, когда измерения одних и тех же объектов проводятся разл.методами.(например, расчеты, проведенные по одной и той же методике, но разл.подразделениями; измерения над разл. объектами одними и теми же людьми или на одной и той же аппаратуре и т.д.). В рез-те таких измерений получаем разл.выборки одинакового V:
Xi | X1 | X2 | …. | xn |
Yi | Y1 | Y2 | … | ym |
di = xi - yi
Проверка выполняется по критерию Стьюдента (ф-ла 13).
Проверка гипотезы о равенстве дисперсий двух нормальных распределений.
По двум выборкам для с.в. X и Y найдены оценки для дисперсии:
1 Fкр
Порядок проверки гипотезы:
-
по выборке Fнабл (ф-ла 15)
-
по таблице критических точек распределения Фишера находим Fкр(α;k1,k2). k1=nбольшее-1,k2=nменьшее-1;
Fнабл<Fкрит гипотезу принимаем.
Сравнение выборочной дисперсии
предполагаемым значением.
Для с.в. Х получена выборка, по которой найдена точная оценка для дисперсии Sx2.
Гипотезу проверяем по критерию Х2.
Х2
f(x)
(Х2кр)лев n-1 (Х2кр)пр x
Различные варианты альтернативной гипотезы:
0 (Х2кр)лев (Х2кр)пр
Х2набл< (Х2кр)лев <(Х2кр)пр M0 отвергаем
Проверка гипотезы о равенстве дисперсий
нескольких нормальных распределений.
Критерий Коглена ( выборки одинакового объема): для нескольких с.в. х1, х2…х е получены выборки одинакового объема n. Для каждого найдены S21, S22…S2e. Проверяется гипотеза об однородности дисперсии M0: D1=D2=…De.
Порядок проверки:
-
по выборке Gнабл (ф-ла 17);
-
по таблицам крит. Точек распред-ия Когрена Gкр (α, k, l)
3. Gнабл > Gкр M0 отвергается;
Cравнение нескольких дисперсий нормальных распределений для выборок различного объема
Критерий Бартлета: для нес. С.в. х1, х2…х l получены выборки с разл. V n1, n2…n l . По ним найдены оценки дисперсии S21, S22…S2l.
M0: D1=D2=…De.
ki=ni –1 – числа степеней свободы
- средневзвешенная всех исправленных дисперсий
Если V всех выборок ni≥4, то с.в. В приблизительно подчиняется распр-ю Х2 с числом степеней свободы l-1.
Порядок проверки:
-
по выборкам Внабл (ф-ла 18)
-
по таблицам крит. точек распред-ия Х2 Х2 кр (α, k, l-1)