05_1 Проверка гипотезы о равенстве средних (Лекции), страница 2
Описание файла
Файл "05_1 Проверка гипотезы о равенстве средних" внутри архива находится в следующих папках: Лекции, Матстат 2 конспект. Документ из архива "Лекции", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Онлайн просмотр документа "05_1 Проверка гипотезы о равенстве средних"
Текст 2 страницы из документа "05_1 Проверка гипотезы о равенстве средних"
Cравнение нескольких дисперсий нормальных распределений для выборок различного объема
Критерий Бартлета: для нес. С.в. х1, х2…х l получены выборки с разл. V n1, n2…n l . По ним найдены оценки дисперсии S21, S22…S2l.
M0: D1=D2=…De.
ki=ni –1 – числа степеней свободы
- средневзвешенная всех исправленных дисперсий
Если V всех выборок ni≥4, то с.в. В приблизительно подчиняется распр-ю Х2 с числом степеней свободы l-1.
Порядок проверки:
-
по выборкам Внабл (ф-ла 18)
-
по таблицам крит. точек распред-ия Х2 Х2 кр (α, k, l-1)
3. Внабл > Х2кр гипотеза отвергается;
Внабл < Х2кр гипотеза принимается
Критерии согласия
Критерии согласия наз-ся критерий для проверки гипотезы о виде з/п-на распределения. Критерии Пирсона, Ромнаовского, Колмогорова.
-
Критерий Пирсона
При построении з-на распределения по опытным данным варианты группируются по повторяемости (для дискретных с.в.) или по-интервально (для непрерывных с.в.). При проверке гипотезы о виде з/п-на распред-я по ф-лам предполагаемого з-на подсчитываются вер-ти рi попаданий в полученные группы. Имея вер-ти подсчитываем теоретические частоты попаданий в эти группы.
Экспериментальные частоты сравниваются с теоретическими по критерию Пирсона.
Критерий Пирсона приблизительно имеет распр-ние Х2 (при n>10). По таблицам находим X2кр(α,к), где α – уровень зависимости, к – число степеней свободы.
, где S – число групп , κ – число параметров распределения, оцениваемых по выборке.
Замечания: если при группировке появляются малочисленные группы , то их надо объединять с соседними группами. В этом случае S – число объединенных групп.
Например:
xi | 0 | 1 | 2 | 3 | 4 | 5 |
ni | 75 | 41 | 12 | 4 | 2 | 1 |
83.5 | 54.2 | 8.3 | 3.1 | 1.5 | 0.7 |
-
Критерий Колмагорова.
Сравнивается эмпирическая функция распределения F*(x), построенная по выборке и теоретическая F(x), построенная по формулам предполагаемого закона. Если различия между ними значимо, то гипотеза отвергается , незначимо – принимается. Мерой отклонения этих функций служит разница их значения в экспериментальных точках xi.
F*(x)
F(X)
1
x1 x2 x3 x4
Для каждой xi записывается значение предела справа и предела слева F*(x-0), F*(x+0).
Подсчитываем теоретическую функцию F(x) и выбираем большую из разностей между ними Δi:
xi | F*(x-0) | F*(x+0) | F(x) | Δi |
2.3 | 0 | 1/n=0.1 | 0.05 | 0.05 |
3.7 | 1/n=0.1 | 2/n=0.2 | 025 | 015 |
n=10
Среди всех Δi выбираем максимум и сравниваем с критическим значением ε(α,n), которые находятся по таблице критических точек распределения Колмагорова.
Замечание: в критерий Колмагорова параметры распределения предполагаются уже известными, они не оцениваются по выборке.
ИНСТРУКЦИЯ К ЛАБОРАТОРОЙ РАБОТЕ № 4
Статистическая проверка статистических гипотез
Статистической гипотезой называется гипотеза (предположение)
о виде закона распределения или о параметрах распределения.
В лабораторной работе № 4 проверяются гипотезы о параметрах распределения. Гипотезы о виде закона распределения проверяются в лабораторных работах № 5, 6, 7.
Основные понятия и определения
Выдвигаемая гипотеза, которую предстоит проверять, называется нулевой гипотезой и обозначается H 0 .
Гипотеза , которая противоречит H 0 , называется альтернативной или конкурирующей и обозначается H 1.
Источником информации при проверке любой гипотезы служит только выборка { x 1 , x 2 , x 3 , . . . , x n } и ничего больше. Схема проведения такой проверки такова: по значениям x i подсчитывается некоторое число K, которое называется критерием и по величине этого числа судят от том, принимать эту гипотезу или не принимать. Так как числа x i случайны, то и критерий K тоже величина случайная.
При некоторых значениях критерия гипотезу принимают, при некоторых отвергают. Все значения K, при которых гипотезу принимают, образуют область принятия гипотезы. Значения K, при которых H 0 не принимают, образуют критическую область.. Точки, отделяющие одну область от другой - критические точки (Kкр)
В зависимости от решаемой задачи критическая область может быть двусторонней, правосторонней или левосторонней. В соответствии с этим критических точек может быть две или одна .
Проверяется любая гипотеза по вошедшим в выборку случайным значениям x i . При этом возможны ошибки.
Если гипотеза H 0 верна, а мы ее отвергли, так как подсчитанное по выборке значение критерия (его называют наблюдаемым значением K набл ) попало в критическую область, то это ошибка первого рода. Вероятность ее называют уровнем значимости и обозначают . Желательно, чтобы эта вероятность была как можно меньше .
Если гипотеза H 0 неверна, а мы ее приняли, так как Kнабл попало в область принятия гипотезы, то это ошибка второго рода. Ее вероятность обозначают .
Если известен закон распределения случайной величины K, то по известным правилам можно подсчитать вероятность ее попадания в любую область, в том числе и в критическую область . Приравнивая эту вероятность заданному числу , можно установить связь между и K кр . Для каждого рассматриваемого здесь критерия существуют таблицы, по которым можно найти K кр по заданному . Обычно задают уровень значимости равным 0,01; 0,05 или 0,1.
Формула для расчета критерия зависит от того, какая гипотеза проверяется. Каждой гипотезе соответствует свой критерий, так что существует достаточно большое количество различных критериев. Более того, иногда для решения одной и той же задачи создано несколько критериев.
Порядок действий по проверке любой гипотезы
-
Выбирают критерий, соответствующий данной задаче.
-
По выборке подсчитывают наблюдаемое значение критерия
Kнабл;
-
По соответствующим таблицам находят критическое значение критерия K кр , характеризующее критическую область;
-
Если Kнабл попало в критическую область, гипотезу H 0 отвергают, если нет - гипотезу принимают.
Дальше перечислены некоторые часто встречающиеся гипотезы и записаны критерии, по которым их нужно проверять.
Заданы 6 выборок различного объема: для Х1 и Х 2 объемом 20, для Х3 , Х4 , Х 5 объемом 15, и для Х 6 объемом 10. В предположении, что это выборки из нормальных распределений, необходимо
проверить следующие гипотезы:
1. Для Х2 и Х 5 гипотезу о равенстве дисперсий.
2. Для Х3 , Х 4 , Х 5 гипотезу об однородности дисперсий.
3. Для Х1 , Х 4 , Х 6 гипотезу об однородности дисперсий.
4. Для Х2 гипотезу о равенстве дисперсии предполагаемому
значению.
5. Для Х2 , Х 4 гипотезу о равенстве средних при известных
дисперсиях.
6. Для Х1 , Х3 гипотезу о равенстве средних при неизвестных
дисперсиях.
7. Для Х5 гипотезу о равенстве математического ожидания
предполагаемому значению при известной дисперсии.
8. Для Х6 гипотезу о равенстве математического ожидания
предполагаемому значению при неизвестной дисперсии.
9. Для Х3 и Х5 гипотезу о равенстве математических
ожиданий при условии, что выборки зависимы.
Как это сделать в EXСEL
-
Найти файл «ЛР № 4 трафарет. xls » и скопировать его в свою папку .
Переименовать файл, заменив слово "трафарет" на свою фамилию.
-
Ввести свою группу и фамилию.
-
В столбцы J : O занести свои варианты исходных данных в соответствии с заданием №4 ( стр. 44).
-
В ячейки строк 31 и 32 занести из своего варианта задания предполагаемые значения математического ожидания и дисперсии, необходимые для некоторых гипотез.
-
В ячейках строки 24 подсчитать объемы выборок ni .
«Мастер функций », категория «Статистические », функция СЧЕТ.
Дать ячейкам имена (например, "объем1", "объем2",....или NN1 и т.д.).
-
В ячейках строки 25 подсчитать числа степеней свободы ki = ni -1.
-
В ячейках строк 25, 26, 27, 28 подсчитать числовые характеристики выборок: средние (функция СРЗНАЧ), дисперсии (функция ДИСПР), стандартные отклонения, исправленные дисперсии и исправленные стандартные отклонения. Всем ячейкам присвоить соответствующие имена.
1. Äëÿ âûáîðîê Õ2 è Õ 5 ïðîâåðèòü ãèïîòåçó î ðàâåíñòâå äèñïåðñèé
Гипотеза о равенстве дисперсий двух нормальных распределений:
Проведены опыты над двумя нормальными случайными величинами X и Y. Для каждой из них получены выборки :