В.Д. Мятлев, Л.А. Панченко, А.Т. Терехин - Основы математической статистики (1118816), страница 6
Текст из файла (страница 6)
Проверка гипотезы о равенстве математических ожиданийдвух независимых нормально распределенных случайных величин(двухвыборочный t-критерий)Предположим, что имеются случайные выборки х1, х2, ..., хп и y1, y2, ...,ym значений двух независимых нормально распределенных случайныхии требуется проверить гипотезувеличино равенстве математических ожиданий этих случайных величин.(а) Если известно, что дисперсии случайных величин x и h равны,(значениенеизвестно), то можно получить следующуюобъединенную несмещенную оценку дляВ этом случае s2/n и s2/m будут несмещенными оценками для дисперсиивыборочных средних и , а сумма s2/n+s2/m - несмещенной оценкой длядисперсии разности средних.
Соответственно, статистикакак можно показать, будет иметь t-распределение с n+m-2 степенямисвободы. Критическая область уровня для проверки гипотезыпротив двусторонней альтернативыбудет состоять из двухбесконечныхполуинтерваловиодносторонней альтернативыпротив альтернативы,против- из полуинтервала- из полуинтервала,,обозначают соответствующиераспределения с n+m-2 степенями свободы.33и, гдеквантили,t-(б) Если нет оснований считать, что дисперсии случайных величин x иh равны, то для каждой из дисперсийивычисляется своя оценкаи соответственно модифицируется статистика критериякоторая, как можно показать, имеет t-распределение с числом степенейсвободы, равным целой части от 1/k, где k выражается следующей формулой3.6.
Проверка гипотезы о равенстве дисперсий двух независимыхнормально распределенных случайных величин(двухвыборочный F-критерий)В предыдущем параграфе мы видели, что процедура проверкигипотезы о равенстве двух математических ожиданий двух нормальнораспределенных случайных величин упрощается, если их дисперсииодинаковы. Следующий критерий позволяет проверить нулевую гипотезуо равенстве дисперсий двух нормально распределенныхслучайных величин. В качестве статистики критерия используетсяотношение несмещенных оценок дисперсий этих случайных величинПри условии, что верна гипотеза H0, можно доказать, что статистикакритерия имеет F-распределение с n-1 и m-1 степенями свободы.Соответственно, критическая область уровнядля проверки гипотезыпротив двусторонней альтернативыбудет состоятьиз двух промежутков:и, где34-квантили порядкаиF-распределения с n-1 и m-1 степенямисвободы.
Для односторонней альтернативыкритическая областьимеет вид, а для альтернативы- соответственно. Если в качестве статистики использовать отношение большейоценки дисперсии к меньшей, то в качестве критической области придвусторонней альтернативе используется односторонняя критическая- это позволяет ограничиться таблицами Fобластьраспределения, содержащими значения функции распределения только дляаргументов больших единицы.Заметим, что в отличие от t-критерия F-критерий чувствителен котклонениям исходных случайных величин от нормальности.
Призначительных отклонениях от нормальности, особенно при небольшом численаблюдений его не следует применять.3.7. Приближенный критерий для проверки гипотезы о равенствепараметров двух независимых биномиальных случайных величин(критерий для сравнения двух вероятностей)Пусть две независимые биномиально распределенные случайныеис параметрами п,и m,, соответственно, привеличиныпроведении независимых испытаний приняли значения k и l. Требуетсяо равенстве параметровпроверить гипотезуможно использовать статистикугде,ии.
Для этого- выборочные частоты, вычисленные по первой, второй иобъединенной выборкам:и,. Если вернагипотеза H0, то для , , не очень близких к 0 или 1, и при достаточнобольших п, m эта статистика имеет приближенно стандартное нормальноераспределение. Практически приближение применимо, если каждая изчетырех численностей k, l, n-k и m-l больше пяти.Критическая область уровня значимостидля проверки гипотезыпротив двусторонней альтернативыдвухбесконечныхполуинтервалов35будет состоять изи,противодносторонней альтернативыпротиводносторонней- из одного полуинтервалаальтернативы-такжеизиодногополуинтервала, где,,, иобозначают квантилисоответствующего порядка стандартного нормального распределения.Имеется также точный критерий для проверки этой гипотезы (см.,напр., [3]).3.8.
Приближенный критерий для проверки гипотезыо равенстве параметров двух независимыхпуассоновских случайных величинПусть две независимые случайные величиныи, имеющиепуассоновское распределение с параметрамии , соответственно, припроведении испытаний приняли значения k и l. Требуется проверить гипотезуо равенстве параметровираспределений этих случайныхвеличин.
Для этого можно использовать статистикураспределение которой при выполнении H0 и при k+l>5 довольно точноприближается стандартным нормальным распределением. Соответственно,как и в предыдущем параграфе, критическая область уровня значимостидля проверки гипотезыпротив двусторонней альтернативыбудет состоять из двух бесконечных полуинтервалов, против односторонней альтернативыполуинтервала- из одногои против односторонней альтернативытакже из одного полуинтервалаи-.3.9. Приближенный критерий для проверки гипотезы о равенственулю коэффициента корреляции между компонентами двумернойнормально распределенной случайной величиныПусть (х1, y1), (х2, y2), …, (хп, yп) - случайная выборка пар значенийдвумерной случайной величины, имеющей двумерное нормальноераспределение.
Требуется проверить гипотезуо равенствекоэффициента корреляцииэтого двумерного распределения заданномучислу. Для проверки этой гипотезы можно использовать статистику36распределение которой при выполнении H0 и при достаточно большомn довольно точно приближается стандартным нормальным распределением.Соответственно, как и в предыдущих двух параграфах, критическая областьпротив двустороннейуровня значимости для проверки гипотезыальтернативыбудет состоять из двух бесконечных полуинтервалови, против односторонней альтернативы- изодного полуинтервалаи против односторонней альтернативы- также из одного полуинтервала.Обычно проверяется гипотеза о равенстве коэффициента корреляциинулю, что в случае двумерного нормального распределения, как ранееотмечалось, эквивалентно проверке гипотезы о независимости и .
В этомслучае приведенное выше выражение для статистики критерия упрощаетсяПример. Пусть объем выборки n=10, вычисленное по выборкезначение r=0.6альтернативыитребуетсяпроверитьгипотезупротив.Выборочное значение статистики u, вычисленное по формуле (5), равно1.83. Поскольку оно не выходит за двусторонние 5%-ные критическиепределы стандартного нормального распределения, то у нас нетоснований отвергнуть нулевую гипотезу об отсутствии корреляции. Если быу нас были основания предполагать, что корреляционная зависимость вслучае ее наличия может быть только положительной, то следовало быиспользовать для проверки H0, одностороннюю критическую область,которая дляпредставляет собой бесконечный полуинтервал.Значение 1.83 попадает в эту критическую область и, следовательно,гипотеза об отсутствии корреляции должна бы была быть отвергнута.Заметим, однако, что число наблюдений в данном примере недостаточновелико для уверенного использования данного приближенного критерия.Если к этому добавить тот факт, что выборочное значение статистикикритерия находится вблизи границы критической области, то следуетзаключить, что по имеющимся данным нельзя сделать надежного вывода нио наличии, ни об отсутствии корреляции.Отметим, что если бы, скажем, значение r=0.6 было получено дляn=50, то выборочное значение статистики u было бы равно 4.75, и гипотеза37однозначно должна бы была быть отвергнута не только на уровнезначимости 5%, но и 1% (и даже более высоком, т.к.
вероятность того, чтостандартно распределенная случайная величина примет значение большее4.75 равна 0.000001).3.10. Критерии согласияВсе рассмотренные до сих пор критерии принято относить к группетак называемых параметрических критериев. Применение этих критериевтребует знания типа распределения наблюдаемых случайных величин(нормальное, биномиальное, пуассоновское, двумерное нормальное иликакое-либо иное) и проверяемая гипотеза касается параметров данныхраспределений. Прежде чем применять параметрические методы,необходимо убедиться в том, что мы действительно имеем дело сраспределением требуемого типа.Предположение о виде распределения случайной величины – этостатистическая гипотеза, которую можно проверить с помощьюэкспериментальных данных.
Критерии, позволяющие решать такого родазадачи, называются критериями согласия – согласия выборочных данныхнекоторому наперед заданному теоретическому распределению.Пусть имеется выборка х1, х2, ..., хп значений случайной величины снеизвестной функцией распределения F(x). Требуется проверить гипотезуо том, что случайная величина имеет некоторое заданноераспределение F0(x) против альтернативной гипотезы.Распределение F0(x) может быть либо задано полностью (простая нулеваягипотеза), либо с точностью до параметров (сложная нулевая гипотеза).