Проверка статистических гипотез - 2 (543704)
Текст из файла
Лекция 19.Статистическая проверка статистических гипотез. Общие принципы проверкигипотез. Понятия статистической гипотезы (простой и сложной), нулевой иконкурирующей гипотезы, ошибок первого и второго рода, уровня значимости,статистического критерия, критической области, области принятия гипотезы.Наблюдаемое значение критерия.
Критические точки. Мощность критерия.Критерии для проверки гипотез о вероятности события, о математическоможидании, о сравнении двух дисперсий.Определение 19.1. Статистической гипотезой называют гипотезу о виде неизвестногораспределения генеральной совокупности или о параметрах известных распределений.Определение 19.2. Нулевой (основной) называют выдвинутую гипотезу Н0.
Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.Пример. Пусть Н0 заключается в том, что математическое ожидание генеральнойсовокупности а = 3. Тогда возможные варианты Н1: а) а ≠ 3; б) а > 3; в) а < 3.Определение 19.3. Простой называют гипотезу, содержащую только одно предположение,сложной – гипотезу, состоящую из конечного или бесконечного числа простых гипотез.Пример. Для показательного распределения гипотеза Н0: λ = 2 – простая, Н0: λ > 2 –сложная, состоящая из бесконечного числа простых ( вида λ = с, где с – любое число,большее 2).В результате проверки правильности выдвинутой нулевой гипотезы ( такая проверканазывается статистической, так как производится с применением методов математической статистики) возможны ошибки двух видов: ошибка первого рода, состоящая в том,что будет отвергнута правильная нулевая гипотеза, и ошибка второго рода, заключающаяся в том, что будет принята неверная гипотеза.Замечание.
Какая из ошибок является на практике более опасной, зависит от конкретнойзадачи. Например, если проверяется правильность выбора метода лечения больного, тоошибка первого рода означает отказ от правильной методики, что может замедлить лечение, а ошибка второго рода (применение неправильной методики) чревата ухудшениемсостояния больного и является более опасной.Определение 19.4. Вероятность ошибки первого рода называется уровнем значимости α.Основной прием проверки статистических гипотез заключается в том, что поимеющейся выборке вычисляется значение некоторой случайной величины, имеющейизвестный закон распределения.Определение 19.5. Статистическим критерием называется случайная величина К сизвестным законом распределения, служащая для проверки нулевой гипотезы.Определение 19.6.
Критической областью называют область значений критерия, прикоторых нулевую гипотезу отвергают, областью принятия гипотезы – область значенийкритерия, при которых гипотезу принимают.Итак, процесс проверки гипотезы состоит из следующих этапов:1) выбирается статистический критерий К;2) вычисляется его наблюдаемое значение Кнабл по имеющейся выборке;65PDF created with FinePrint pdfFactory trial version http://www.fineprint.com3) поскольку закон распределения К известен, определяется (по известному уровнюзначимости α) критическое значение kкр, разделяющее критическую область иобласть принятия гипотезы (например, если р(К > kкр) = α, то справа от kкр располагается критическая область, а слева – область принятия гипотезы);4) если вычисленное значение Кнабл попадает в область принятия гипотезы, то нулеваягипотеза принимается, если в критическую область – нулевая гипотеза отвергается.Различают разные виды критических областей:- правостороннюю критическую область, определяемую неравенством K > kкр ( kкр > 0);- левостороннюю критическую область, определяемую неравенством K < kкр ( kкр < 0);- двустороннюю критическую область, определяемую неравенствами K < k1, K > k2(k2 > k1).Определение 19.7.
Мощностью критерия называют вероятность попадания критерия вкритическую область при условии, что верна конкурирующая гипотеза.Если обозначить вероятность ошибки второго рода (принятия неправильной нулевойгипотезы) β, то мощность критерия равна 1 – β. Следовательно, чем больше мощностькритерия, тем меньше вероятность совершить ошибку второго рода.
Поэтому послевыбора уровня значимости следует строить критическую область так, чтобы мощностькритерия была максимальной.Критерий для проверки гипотезы о вероятности события.Пусть проведено п независимых испытаний (п – достаточно большое число), в каждом изкоторых некоторое событие А появляется с одной и той же, но неизвестной вероятностьютпоявлений А в этой серии испытаний.
Проверимр, и найдена относительная частотаппри заданном уровне значимости α нулевую гипотезу Н0, состоящую в том, чтовероятность р равна некоторому значению р0.Примем в качестве статистического критерия случайную величинуM − p0 nnU=,(19.1)p0 q0имеющую нормальное распределение с параметрами M(U) = 0, σ(U) = 1 (то есть нормированную). Здесь q0 = 1 – p0. Вывод о нормальном распределении критерия следует изтеоремы Лапласа (при достаточно большом п относительную частоту можно приближенносчитать нормально распределенной с математическим ожиданием р и средним квадратиpqческим отклонением).nКритическая область строится в зависимости от вида конкурирующей гипотезы.1)Если Н0: р = р0, а Н1: р ≠ р0, то критическую область нужно построить так, чтобывероятность попадания критерия в эту область равнялась заданному уровню значимости α.При этом наибольшая мощность критерия достигается тогда, когда критическая областьαсостоит из двух интервалов, вероятность попадания в каждый из которых равна .2Поскольку U симметрична относительно оси Оу, вероятность ее попадания в интервалы (∞; 0) и (0; +∞) равна 0,5, следовательно, критическая область тоже должна быть66PDF created with FinePrint pdfFactory trial version http://www.fineprint.comсимметрична относительно Оу.
Поэтому икр определяется по таблице значений функции1−αЛапласа из условия Ф(и кр ) =, а критическая область имеет вид (−∞;−и кр ) ∪ (и кр ;+∞) .2Замечание. Предполагается, что используется таблица значений функции Лапласа,хзаданной в виде Ф( х) = ∫ е−t22dt , где нижний предел интегрирования равен 0, а не -∞.0Функция Лапласа, заданная таким образом, является нечетной, а ее значения на 0,5меньше, чем значения стандартной функции Ф(х) (см. лекцию 6).Далее нужно вычислить наблюдаемое значение критерия:т − p0 nnU набл = .(19.2)p0 q0Если |Uнабл| < uкр, то нулевая гипотеза принимается.Если |Uнабл| > uкр, то нулевая гипотеза отвергается.2) Если конкурирующая гипотеза Н1: р > p0, то критическая область определяетсянеравенством U > uкр, то есть является правосторонней, причем р(U > uкр) = α.
Тогда11 − 2αр (0 < U < u кр ) = − α =. Следовательно, икр можно найти по таблице значений221 − 2αфункции Лапласа из условия, что Ф(и кр ) =. Вычислим наблюдаемое значение2критерия по формуле (19.2).Если Uнабл < uкр, то нулевая гипотеза принимается.Если Uнабл > uкр, то нулевая гипотеза отвергается.3) Для конкурирующей гипотезы Н1: р < p0 критическая область является левосторонней изадается неравенством U <- uкр, где икр вычисляется так же, как в предыдущем случае.Если Uнабл > - uкр, то нулевая гипотеза принимается.Если Uнабл < - uкр, то нулевая гипотеза отвергается.Пример. Пусть проведено 50 независимых испытаний, и относительная частота появлениясобытия А оказалась равной 0,12.
Проверим при уровне значимости α = 0,01 нулевуюгипотезу Н0: р = 0,1 при конкурирующей гипотезе Н1: р > 0,1. Найдем(0,12 − 0,1) 50U набл == 0,471. Критическая область является правосторонней, а икр нахо0,1 ⋅ 0,91 − 2 ⋅ 0,01= 0,49. Из таблицы значений функции Лапласадим из равенства Ф(икр) =2определяем икр = 2,33. Итак, Uнабл < uкр, и гипотеза о том, что р = 0,1, принимается.Критерий для проверки гипотезы о математическом ожидании.Пусть генеральная совокупность Х имеет нормальное распределение, и требуетсяпроверить предположение о том, что ее математическое ожидание равно некоторомучислу а0. Рассмотрим две возможности.1) Известна дисперсия σ2 генеральной совокупности.
Тогда по выборке объема п найдемвыборочное среднее х В и проверим нулевую гипотезу Н0: М(Х) = а0.67PDF created with FinePrint pdfFactory trial version http://www.fineprint.comУчитывая, что выборочное среднее Х является несмещенной оценкой М(Х), то естьМ( Х ) = М(Х), можно записать нулевую гипотезу так: М( Х ) = а0. Для ее проверкивыберем критерийX − a 0 ( X − a0 ) nU==.(19.3)σ (X )σЭто случайная величина, имеющая нормальное распределение, причем, если нулеваягипотеза справедлива, то М(U) = 0, σ(U) = 1.Выберем критическую область в зависимости от вида конкурирующей гипотезы:1−α, критическая область двусторонняя,- если Н1: М( Х ) ≠ а0, то икр: Ф(и кр ) =2( х − a0 ) nU набл =, и, если |Uнабл| < uкр, то нулевая гипотеза принимается; если |Uнабл| > uкр,σто нулевая гипотеза отвергается.1 − 2α- если Н1: М( Х ) > а0, то икр: Ф(и кр ) =, критическая область правосторонняя, и, если2Uнабл < uкр, то нулевая гипотеза принимается; если Uнабл > uкр, то нулевая гипотезаотвергается.1 − 2α- если Н1: М( Х ) < а0, то икр: Ф(и кр ) =, критическая область левосторонняя, и, если2Uнабл > - uкр, то нулевая гипотеза принимается; если Uнабл < - uкр, то нулевая гипотезаотвергается.2) Дисперсия генеральной совокупности неизвестна.В этом случае выберем в качестве критерия случайную величину( X − a0 ) nT=,(19.4)Sгде S – исправленное среднее квадратическое отклонение.
Такая случайная величинаимеет распределение Стьюдента с k = n – 1 степенями свободы. Рассмотрим те же, что и впредыдущем случае, конкурирующие гипотезы и соответствующие им критическиеобласти. Предварительно вычислим наблюдаемое значение критерия:( х − a0 ) nTнабл = В.(19.5)S- если Н1: М( Х ) ≠ а0, то критическая точка tдвуст.кр. находится по таблице критическихточек распределения Стьюдента по известным α и k = n – 1.Если | Tнабл | < tдвуст.кр., то нулевая гипотеза принимается.Если | Tнабл | > tдвуст.кр., то нулевая гипотеза отвергается.- если Н1: М( Х ) > а0, то по соответствующей таблице находят tправост.кр.(α, k) – критическую точку правосторонней критической области.
Нулевая гипотеза принимается, еслиTнабл < tправост.кр..- при конкурирующей гипотезе Н1: М( Х ) < а0 критическая область является левосторонней, и нулевая гипотеза принимается при условии Tнабл > - tправост.кр.. ЕслиTнабл < - tправост.кр.., нулевую гипотезу отвергают.Критерий для проверки гипотезы о сравнении двух дисперсий.Пусть имеются две нормально распределенные генеральные совокупности Х и Y. Из нихизвлечены независимые выборки объемов соответственно п1 и п2, по которым вычисленыисправленные выборочные дисперсии s X2 и sY2 . Требуется при заданном уровне значимости α проверить нулевую гипотезу Н0: D(X) = D(Y) о равенстве дисперсий рассматривае68PDF created with FinePrint pdfFactory trial version http://www.fineprint.comмых генеральных совокупностей.
Учитывая несмещенность исправленных выборочныхдисперсий, можно записать нулевую гипотезу так:Н0: М ( s X2 ) = М ( sY2 ).(19.6)Замечание. Конечно, исправленные дисперсии, вычисленные по выборкам, обычнооказываются различными. При проверке гипотезы выясняется, является ли это различиенезначимым и обусловленным случайными причинами (в случае принятия нулевойгипотезы) или оно является следствием того, что сами генеральные дисперсии различны.В качестве критерия примем случайную величинуS2F = σ2 (19.6)SM- отношение большей выборочной дисперсии к меньшей. Она имеет распределениеФишера-Снедекора со степенями свободы k1 = n1 – 1 и k2 = n2 – 1, где п1 – объем выборки,по которой вычислена большая исправленная дисперсия, а п2 – объем второй выборки.Рассмотрим два вида конкурирующих гипотез:- пусть Н1: D(X) > D(Y).
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.