Л.Н. Фадеева, А.В. Лебедев - Теория вероятностей и математическая статистика (1115296), страница 49
Текст из файла (страница 49)
Замечание. Гипотеза о средних обычно проверяется таким образом и в случае неизвестных дисперсий для больших выборок (объемом порядка сотен), когда оценки дисперсий можно принять за их точные значения. 3. Гипотеза о равенстве средних прн нензвествых равных дисперсиях Проверяем гипотезу Н,: а„= а,. Альтернативная гипотеза Н, может быть трех видов: а) а„~ а,; б) а„> а,; в) а„< а,, однако случай в) сводится к б) перестайовкой х й у и не будет рассматриваться отдельно. Во всех случаях вычисляют статистику критерия.
х — у Т= 5 — +— а (и 1)ед + (Ги 1)Я где е' = и+ ли — 2 Величина У является объединенной оценкой дисперсии (общей для выборок). Эту же формулу можно представить в виде Т— х — у иги(и+ Ги — 2) Для проверки берут критические точки Г„, распределения Стьюдента с и + Ги — 2 степенями свободы и уровнем значимости а, причем в случае а) — для двусторонней критической области, в случае б) — для односторонней критической области. В случае а), если Щ < Г„,, то гипотеза Н, принимается, если Щ > Глв — отвергается. В случае б)„если Т < г,, то гипотеза Н, принимается, если Т > Г„, — отвергается.
Замечание. Поскольку для проверки гипотезы требуется равенство дисперсий у двух выборок, сначала необходимо проверить гипотезу о равенстве дисперсий. В противном случае данный метод применять нельзя. 331 Е ЧАСТЬ !!. Математическая статистииа 4. Гипотеза о равенстве вероятностей «успеха» в двух сериях испытаний Бернулли Гипотеза проверяется на основе асимптотической нормальности относительных частот, так что данный метод может применяться только при больших объемах выборок (порядка нескольких десятков или сотен).
Пусть в одной серии из и, испытаний получили лт! «успехов», в другой серии из л, испытаний получили лт, «успехов». Проверяем гипотезу Н,: р, = рг Альтернативная гипотеза может быть трех видов: а) р, м р„ б) р, > р;, в) р, < р„однако случай в) сводится к б) перестановкой индексов и не будет рассматриваться отдельно. Во всех случаях вычисляют статистику критерия у те! т«2 и(1 — ти) -+- где ю= 6,+Ю, В случае а) критическая точка и„выбирается из условия Фа(и»») = (1 — а)/2.
Если Щ < и„,, гйпотеза Н, принимается, если Щ > и„, — отвергается. В случае б) критическая точка и выбирается из условия Фе(и„») = 1/2 — а. Если У < и„», то гипотеза Н, принимается, если У > и„, — отвергается. Доказательство. 1) Если основная гипотеза справедлива, то ат по следствию 5 теоремы Фишера (см. $ 12.8) статистика г = — ", Ю„ имеет распределение Фишера с числами степеней свободы и — 1 и т — 1. Если справедлива гипотеза б), то устремится к + е, так что область принятия нулевой гипотезы следует ограничить спра- ва. Критические точки распределения Фишера определяются из условия: Р(Г > г ) = сс.
Выбирая соответственно критическую область, получаем уровень значимости сс. Если справедлива гипотеза а), то г может стремиться как к + а, так и к О, так что область принятия нулевой гипотезы следует ограничить и справа, и слева. Но условие —, < С экпч« 33а Глава 1л аа( 1 а„' вивалентно — « — ", С при С > 1. С учетом того, что для рас- С а' 1 пределения Фишера верно Р„(и,т)=, получаем, что Р( (т, и) при выборе критической точки Р„„, соответствующей уровню значимости а/2, будет выполняться Р~ —,>Р =а, так что ! лип достигается нужный нам уровень значимости а. 2) Если основная гипотеза справедлива, то по следствию 3 * — У теоремы Фишера статистика У = имеет стандартное нормальное распределение. Далее рассуждаем так же, как при проверке гипотезы для одной выборки (см.
З 15.3). 3) Если основная гипотеза справедлива, то по следствию 4 те* — У ит(и+ т — 2) р~ ~.р~~~ т— ( -л.'(.( -(л' имеет распределение Стьюдента с и + т — 2 степенями свободы. Далее рассуждаем так же, как при проверке гипотезы для одной выборки. 4) Если основная гипотеза справедлива, то из центральной предельной теоремы следует, что относительные частоты «(( и (а, асимптотически нормальны с одинаковым средним р = р, = р, и дисперсиями р(1 — р)/и, и р(1 — р)/иг Кроме того, они независимы. Следовательно, их разность и( — в, асимптотически нормальна с нулевым средним и дисперсией Р(1 — Р)(1/и, + 1/и,). Однако Р неизвестно.
Наилучшей оценкой (несмещенной, состоятельной, эффективной в классе линейных несмешенных оценок) для р является (а= . Заменяя р на в, получаем, т( +т2 и(+и2 что распределение статистики (/= и (1 — (а) — +— сходится к стандартному нормальному распределению при и -+ о. Далее рассуждаем так же, как при проверке гипотезы для одной выборки. ззз ! ЧАСТЬ Н.
Метематическек статистика Описанные критерии проверки гипотез можно представить в виде табл. 15.2. Таблица гб.е Задача 11. По выборке объема л = 30 найден средний вес изделий, равный 130 г, изготовленных на первом станке; по выборке объема т = 40 найден средней вес изделий, равный 125 г, изготовленных на втором станке. Генеральные дисперсии известны: о„' = б0 г', ст,' = 80 г'. Требуется на уровне значимости 0,05 проверить нулевую гипотезу Н;. а„= а, при конкурирующей гипотезе Н,: а„м а,. Предполагается, что случайные величины распределены нормально и выборки независимы.
зэ4 Глава гЗ Решение. Найдем значение статистики критерия: х - у 130-125 По таблице функции Лапласа найдем критическую точку из равенства Ф(и„,) = (1-а)/2 = 0,475, получаем и = 1,96. Так как Щ > и„,, гипотеза Н, отвергается. Таким образом, нельзя угверждать, что средние значения веса изделий двух станков совпадают.
Задача 12. По двум независимым выборкам, объемы которых и = 9 и лг = 16, извлеченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии лг =34,02 и лг =12,15. На уровне значимости 0,01 проверить нулевую гипотезу Н;. окг = о,г против конкурирующей гипотезы Н: о'> а'. г к у' Решение. Рассчитаем значение статистики критерия: г г 3402 а' 12,15 Числа степеней свободы /с1 = л — 1 = 8, (сг = т — 1 = 15. По таблице критических точек распределения Фишера — Снедекора по заданному уровню значимости а = 0,01 и числам степеней свободы находим Р (0,01; 8; 15) = 4.
Поскольку Г < Г, нулевая гипотеза принимается. Задача 13. Реклама угверждает, что из двух типов пластиковых карт «Русский Экспресс» и «Супер-Понт» богатые люди предпочитают первый. С целью проверки этого утверждения были обследованы среднемесячные платежи л = 16 обладателей «Русского Экспресса» и лг = 11 обладателей «Супер-Понта». Выяснилось, что платежи по картам «Русский Экспресс» составляют в среднем 563 долл. с исправленным средним квадратическим отклонением 178 долл., а по картам «Супер-Понт»вЂ” в среднем 485 долл. с исправленным средним квадратическим отклонением 196 долл.
Предварительный анализ законов распределения месячных расходов как среди обладателей «Русского Экспресса», так и ф ЧАСТЫ С Матаиатическак статистика среди обладателей «Супер-Понта» показал, что они достаточно хорошо описываются нормальным приближением. Проверить утверждение рекламы на уровне значимости 0,1. Решение. В данном случае речь идет о проверке гипотезы о средних при неизвестных дисперсиях (объемы выборок малы).
Поэтому прежде всего необходимо проверить гипотезу о равенстве дисперсий, а лишь затем двигаться дальше. Имеем т 196т 38 416 1,21. а'ь 178' 31684 По таблице критических точек распределения Фишера— Снедекора по уровню значимости а/2 = 0,05 и числам степеней свободы /с, = н „ — 1 = 10 и /ст = и .,„ — 1 = 15 найдем критическую точку Р„„ = 2,55. Так как 1,21 < 2,55, принимаем гипотезу о равенстве дисперсий двух выборок. Теперь можем воспользоваться критерием Стьюдента для проверки гипотезы о равенстве средних. Имеем т 10 х 38 416+ 15 х 31684 а 25 Вычисление статистики критерия дает: 563 485 , 4 !85итгГ1-';Д~тб Из таблиц критических точек распределения Стьюдента (для односторонней области) по уровню значимости а = 0,1 и числу степеней свободы 25 находим Г,»= 1,32.
Поскольку Т < г„,, принимается основная гипотеза (о равенстве средних). Таким образом, угверждение рекламы не подтверждается имеющимися данными. Задача 14. В партии из 500 деталей, изготовленных первым станком-автоматом, оказалось 60 нестандартных; из 600 деталей второго станка — 42 нестандартных. На уровне значимости а = 0,01 проверить нулевую гипотезу Н;. р, = р, о равенстве вероятностей изготовления нестандартной детали обоими станками против конкурирующей гипотезы 1~,: р, ~ р,. Решение. Имеем и, = 60/500 = 0,12; «т = 42/600 = 0,07; и = = (60 + 42)/(500 + 600) = 0,09. 336 глава 1з Найдем значение статистики критерия 0,12 — 0,07 - У Найдем критическую точку из соотношения: Ф,(и„,) = 0,495, откуда и„, = 2,57.
Поскольку Щ > и,, нулевая гипотеза отвергается. Значит, вероятности изготовления нестандартных деталей на двух станках различны. $ а~.б. Проверка гипотез о равенстве дисперсий длл нескольких выборок. Критерии Бартлетта и Кокрена Пусть генеральные совокупности Х, Х, ... Х„, распределены нормально. Из этих совокупностей извлечены независимые выборки объемов л„л„..., л По выборкам найдены исправленные выборочные дисперсии з,', з,', ..., з,', . Требуется на уровне значимости а проверить нулевую гипотезу о равенстве дисперсий для всех выборок, т.е. Н„: а,' = о,' = ...
= о'„, (против гипотезы, что какие-то из дисперсий не равны). Опишем критерий Бартлетга, позволяющий проверить такую гипотезу. Введем обозначения: пусть к, = и,. — 1 — число степеней свободы з1; м А=~ х,. — сумма чисел степеней свободы; М з' = — ) /с,я,' — среднее арифметическое исправленных дисперсий, взвешенное по степеням свободы; м 1 ( м 'г'=/с)вз' — ~/с,1пз,.'; С=1+ З(М-1)~~ й, )с1' Статистикой критерия Бартлетга является величина В = Р7С. При условии, что нулевая гипотеза верна, эта статистика распределена примерно как хи-квадрат с М вЂ” 1 степенями свободы. Для применения критерия необходимо, чтобы все и,. > 4. Если В < х.'.„„то Н, принимается, иначе отвергается.
Зэт ЧАСТЬ и. Математическая статистика чр Иногда нет необходимости вычислять величину С. А именно, если оказывается, что К < Х„' „, „то этого достаточно для выполнения В < Х„' „, „поскольку С > 1. В случае, когда размеры выборок одинаковы, предпочтительнее использовать критерий Кокреиа. Статистикой критерия Кокрена является отношение максимальной исправленной выборочной дисперсии к их сумме: мм е~ +ат+ -+аи г т г В предположении, что нулевая гипотеза верна, распределение этой статистики зависит только от числа степеней свободы lс = н — 1 и числа выборок М.
По таблице критических точек распределения Кокрена находят критическую точку 6„,= Окя(ск; lс; М). Если Ст < б„,, то Н, принимается, иначе отвергается. Если гипотеза о равенстве дисперсий у всех выборок принимается, то в качестве оценки этой общей дисперсии можно использовать величину У. Задача 15. По четырем независимым выборкам, объемы которых н, = 17, н, = 20, л, = 15, л, = 16, извлеченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии, соответственно равные 2,5; 3,6; 4,1; 5,8. Требуется: 1) на уровне значимости 0,05 проверить гипотезу о равенстве дисперсий; 2) оценить генеральную дисперсию.