ТЕОРИЯ ВЕРОЯТНОСТЕЙ, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, (1269688), страница 40
Текст из файла (страница 40)
Р ( Х £ m) = P ( X ³ m) = 1 / 2. Проделано n независимых наблюдений надслучайной величиной. Можно ли считать по их результатам Х 1 , Х 2 ,¼, Х n ,что значение медианы равно m0 против альтернативы, что значениемедианы равно m1 (для определенности пусть m1 < m0 )?Предположим, что значение m действительно равно m0 (т.е. вернанулевая гипотеза Н 0 : m = m0 ) и рассмотрим последовательность величинХ 1 - m0 , Х 2 - m0 ,¼, Х n – m0 .Если гипотеза верна, то Р ( Х – m0 ³ 0)= Р ( Х – m0 £ 0)= 1 / 2.Подсчитаем число положительных разностей Х – m0 в нашей выборке иобозначим его через S.nВеличину S можно представить в виде S = å I ( X i - m0 ) , где I ( x) = 1i =1при х > 0 и I ( x ) = 0 при х < 0 .
Заметим, что случайная величина I ( x)принимает два значения 0 и 1 с вероятностями р = 1 / 2 каждое, если229гипотеза верна. Поэтому при верной нулевой гипотезе величина S имеетбиномиальное распределение:kn -knkæ1ö æ1ökæ1öР ( S = k ) Cn ç ÷ ç =÷Cn ç ÷ . =è2ø è2øè2øОчевидно, что при медиане равной m1 < m0 вероятность Р ( Х > m0 ) == p1 < 1 / 2. В итоге задача сводится к проверке гипотезы Н 0 : р = р0 = 1 / 2против альтернативы Н1 : р = р1 < 1 / 2.Согласно лемме Неймана––Пирсона для любого 0 < a < 1 существуеттакая постоянная величина С > 0 , что значения k, для которыхСnk p1k (1 - p1 )n -k³CCnk p0k (1 - p0 )n -kобразуют критическую область наиболее мощного критерия. Так же как и впримере 3.19 легко показать, что в критическую область следует относить впервую очередь самые маленькие значения k.
Остается только найтиkнаибольшее k, для которогоåCi=1kn(1 / 2)n £ a , где a –– вероятность ошибкипервого рода.Пример 3.22. По результатам независимых наблюдений случайнойвеличины Х 1 = 3,05; Х 2 = 2,9; Х 3 = 3,4; Х 4 = 2,3; Х 5 = 4,7; Х 6 = 3, 27;Х 7 = 2,35; Х 8 = 1,54; Х 9 = 4,1; Х 10 = 2,8; Х 11 = 3,9; Х 12 = 1,8 исследовательв отношении медианы m отверг гипотезу Н 0 : m = m0 = 3,5 и принялальтернативную гипотезу Н1 : m = m1 < 3,5. Какова вероятность ошибкипервого рода при таком выводе?Решение. Ошибка первого рода совершается, когда отвергаетсяверная гипотеза.
Предположим, что нулевая гипотеза верна и медиана mдействительно равна 3,5. Только в трех наблюдениях результатыпревосходят 3,5. Как было показано выше, при альтернативе m = m1 < 3,5 вкритическую область следует включать в первую очередь малые значенияk. Значение k = 3 было отнесено исследователем к критической области. Впредположении, что гипотеза верна имеем12121120 æ1ö1 æ1öР12 (0) = С12 ç ÷ =; = Р12 (1) С12=ç ÷;40964096è2øè2ø1266æ1ö;Р12 (2) = С ç ÷ =4096è2ø21212æ1ö= Р12 (3) С= ç ÷è2ø312230220.409612299æ1ö» 0,07.Откуда å C ç ÷ =4096è2øk =0299Ответ.» 0,07.40963k12Задача 3.22. По результатам независимых наблюдений случайнойвеличины Х 1 , Х 2 , Х 3 , Х 4 , Х 5 , Х 6 , Х 7 , Х 8 , Х 9 , Х 10 , Х 11 , Х 12исследователь в отношении медианы m отверг гипотезу Н 0 : m = m0 = 3,5и принял альтернативную гипотезу Н1 : m = m1 < 3,5.
Какова вероятностьошибки первого рода при таком выводе? (См. пример 3.22 и исходныеданные.)Исходные данные к задаче 3.22.№ X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 med1 1,3 –0,1 0,3 –0,9 1,9 1,1 0,8 2,1 1,5 1,2 2,0 1,4 1,62 0,7 2,1 –0,2 1,9 –0,4 2,4 1,8 1,9 –0,3 0,5 2,1 –0,5 13 –0,5 2,3 1,5 –0,3 2,9 2,1 0,7 1,2 1,8 3,3 1,4 1,6 1,53 2,4 0,4 2,5 0,3 0,9 0,7 2,3 1,74 1,3 2,7 0,2 2,531,8 3,1 0,8 2,8 1,7 1,9 1,2 2,125 3,5 0,9 3,24 3,6 1,3 1,6 1,1 1,2 2,56 1,2 3,7 2,3 4,2 1,4 3,27 3,9 1,7 4,5 2,5 1,9 4,7 4,1 1,8 3,7 3,2 2,5 1,4 332,2 2,45 4,2 2,3 4,6 5,2 2,6 3,3 2,8 3,28 4,49 2,9 5,5 4,9 2,7 3,5 4,7 5,7 2,8 5,1 4,2 2,8 3,2 410 5,3 3,1 3,9 6,1 5,9 5,1 3,3 3,2 5,5 3,8 3,3 3,1 4,511 3,6 5,8 4,5 6,6 5,4 6,4 3,8 6,1 3,7 4,1 2,9 3,5 4,812 4,1 6,3 4,9 7,6 5,9 6,9 4,3 6,7 4,2 3,4 4,5 3,2 554,1 5,513 8,1 4,5 6,7 5,2 6,4 7,3 4,9 7,1 4,7 4,45 4,8 5,2614 7,2 5,1 8,5 6,9 5,7 7,8 5,4 7,6 5,215 7,7 6,3 5,6 8,9 8,3 5,9 7,4 5,7 8,1 5,3 5,9 6,1 6,516 5,5 9,4 8,2 7,4 8,8 7,9 8,6 6,2 6,4 6,8 5,8 6,2 75 8,3 7,7 6,8 5,3 7,5 5,16 5,4 5,9617 7,1 5,77 4,8 4,6 5,254,8 5,318 5,2 7,8 6,6 7,2 4,5 6,35 4,819 6,2 4,1 4,9 7,5 5,8 6,8 4,2 6,7 4,2 4,1 4,464,5 3,4 4,2 4,520 5,7 3,5 6,5 4,4 5,3 3,7 6,3 3,621 3,8 5,2 2,6 5,4 5,8 5,9 3,3 5,4 3,1 3,5 4,1 2,9 422 5,3 2,7 4,7 2,5 3,3 5,5 4,5 2,6 4,9 3,1 3,8 3,3 3,54 2,1 4,4 2,8 3,2 4,2323 2,8 4,2 1,9 5,1 2,2 4,824 3,7 1,5 4,3 1,7 3,9 2,3 1,6 4,5 3,5 3,3 2,8 2,6 2,525 3,4 1,1 3,7 2,1 1,2 3,8 2,9 3,4 0,9 2,6 1,4 3,2 231,6 2,9 0,5 0,6 2,6 1,6 1,1 1,2 1,526 0,7 3,3 2,8127 2,5 1,1 2,3 –0,2 2,8 2,2 0,3 0,1 2,4 2,1 1,9 1,223128 0,4 –0,8 2 1,2 –0,6 2,6 1,8 0,929 1,6 0,2 –0,7 1,4 –0,9 1,9 0,8 1,230 0,5 1,1 –0,6 –1,8 1 0,2 –0,2 1,21,5–10,61,1 0,7 0,9 0,51,4 3,3 1,600,5 –0,5 2,1 –0,63.6.6.
Проверка гипотезы о равенстве математических ожиданийПусть над случайной величиной X проделано n независимыхнаблюдений, в которых получены результаты X 1 , X 2 ,¼, X n , а надвеличиной Y проделано m независимых наблюдений и получены значенияY1 , Y2 ,¼, Ym . Предположим, что известны дисперсии D( X ) = s12 и D(Y ) = s22 ,но неизвестны математические ожидания М ( X ) = а1 и М (Y ) = а2 .
Пусть,кроме того, каждая серия состоит из достаточно большого числанаблюдений (хотя бы несколько десятков в каждой серии). Построимкритерий для проверки по результатам наблюдений гипотезы о том, чтоа1 = а2 .Предположим, что гипотеза верна. Так как серии опытов достаточновелики, то для средних арифметических имеем приближенные равенстваХ » а1 и Y » a2 .
Если гипотеза верна, то Х » Y и величина | Х - Y | должнабыть относительно малой. Напротив, большие значения этой величиныплохо согласуются с гипотезой. Поэтому критическую область составят тесерии наблюдений, для которых | Х - Y |³ С , где С –– некотораяпостоянная величина.Свяжем эту постоянную C с уровнем значимости b. Согласноцентральной предельной теореме каждая из величин Х и Y распределенаприблизительно нормально, как сумма большого числа одинаковораспределенных независимых случайных величин с ограниченнымидисперсиями. С учетом того, что М ( Х ) = M ( X ) и D ( Х ) = D( X ) / n, можноN (a1 , s12 / n), a Y ––распределение N (a2 , s22 / n). Из факта устойчивости нормального законараспределения можно заключить, что при верной гипотезе Х - Y тожеимеетнормальныйзаконраспределенияспараметрамиM (Х - Y ) =a1 – a2 =0 и D( Х - Y= ) s12 / n + s 22 / m.Запишем для нормального закона распределения N (0, s12 / n + s22 / m)стандартную формулу (????):æöç÷e÷P (| Х - Y - 0 |< e) = 2F çç s12 s22 ÷+ç÷è n m øутверждать,чтоХимеетраспределение232илиæöç÷eç÷.P (| Х - Y |³ e) 1 –= 2F(3.6.9)ç s12 s 22 ÷+ç÷è n m øПо заданному b из таблицы функции Лапласа (см.
прил., табл. П2)1- bнайдем такое tb, чтобы 1 – 2F (= tb ) b или F(tb ) =. Тогда при2s12 s 22правая часть равенства (3.6.9) будет равна b. Поэтому приe tb = +n mуровне значимости b критическую область для проверки гипотезы оравенстве двух математических ожиданий составят те серии наблюдений,для которыхs12 s 22(3.6.10)| Х - Y |³ tb+ .n mЗамечание 1. Если дисперсии неизвестны, то большое числонаблюдений в каждой серии позволяет достаточно точно оценитьдисперсии по этим же опытным данным:nD( X ) =s12 »å(Xi=1i- X)m2и D (Y ) = s22 »å (Y - Y )i =12i.n -1m -1Пример 3.23. Среднее арифметическое результатов 25 независимыхизмерений некоторой постоянной величины равно 90,1. В другой серии из20 независимых измерений получено среднее арифметическое, равное 89,5.Дисперсия ошибок измерения в обоих случаях одинакова и равна s2 = 1, 2( s » 1,1 ).
Можно ли считать, что измерялась одна и та же постояннаявеличина?Решение. Выдвигаем гипотезу, что в каждой из серий измеряласьодна и та же постоянная величина. Зададимся, например, уровнемзначимости b = 0,01. По таблице значений функции Лапласа (см. прил.,1 - 0,01табл. П2) находим, что F(2,58) =.2Тогда критическая область для проверки гипотезы определяется11неравенством | Х - Y |³ 2,58 × 1,1 ×+= 0,85. Так как в нашем случае25 20Х - Y =90,1 –=89,5 0,6 < 0,85, то сомневаться в том, что измерялась однаи та же постоянная величина, оснований нет.
Расхождения в значенияхсредних арифметических можно объяснить ошибками измерений.233Ответ. Предположение о равенстве математических ожиданий непротиворечит опытным данным.Задача 3.23.1. При уровне значимости b = 0,05 проверьте гипотезу оравенстве математических ожиданий в двух сериях наблюдений.Воспользуйтесь исходными данными к задаче 3.12. Используйте данныесвоего варианта и следующего за ним варианта.
В 30-м варианте сравнитематематическое ожидание с математическим ожиданием в первомварианте. (См. пример 3.23.)Замечание 2. Критерий (3.6.10) можно использовать и принебольшом числе наблюдений в каждой серии, но только при условии, чтоX и Y имеют нормальные законы распределения с известнымидисперсиями. В этом случае нормальность распределения среднихарифметических результатов наблюдений следует не из центральнойпредельной теоремы, а из факта устойчивости нормального законараспределения (сумма независимых нормально распределенных величинтоже имеет нормальный закон распределения).Задача 3.23.2.
В предположении, что наблюдались случайныевеличины X и Y с нормальным законом распределения и дисперсиямиs x = s y = 1,3, при уровне значимости b = 0,05 проверьте гипотезу оравенстве математических ожиданий в двух сериях наблюдений.Воспользуйтесь исходными данными к задаче 3.22. Используйте цифровыеданные своего варианта в качестве значений случайные величины X иследующего за ним варианта.