ТЕОРИЯ ВЕРОЯТНОСТЕЙ, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, (1269688), страница 37
Текст из файла (страница 37)
Для каждого из 100 телевизоров регистрировалосьчисло выходов из строя в течение гарантийного срока. Результатыпредставлены в виде статистического ряда:Число выходов01234 и болееиз строяЧисло54271450телевизоровСогласуются ли эти данные с предположением о том, что числовыходов из строя имеет пуассоновский закон распределения?Решение.
Если случайная величина Х –– число выходов из строятелевизора, имеет пуассоновский закон распределения, тоl k -lPk = Р( Х k=)e =, k 0,1,2,3,=¼,k!где параметр l неизвестен.Оценим параметр из опытных данных. В законе распределенияПуассона параметр l равен математическому ожиданию случайнойвеличины. Оценкой математического ожидания служит среднееарифметическое:0 × 54 + 1 × 27 + 2 × 14 + 3 × 5 + 4 × 0X= =0,7 » l.100Итак, выдвигаем гипотезу, что изучаемая случайная величина имеетзакон распределения(0,7)k -0,7Р( Х = k )e ,= k 0,1,2,3,K .=k!Для проверки выдвинутой гипотезы зададим уровень значимости,например, равный 0,02.
Последние три разряда, содержащие малонаблюдений, можно объединить. В итоге имеем три разряда и числостепеней свободы равно r = 3 – 2 = 1 , так как на величины ni наложены двесвязи: Sni = 100 и X = 0,7 . Из таблицы распределения «хи-квадрат» (см.прил., табл. П4) для заданного b = 0,02 и числа степеней свободы r = 1находим, что критическая область имеет вид [5, 41; ¥).Вычислим теперь cв2 .
В соответствии с выдвинутой гипотезойразряды имеют вероятности:(0,7)0 -0,7(0,7)1 -0,7Р0 = Р( Х 0) =e=0,5;Р1 == Р( Х 1) =e=0,35;0!1!Р2 = Р ( =Х 2)= 0,12;Р3 + Р4 + K 1 – 0,5 – 0,35 – 0,12=0,03.Вычисление c произведем, фиксируя промежуточные результаты втаблице.2в213==(ni - npi )2(ni - npi )pinpininpi0,32164500,5541,8364–8350,35271,071641519192S =cв = 3,22.Вычисленное значение в критическую область не входит. Вывод:гипотеза о пуассоновском законе распределения изучаемой случайнойвеличины опытным данным не противоречит.Ответ. Гипотеза не противоречит опытным данным.ni - npi2Задача 3.15. После набора текста книги корректор подсчитал числоопечаток на каждой странице книги. Результаты подсчета представлены ввиде статистического ряда.Число01234опечатокЧисло страницk0k1k2k3k4Согласуется ли с этими данными (при уровне значимости b = 0,05 )утверждение о том, что число опечаток на странице имеет пуассоновскийзакон распределения? (См.
пример 3.15 и исходные данные.Воспользуйтесь прил., табл. П5.)Исходные данные к задаче 3.15.№k0k1k2k3k4№k0k1k2k3k41190 19592311216 220 221 11233142186 18582371017 184 1088216103246 15170231018 187 1385312104189 19593331019 214 224 12130115217 227 108351320 181 111841596186 1414915921 191 179784397166 14562171022 132 134652098216 221 120331023 213 225 1203399186 10582171024 192 17780411010 189 191 101291025 180 1128514911 191 17979411026 191 18078401112337580832927 131 13763191013 213 230 115281428 218 221 116331214 186 1405114929 130 13864181015 190 1547621930 186 13855129Пример 3.16. В течение пяти рабочих дней недели на контактныйтелефон фирмы поступило соответственно 69, 50, 59, 75, 47 звонков.214Можно ли считать при уровне значимости b = 0,02 , что интенсивностьзвонков не зависит от дня недели?Решение. Сначала построим критическую область.
Общее количествозвонков равно 300. Число степеней свободы равно r = 5 – 1 = 4 , так как5разрядов пять, а связей одна ( å ni = 300 ). По таблице распределения «хиi= 1квадрат» находим для r = 4 и b = 0,02 , что критическое значение cb2 = 11,67.Итак, критическая область имеет вид W0 = [11,67; +¥).Выдвинем гипотезу, что интенсивность звонков не зависит от днянедели, т.е. с вероятностью 1/5 каждый вызов может поступить в любойрабочий день недели.В предположении, что гипотеза верна, вычислим значение c 2 .Вычисление удобно оформить в виде таблицы.(ni - npi )22ni - npi(ni - npi )pinpininpi1,35819601/5691,67100–10601/5500,0171–1601/5593,7522515601/5751,69169–13601/547S =c 2в = 8, 4773.Сумма элементов последнего столбца дает cв2 < 11,67. Вывод:гипотеза опытным данным не противоречит.Ответ. Гипотеза опытным данным не противоречит.Задача 3.16.
На шоссе между двумя городами расположены триавтозаправочные станции. В течение часа на этих станциях заправилосьсоответственно k1, k2 и k3 автомобилей. При уровне значимости b = 0,05согласуется ли с этими данными предположение, что автозаправкиодинаково популярны у автовладельцев? (См. пример 3.16 и исходныеданные.)Исходные данные к задаче 3.16.№k1k2k3№k1k2k3№k1k2k35273766181595140651112178695469537964395021222537057546957476238313235039523852606146384142448633946613860355251525385361355260556038616262157891038403947496550386351646217181920605556465562445938456260272829306245664544665455565445623.6.3.
Проверка гипотезы о независимости двух случайных величинПостановка задачи. Можно ли по результатам наблюдений двухслучайных величин сделать вывод об их зависимости или независимости.В приложениях эта задача имеет следующую постановку. Пустькаждый элемент генеральной совокупности обладает двумя признаками A иB, признак A имеет градации (или уровни) A1 , A2 ,K, Ak , а признак Bразличается по уровням B1 , B2 ,K, Bs . Возникает вопрос, связаны ли друг сдругом эти признаки?Естественно считать, что A и B независимы, если при выборе любогоэлемента генеральной совокупности независимы события «признак Aпринимает значение Ai» и «признак B принимает значение Bj» при всех i иj. Формально это означает, чтоP( Ai B j ) = P( Ai ) P( B j )(3.6.4)для всех Ai и Bj. Проверить непосредственно выполнение соотношения(3.6.4) нет возможности, так как значения входящих в него вероятностейнеизвестны.Пусть у взятых наугад n членов генеральной совокупностиопределены величины признаков A и B.
По этим результатам можно найтиnij –– число наблюдений пары значений признаков Ai и Bj. Тогда общеечисло наблюдений значений признака Ai равноsånj =1ij= ni1 + ni 2 + K + nis = ni* .(3.6.5)Аналогично, число наблюдений признака Bj равноråni =1ij= n1 j + n2 j + K + nrj = n* j .(3.6.6)Обычно результаты наблюдений оформляют в виде таблицы,которую называют таблицей сопряженности признаков.Таблица сопряженности признаковABB1B2LA1A2LAiLAkn11n12Ln21n22LLLLni1ni2LLLLnk1nk2L216n*1n*2LBjLBsn1jLn1sn1*LLLLn2jLn2sn2*LLLLnijLnisni*nkjLnksnk*n*jLn*snВведем обозначения для вероятностей.
Положимpij = P ( Ai B=j ), P(=Ai )så=Pijj =1pi*=, P ( B j )råPi =1ijp* j .Необходимо проверить гипотезу H0: pij = pi* p* j для всех пар (i, j ),i = 1,2,K, k , j = 1,2,¼, s.Если наблюдений много (хотя бы несколько десятков), то по теоремеБернуллиnijn* jni*p,p,¾¾¾®¾¾¾®¾¾¾® p* j .iji*n ®¥n n®¥n n®¥nКритерий основан на сравнении наблюдаемых чисел появлениякомбинаций признаков с числами появлений, которые должны были быбыть, если бы признаки были независимы и не подвергались различнымслучайностям.Поскольку вероятность наступления двух независимых событийравна произведению вероятностей этих событий, то за оценку вероятностисовместного появления событий Ai и Bj можно принять произведениеni* n* j×(обе эти дроби –– оценки соответствующих вероятностей).
Тогдаn nтеоретическое число наблюдений пары Ai и Bj должно быть равнымn nn nn × i* × * j = i* * j .n nnЭту величину можно назвать теоретическим числом появлений пары Ai иni*n* jBj. При верной гипотезе величиныне должны значительноnотличаться от nij. О степени расхождения между ними можно судить повеличине2ni*n* j öæn ks ç ijn ÷ø2èU = åå.(3.6.7)nnij**i= 1 j= 1nЕсли гипотеза H0 о независимости верна, то при n ® ¥ величина U 2имеет распределение «хи-квадрат» с r = (k - 1)(s - 1) степенями свободы.Число степеней свободы определяется из следующих соображений.
Всегослагаемых rs. На них накладываются связи. Прежде всего,217ånij= n.ijОпределяя ni*, мы воспользовались k равенствами (3.6.5), но в силуkåni= 1i*= n, фактически независимых слагаемых будет k – 1 . Из тех жесоображений в равенствах (3.6.6) только s - 1 слагаемое являетсянезависимым. Поэтому число степеней свободыr = ks – (k - 1) – ( s – 1) – 1 = ( k – 1)( s – 1).В таблице распределения c 2 по заданному уровню значимости β ичислу степеней свободы r = (k – 1)(s – 1) находим cb2 такое, что P (U 2 ³ cb2 ).Критическая область для проверки гипотезы имеет вид W0 = [cb2 , ¥) . Остаетсявычислить фактическое значение U 2 .
Если оно попадает в критическуюобласть, то гипотеза отвергается, при этом вероятность ошибочности этоговывода равна β. Если вычисленное значение U 2 не входит в критическуюобласть, то гипотеза опытным данным не противоречит.Пример 3.17. Данные о сдаче экзамена 246 студентами сгруппированыв зависимости от места окончания студентом средней школы.ОценкаМосквичиОтличноХорошоУдовл.Неудовл.ni*1621351385БлижнееПодмосковье1121381080Иногородниеn*j192619178146689240246Можно ли по этим данным заключить, что успеваемость студентовпрактически не зависит от места получения ими среднего образования?(Уровень значимости взять, например, равным 0,05.)Решение.