ТЕОРИЯ ВЕРОЯТНОСТЕЙ, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, (1269688), страница 34
Текст из файла (страница 34)
9,01 < M ( X ) < 10,99 .Задача 3.9. Результаты наблюдений случайной величины Xпредставлены в виде статистического ряда. Постройте доверительныеинтервалы для математического ожидания этой величины для уровнейнадежности g = 0,9 и g = 0,95 . (См. пример 3.9 и исходные данные кзадаче 3.12.)У к а з а н и е . Иногда результаты наблюдений случайной величиныпредварительно группируют и представляют в виде статистического рядаX( x1; x2 )( x2 ; x3 )( xk ; xk +1 )KЧисло наблюденийn2nkn1KВ этом случае для оценки математического ожидания и дисперсиииспользуют формулы:kM (X ) » X =åu ni =1ikiи D( X ) » s 2 =å (ui =1i- X )2 ni,nn -1где ui = ( xi+1 + xi ) / 2 –– середина i-го интервала. Считается, что величина uiнаблюдалась ni раз.3.4.2. Случай малой выборкиПри небольшом числе наблюдений для построения доверительногоинтервала необходима информация о типе закона распределения195случайной величины.
Рассмотрим задачу в практически важном случае,когда случайная величина Х имеет нормальный закон распределенияN (m; s2 ).Если s2 известно, а неизвестно лишь m, то при независимыхнаблюденияхможновоспользоватьсясвойствомустойчивостинормального закона распределения. Согласно этому свойству сумманезависимых случайных величин, подчиненных нормальному законураспределения, сама имеет нормальный закон распределения.
Поэтому вназванных условиях и при небольшом числе наблюдений можноутверждать, что Х имеет нормальный закон распределения и использоватьформулу (3.4.3).Если дисперсия s2 неизвестна, то при небольшом числе наблюденийее оценка на основе опытных данных получается грубой и формула (3.4.5)не решает задачи построения доверительного интервала. В этом случаеss öæP ç X - tg< m < X + t=g(3.4.6)÷ gnnøèгде соответствующее tg при заданном уровне надежности g находят потаблице распределения Стьюдента (см. прил., табл. П3) для n – 1 степенисвободы.Формула (3.4.6) по структуре похожа на формулу (3.4.5), но tg в этихформулах определяется по разным таблицам.Пример 3.10.
Измерения сопротивления резистора дали следующиерезультаты (в омах): Х 1 = 592 , Х 2 = 595 , Х 3 = 594 , Х 4 = 592 , Х 5 = 593 ,Х 6 = 597 , Х 7 = 595 , Х 8 = 589 , Х 9 = 590 . Известно, что ошибки измеренияимеют нормальный закон распределения. Систематическая ошибкаотсутствует. Построить доверительный интервал для истинногосопротивления резистора с надежностью 0,99 в предположении:а) дисперсия ошибки измерения известна и равна четырем;б) дисперсия ошибки измерения неизвестна.Решение. В данной серии из девяти наблюдений592 + 595 + K + 590Х== 593.9а) Если дисперсия ошибки измерения известна, то можновоспользоваться формулой (3.4.3).
Для этого из таблицы функции Лапласа(см. прил., табл. П2) находим, что 2F(2,58) = 0,99, т.е. уровню надежности0,99 соответствует значение tg =2,58. Тогда по формуле (3.4.3)593 - 2,58 ×22< M ( X ) < 593 + 2,58 ×99196или 591,28 < M ( X ) < 594,72 с вероятностью 0,99.б) В случае неизвестной дисперсии ее можно оценить на основе техже опытных данных:(592 - 593)2 + (595 - 593) 2 + K + (590 - 593) 2s2 » s 2=6,5,8s = 6,5 » 2,55.По таблице распределения Стьюдента (см. прил., табл. П3) для n – 1 = 9 – 1 = 8степеней свободы и заданной вероятности g = 0,99 находим tg =3,355.Тогда по формуле (3.4.6)2,552,55< M ( X ) < 593+3,355 ×99или 590,15 < M ( X ) < 595,85 с вероятностью 0,99.Ответ. а) 591,28 < M ( X ) < 594,72 ; б) 590,15 < M ( X ) < 595,85 .593 – 3,355 ×Задача 3.10. Случайная величина X имеет нормальный законраспределения.
Построить доверительный интервал для математическогоожидания этой случайной величины при уровне надежности g = 0,9 впредположении, что:а) дисперсия случайной величины неизвестна;б) дисперсия случайной величины известна и равна 1,44.(См. пример 3.10 и исходные данные к задаче 3.11.)3.5. Доверительный интервал для дисперсииПусть случайная величина X имеет нормальный закон распределенияN (m, s2 ), где m и s2 неизвестны.
Пусть Х 1 , Х 2 ,K, Х n –– результаты nнезависимых наблюдений этой случайной величины.(n - 1) s 2В этих условиях, согласно теореме Фишера, величинаимеетs2распределение c 2 (распределение «хи-квадрат») с n – 1 степенью свободы.Назначим уровень надежности g и подберем числа n1 и n2 так, чтобыæ (n - 1) s 2ö 1- gæ (n - 1) s 2ö 1- gPçиP.£n=³n=12÷ç÷2222ssèøèøæö(n - 1) s 2< n 2=÷ g.Тогда P ç n1 <2sèøВеличины n1 и n2 удовлетворяют равенствам197n1ò01- gиf n -1 ( x)dx =2+¥òf ( x)dx =n21- g,2где f n -1 ( x ) плотность распределения «хи-квадрат» с n – 1 степеньюсвободы.Решения этих уравнений находят с помощью таблиц (см. прил., табл.
П4).Для n1 входы таблицы: r = n – 1 и b = (1 + g ) / 2 . Для n2 входытаблицы: r = n – 1 и b = (1 - g ) / 2 .Рис. 3.5.1Если n1 и n2 (см. рис. 3.5.1) найдены, то(n - 1) s 2n1 << n2s2(3.5.1)или(n - 1) s 2(n - 1) s 22<s <.(3.5.2)n2n1Это и есть доверительный интервал для дисперсии, соответствующийуровню надежности g.Пример 3.11.
Даны результаты наблюдений случайной величины,имеющей нормальный закон распределения с неизвестными параметрами:Х 1 = 0,7 , Х 2 = 3,1 , Х 3 = -0,9 , Х 4 = 1,8 , Х 5 = 2, 2 , Х 6 = -0,3 , Х 7 = 1,9 ,Х 8 = 4,2 , Х 9 = 1,5 , Х 8 = 2,8 . Требуется построить доверительный интервалдля дисперсии при уровне надежности g = 0,9 .Решение. Оценим сначала математическое ожидание:0,7 + 3,1 - 0,9 + 1,8 + 2,2 - 0,3 + 1,9 + 4,2 + 1,5 + 2,8M (X ) » X=1,7 .10По формуле (3.1.3) оценим дисперсиюnå(X- X )2(0,7 - 1,7)2 + (3,1 - 1,7) 2 + K + (2,8 - 1,7) 2=» 2,39.D( X ) » sn -19Обратимся к таблице распределения «хи-квадрат» (см. прил., табл. П4).2i =1i198= g) / 2 =Для величины n1 входы таблицы: r = n – 1 =10 – 1 =9 и b (1 += (1 + 0,9) / 2 = 0,95.
По таблице находим n1 = 3,32. Для n2 входы таблицы:r = n – 1 = 9 и b (1 =– g ) / 2 = 0,05. По таблице находим n 2 = 16,92.В итоге с вероятностью g = 0,9 имеем, в соответствии с формулой(3.5.1),9 × 2,399 × 2,329 × 2,393,32 << 16,92 или 1,27 =< s2 <= 6,29.2s16,923,32Для среднего квадратического отклонения имеем с той женадежностью g = 0,9 доверительный интервал 1,13 < s < 2,5.Ответ.
(1,27;6,29).Задача 3.11. По приведенным данным наблюдений случайнойвеличины X, имеющей нормальный закон распределения, постройтедоверительный интервал для дисперсии при уровне надежности g = 0,96 внечетных вариантах и g = 0,8 в четных вариантах. (См. пример 3.11 иисходные данные.)Исходные данные к задаче 3.11.№X1X2X3X4X5X6X7X8X911,90,43,31,50,92,62,41,42,723,52,12,42,80,52,52,80,52,533,72,93,66,34,43,25,14,82,142,61,53,32,50,94,92,23,14,251,70,23,11,32,40,71,22,52,262,81,51,72,71,15,12,24,53,373,66,25,14,43,24,82,13,72,981,60,13,01,20,62,32,11,12,493,22,40,84,82,13,04,12,51,4101,52,90,11,10,42,22,01,02,3112,30,74,72,02,94,02,41,33,1120,31,40,02,81,02,11,90,92,2135,03,42,61,02,33,21,64,32,7142,23,60,61,12,71,72,61,52,9153,62,31,20,72,91,82,73,01,6162,03,40,42,70,92,51,51,32,4176,13,14,35,04,72,03,62,83,5182,60,33,21,40,81,31,82,52,3190,92,62,41,42,71,90,43,31,5202,80,52,52,80,52,53,52,12,4216,34,43,23,72,93,65,14,82,1224,92,23,14,22,61,53,32,50,9230,23,11,32,41,70,71,22,52,2241,72,71,15,12,22,81,54,53,3253,24,82,13,72,93,66,25,14,4262,32,11,12,41,60,13,01,20,6199272829300,82,94,02,64,80,12,41,02,11,11,32,33,00,43,13,24,12,24,71,62,52,02,04,31,41,02,32,73,22,30,75,02,41,52,93,43.6.
Проверка статистических гипотез3.6.1. Основные понятияСтатистической гипотезой называется гипотеза, которая относитсяк виду функции распределения, к параметрам функции распределения, кчисловым характеристикам случайной величины и т.д., и которую можнопроверить на основе опытных данных. Например, предположение о том,что отклонение истинного размера детали от расчетного имеет нормальныйзакон распределения, является статистической гипотезой. Предположениео наличии жизни на Марсе статистической гипотезой не является, так каконо не выражает какого-либо утверждения о законе распределения илииных характеристиках случайной величины.Рассмотрим упрощенный пример. Пусть выдвинута гипотеза о том,что плотность вероятности f(x) случайной величины X имеет вид,изображенный на рис. 3.3.f(x)XabPис.
3.6.1Есть возможность произвести только одно наблюдение. В этомслучае выборочным пространством служит числовая ось. Из рис. 3.6.1видно, что значения случайной величины из отрезка [a, b] имеютотносительно большую плотность вероятности и попадание наблюдаемогозначения в этот отрезок не противоречит гипотезе. Напротив, значения внеэтого отрезка в соответствии с гипотезой маловероятны, и реализацияодного из этих значений говорит не в пользу гипотезы. В этом упрощенномпримере важно следующее: выборочное пространство W мы разбили на двечасти. Одну из них, точки вне отрезка [a, b] , обозначим через W0 и назовемкритической областью.
Если наблюдение попадает в W0, то гипотезуотвергаем, а если не попадет, то будем считать гипотезу непротиворечащей опытным данным или правдоподобной.200В случае выборки объема n по тому же принципу разбиваютвыборочное пространство на две части. Одну их них, выборки самыемаловероятные при данной гипотезе, обозначают через W0 и называюткритической областью. В случае попадания выборки в критическуюобласть гипотезу отвергают.
В противном случае признают гипотезу непротиворечащей опытным данным. Если говорить о проверке гипотез сточки зрения статистических решающих функций, то, приписав каждойвыборке определенное решение, принять или отвергнуть гипотезу, мы темсамым разбиваем выборочное пространство на две части: область принятиягипотезы и критическую область.Статистическим критерием называют правило, указывающее,когда статистическую гипотезу следует принять, а когда отвергнуть.Построение статистического критерия сводится к выбору в выборочномпространстве критической области W0, при попадании выборки в которуюгипотеза отвергается. Обычно в критическую область включают самыемаловероятные при данной гипотезе выборки.Даже при верной гипотезе наблюдения могут сложитьсянеблагоприятно, в итоге выборка может попасть в критическуюr область игипотеза будет отвергнута.