Книга - Теория вероятности и математическая статистика (1082418), страница 12
Текст из файла (страница 12)
Вычисляем оценку m∗ , которая является средним арифметическим элементоввыборки X 1 ,..., X n , и по формуле (8.4.13) вычисляем выборочную оценку дисперсии.2. Вычисляем квантили rγ +1 и r1-γ χ 2 –распределения с n − 1 степенью свободы.223. По формуле (8.4.14) получаем искомый доверительный интервал.Пример 5. Найти доверительный интервал с доверительной вероятностью 0,95 дляоценки математического ожидания, нормально распределенной случайной величины X ,если известны ее дисперсия σ 2 = 16 , выборочная средняя m∗ = 16 и объем выборкиn = 16 . Решение. По условию задачи γ = 0,95 . Найдем квантиль t γ +1 = t 0 ,95 +1 = t0 ,975 нор22мального распределения с параметрами (0,1) , используя, например EXCEL: применяяфункцию НОРМСТОБР(0,975), получим t0 ,975 = 1,96 .Применив (8.4.6), получим62m∗ −16 −σn4t γ +1 < m < m ∗ +2σn4t γ +1 ,21,96 < m < 16 +1,96,161614 ,04 < m < 17 ,96.
zПример 6. Случайная величина X распределена по нормальному закону. Статистический ряд выборки представлен таблицей:3578101214Zi3746758niТребуется:1) построить доверительный интервал для оценки математического ожидания, если доверительная вероятность равна 0,97;2) построить доверительный интервал для оценки дисперсии, если доверительнаявероятность равна 0,95. Решение. Для оценки математического ожидания будем использовать формулу(8.4.9), т.к.
дисперсия неизвестна. Вычислим все величины, присутствующие в (8.4.9).Объем выборки n = 3 + 7 + 4 + 6 + 7 + 5 + 8 = 40 .Оценка математического ожидания:1 71362m∗ = ∑ ni Z i = (3 ⋅ 3 + 7 ⋅ 5 + 4 ⋅ 7 + 6 ⋅ 8 + 7 ⋅ 10 + 5 ⋅ 12 + 8 ⋅ 14) == 9 ,05 .n i =14040Исправленная выборочная дисперсия:∗21 7493,9S2 =ni Z i − m∗ == 12 ,664 .∑39n − 1 i =1Корень квадратный исправленной выборочной дисперсии:()∗S ∗ = S 2 = 12 ,664 = 3,559.Для доверительной вероятности γ = 0,97 найдем квантиль t γ +1 = t 0 ,97 +1 = t0 ,98522t -распределения) с v = n − 1 = 40 − 1 = 39 числом степеней свободы.
Для этого используем,например, функцию qt(p, d) из MATHCAD: qt (0.985,39 ) = 2.252 .Доверительный интервал имеет вид:3,5593,5599, 05 −2, 252 < m < 9, 05 +2, 2524040и окончательно7 ,77 < m < 10 ,33 .Перейдем ко второй части задачи. Для оценки дисперсии будем использовать формулу (8.4.14), т.к. математическое ожидание неизвестно. Для данной формулы необходимо вычислить квантили rγ +1 = r0 ,95 +1 = r0 ,975 и r1-γ = r1- 0,95 = r0 ,025 . Используя функцию222qchisq(p, d)изMATHCAD,получим:r0 ,025 = qchisq(0.025,39) = 23.654 .Доверительный интервал имеет вид:39 ⋅ 12 ,66439 ⋅ 12 ,664<σ2 <58,1223,654и окончательно8,50 < σ 2 < 20 ,88 . z632r0 ,975 = qchisq(0.975,39) = 58.12иГлава 9.
Проверка статистических гипотез§1. Основные понятияОпределение. Статистической гипотезой называется любое предположение H 0(гипотеза) о виде закона распределения генеральной совокупности или о числовых значениях параметров закона распределения.Определение. Правило, по которому гипотеза H 0 принимается или отвергается,называется статистическим критерием.Проверяемую гипотезу H 0 называют нулевой, а противоположную ей гипотезу H 1называют альтернативной.Схема проверки нулевой гипотезы:1. Используя проверочные данные X 1 ,..., X n и учитывая условия задачи, принимаютнулевую гипотезу H 0 и альтернативную гипотезу H 1 .2.
По случайной выборке X 1 ,..., X n определяется функция S ( X 1 ,..., X n ) , называемаястатистикой, для которой будет известен точный или приближённый закон распределения.3. По заранее выбранной малой вероятности α определяется критическая областьWk , для которой P(S ( X 1 ,..., X n ) ∈Wk ) = α . И если величина S ( X 1 ,..., X n ) , вычисляется приконкретной выборке X 1 ,..., X n , окажется вне критической области Wk , то гипотеза H 0принимается, а если она окажется в области Wk , то гипотеза H 0 отвергается (или принимается гипотеза H 1 ). При этом возможны 4 случая, которые представлены в таблице 9.1Таблица 9.1Верна гипотеза H 0вероятностьВерна H 1вероятностьПринимается H 0Отвергается H 0Правильное решениеОшибка первого рода1−αОшибка второго родаαβПравильное решение1− βОпределение.
Вероятность α допустить ошибку первого рода называется уровнемзначимости критерия.Определение. Вероятность 1 − β не допустить ошибку второго рода называетсямощностью критерия.Если использовать терминологию качества продукции, то α — это «риск поставщика», связанный с забраковкой по результату выборки всей партии товара, соответствующей стандарту, а β — «риск потребителя», связанный с принятием по результатамвыборки партии товара, не соответствующей стандарту.Возможны три варианта расположения критической области:1. Правосторонняя критическая область (рис 9.1), состоящая из интервала (t крR , ∞ ) , гдеt крR определяется из условия:()P S ( X 1 ,..., X n ) > t крR = α .(9.1.1)642.
Левосторонняя критическая область (рис 9.2), состоящая из интервала (− ∞ ; t крL ) ,где t крL определяется из условия:()P S ( X 1 ,..., X n ) < t крL = α .(t(9.1.2)3. Двусторонняя критическая область (рис 9.3), состоящая из интервалов (− ∞ ; t крL ) иRкр), ∞ , где точки tкрL и t крR определяется из условий:()P S ( X 1 ,..., X n )< tкрL =α2()и P S ( X 1 ,..., X n ) > t крR =α2.(9.1.3)В следующих параграфах рассмотрим несколько конкретных практических примеров.§2.
Проверка гипотезы о значении математического ожиданияПусть из генеральной совокупности X , распределенной по нормальному закону спараметрами m ,σ 2 при неизвестном математическом ожидании m и неизвестной дисперсии σ 2 , взята случайная выборка X 1 ,..., X n объемом n и вычислена выборочная средняя арифметическая1 nm∗ = ∑ X i ,n i =1а m0 и m1 — определенные значения параметра m . Для проверки нулевой гипотезыH 0 : m = m0 при конкурирующей гипотезе H 1 : m = m1 используют статистику()m∗ − mn −1 ,(9.2.1)S∗которая при выполнении нулевой гипотезы H 0 имеет t - распределение (распределениеСтьюдента) с v = n − 1 степени свободы.Учитывая соотношения (9.1.1) — (9.1.3), определяем границы tкрL и t крR критическойT=области по таблицам t - распределения (распределения Стьюдента) или используя функцию СТЬЮДРАСПОБР(вероятность; степени_свободы) из EXCEL, или используя функцию qt(p, d) из MATHCAD.При проверке нулевой гипотезы H 0 : m = m0 при известной дисперсии σ 2 используют статистикуm∗ − mT=n,(9.2.2)σ65которая при выполнении нулевой гипотезы H 0 имеет нормальное распределение с параметрами (0,1) .Учитывая соотношения (9.1.1) — (9.1.3), определяем границы tкрL и t крR критическойобласти по таблицам нормального распределения с параметрами (0 ,1) или используяфункцию НОРМСТОБР(вероятность) из EXCEL, или используя функцию qnorm(ν, m, σ)из MATHCAD.Пример 1.
Поставщик двигателей утверждает, что средний срок их службы равен800 ч. Для выборки из 17 двигателей средний срок службы оказался равным 865 ч. При«исправленном» среднем квадратичном отклонении 120 ч. Проверить гипотезу о том, чтозначение 800 является математическим ожиданием при 1% уровне значимости. Решение. Предположим, что случайная величина среднего времени службыподчинена нормальному закону о числовом значении математического ожидания нормально распределённой величины (генеральной средней) при неизвестной генеральнойдисперсии. В этом случае в качестве критерия выбирают функциюm∗ − mT=n −1 ,S∗где m ∗ — выборочная средняя, m — математическое ожидание, S ∗ — «исправленное»выборочное среднее квадратичное отклонение.
Случайная величина T имеет t - распределение (распределение Стьюдента) с v = n − 1 степени свободы.Требуется найти критическую область для нулевой гипотезы H 0 : m = 800 при альтернативной гипотезе H 1 : m > 800 .Критическая область правосторонняя, tкрR находим из условия P (T > tкрR ) = α .При α = 0 ,01 и v = 17 − 1 = 16 в таблице t - распределения находим tкрR = 1,746 .
Та-ким образом, критическая область Wкр = (1,746 ; + ∞ ) . Найдем расчетное значение t расч ,полагая m = 800 :865 − 80065m∗ − mt расч =n −1 =16 =≈ 2 ,0167 .∗12030SОчевидно, что найденное значение t расч ≈ 2,0167 попадает в критическую область.Таким образом, нулевая гипотеза не подтверждается. z§3. Проверка гипотезы о равенстве математических ожиданийдвух генеральных совокупностейПусть X и Y — две генеральные совокупности с известными дисперсиями σ X2 иσ Y2 и неизвестными математическими ожиданиями m X и mY .
Из генеральных совокупностей взяты две независимые выборки X 1 ,..., X n и Y1 ,...,Yk и вычислены выборочные математические ожидания (средние) m∗X и mY∗ . Для проверки гипотезы о равенстве математических ожиданий H 0 : m X = mY используют статистикуT=m∗X − mY∗σ X2σ Y2,(9.3.1)+nkкоторая при выполнении нулевой гипотезы H 0 имеет нормальное распределение с пара-метрами (0,1) .66При неизвестных дисперсиях генеральных совокупностей либо требуется достаточно большой объем выборки для надежной и точной оценки, либо требуется, чтобы этидисперсии были одинаковы, в противном случае известные критерии малоэффективны.Если дисперсии генеральных совокупностей равны σ X2 = σ Y2 , то для проверки нулевой гипотезы H 0 : m X = mY , используют статистикуm ∗X − mY∗T=,(9.3.2)⎛ 11 ⎞ S (n X − 1) + S (nY − 1)⎜⎜+ ⎟⎟ ⋅n X + nY − 2⎝ n X nY ⎠имеющую t - распределение (распределение Стьюдента) с ν = n X + nY − 2 степенями свободы.Выбор критической области зависит от вида альтернативной гипотезы: при альтернативной гипотезе H 1 : m X > mY необходимо выбрать правостороннюю критическую область; при альтернативной гипотезе H 1 : m X < mY необходимо выбрать левостороннюю критическую область; при альтернативной гипотезе H 1 : m X ≠ mY необходимо выбрать двустороннююкритическую область.2∗X2∗YПример 2.
Средний ежедневный объём продаж за I квартал 2004 года для 17 торговцев района A составляет 15 тысяч рублей при “исправленном” среднем квадратичномотклонении 2,5 тысяч рублей, а для 10 торговцев района B — 13 тысяч рублей при «исправленном» среднем квадратичном отклонении 3 тысячи рублей. Существенно ли различие в объёме продаж в районах A и B при 5%–м уровне значимости. Решение. Решим задачу, предположив, что ежедневный объём продаж подчинённормальному закону при неизвестных параметрах распределения. Предположим, что дисперсии объёмов продаж одинаковы.