Теория универа (Теория вероятностей и математическая статистика. Теория и примеры решения задач), страница 13
Описание файла
Файл "Теория универа" внутри архива находится в следующих папках: Теория вероятностей и математическая статистика. Теория и примеры решения задач, ТВиМС, Экзамен. PDF-файл из архива "Теория вероятностей и математическая статистика. Теория и примеры решения задач", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "теория вероятности и математическая статистика" в общих файлах.
Просмотр PDF-файла онлайн
Текст 13 страницы из PDF
Эта случайнаявеличина, возможные значения которой будем обозначать t, имеет распределение Стьюдента(см. лекцию 12) с k = n – 1 степенями свободы.−nt2 2 , гдеПоскольку плотность распределения Стьюдента s(t , n) = Bn 1 + n −1nΓ 2Bn =, явным образом не зависит от а и σ, можно задать вероятность ее n −1π (n − 1)Γ 2 попадания в некоторый интервал (- tγ , tγ ), учитывая четность плотности распределения,tγxB − a< t γ = 2 ∫ s(t , n)dt = γ . Отсюда получаем:следующим образом: p s0ntγ stγ s =γ.p x B −< a < xB +(18.3)nn Таким образом, получен доверительный интервал для а, где tγ можно найти по соответствующей таблице при заданных п и γ.Пример.
Пусть объем выборки п = 25, х В = 3, s = 1,5. Найдем доверительный интервал для апри γ = 0,99. Из таблицы находим, что tγ (п = 25, γ = 0,99) = 2,797. Тогда2,797 ⋅ 1,52,797 ⋅ 1,53−< a < 3+, или 2,161< a < 3,839 – доверительный интервал, в который2525попадает а с вероятностью 0,99.3. Доверительные интервалы для оценки среднего квадратического отклонения нормальногораспределения.Будем искать для среднего квадратического отклонения нормально распределенной случайнойвеличины доверительный интервал вида (s – δ, s +δ), где s – исправленное выборочное среднееквадратическое отклонение, а для δ выполняется условие: p ( |σ – s| < δ ) = γ.δ δ δЗапишем это неравенство в виде: s1 − < σ < s1 + или, обозначив q = ,ssss(1 − q ) < σ < s(1 + q ) .(18.4)Рассмотрим случайную величину χ, определяемую по формулеsχ=n −1 ,σкоторая распределена по закону «хи-квадрат» с п-1 степенями свободы (см.
лекцию 12).Плотность ее распределения63PDF created with FinePrint pdfFactory trial version http://www.fineprint.comχR( χ , n) =n−2e−χ22n −32 n −1Γ 2 не зависит от оцениваемого параметра σ, а зависит только от объема выборки п. Преобразуемнеравенство (18.4) так, чтобы оно приняло вид χ1 < χ < χ2. Вероятность выполнения этого2χ2неравенства равна доверительной вероятности γ, следовательно,∫ R( χ , n)dχ = γ . Предполо-χ1жим, что q < 1, тогда неравенство (18.4) можно записать так:111< <,s(1 + q ) σ s (1 − q )или, после умножения на s n − 1 ,n −1n −1<χ<.
Тогда1+ q1− qn −1 s n −1n −1<<. Следовательно,1+ qσ1− qn −11− q∫ R( χ , n)dχ = γ . Существуют таблицы для распределения «хи-n −11+ qквадрат», из которых можно найти q по заданным п и γ, не решая этого уравнения. Такимобразом, вычислив по выборке значение s и определив по таблице значение q, можно найтидоверительный интервал (18.4), в который значение σ попадает с заданной вероятностью γ.Замечание. Если q > 1, то с учетом условия σ > 0 доверительный интервал для σ будет иметьграницы0 < σ < s(1 + q ) .(18.5)Пример.Пусть п = 20, s = 1,3. Найдем доверительный интервал для σ при заданной надежности γ = 0,95.Из соответствующей таблицы находим q (n = 20, γ = 0,95 ) = 0,37.
Следовательно, границыдоверительного интервала: 1,3(1-0,37) = 0,819 и 1,3(1+0,37) = 1,781. Итак, 0,819 < σ < 1,781 свероятностью 0,95.64PDF created with FinePrint pdfFactory trial version http://www.fineprint.comЛекция 19.Статистическая проверка статистических гипотез. Общие принципы проверкигипотез. Понятия статистической гипотезы (простой и сложной), нулевой иконкурирующей гипотезы, ошибок первого и второго рода, уровня значимости,статистического критерия, критической области, области принятия гипотезы.Наблюдаемое значение критерия. Критические точки. Мощность критерия.Критерии для проверки гипотез о вероятности события, о математическоможидании, о сравнении двух дисперсий.Определение 19.1.
Статистической гипотезой называют гипотезу о виде неизвестногораспределения генеральной совокупности или о параметрах известных распределений.Определение 19.2. Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.Пример. Пусть Н0 заключается в том, что математическое ожидание генеральнойсовокупности а = 3. Тогда возможные варианты Н1: а) а ≠ 3; б) а > 3; в) а < 3.Определение 19.3.
Простой называют гипотезу, содержащую только одно предположение,сложной – гипотезу, состоящую из конечного или бесконечного числа простых гипотез.Пример. Для показательного распределения гипотеза Н0: λ = 2 – простая, Н0: λ > 2 –сложная, состоящая из бесконечного числа простых ( вида λ = с, где с – любое число,большее 2).В результате проверки правильности выдвинутой нулевой гипотезы ( такая проверканазывается статистической, так как производится с применением методов математической статистики) возможны ошибки двух видов: ошибка первого рода, состоящая в том,что будет отвергнута правильная нулевая гипотеза, и ошибка второго рода, заключающаяся в том, что будет принята неверная гипотеза.Замечание.
Какая из ошибок является на практике более опасной, зависит от конкретнойзадачи. Например, если проверяется правильность выбора метода лечения больного, тоошибка первого рода означает отказ от правильной методики, что может замедлить лечение, а ошибка второго рода (применение неправильной методики) чревата ухудшениемсостояния больного и является более опасной.Определение 19.4. Вероятность ошибки первого рода называется уровнем значимости α.Основной прием проверки статистических гипотез заключается в том, что поимеющейся выборке вычисляется значение некоторой случайной величины, имеющейизвестный закон распределения.Определение 19.5.
Статистическим критерием называется случайная величина К сизвестным законом распределения, служащая для проверки нулевой гипотезы.Определение 19.6. Критической областью называют область значений критерия, прикоторых нулевую гипотезу отвергают, областью принятия гипотезы – область значенийкритерия, при которых гипотезу принимают.Итак, процесс проверки гипотезы состоит из следующих этапов:1) выбирается статистический критерий К;2) вычисляется его наблюдаемое значение Кнабл по имеющейся выборке;65PDF created with FinePrint pdfFactory trial version http://www.fineprint.com3) поскольку закон распределения К известен, определяется (по известному уровнюзначимости α) критическое значение kкр, разделяющее критическую область иобласть принятия гипотезы (например, если р(К > kкр) = α, то справа от kкр располагается критическая область, а слева – область принятия гипотезы);4) если вычисленное значение Кнабл попадает в область принятия гипотезы, то нулеваягипотеза принимается, если в критическую область – нулевая гипотеза отвергается.Различают разные виды критических областей:- правостороннюю критическую область, определяемую неравенством K > kкр ( kкр > 0);- левостороннюю критическую область, определяемую неравенством K < kкр ( kкр < 0);- двустороннюю критическую область, определяемую неравенствами K < k1, K > k2(k2 > k1).Определение 19.7.
Мощностью критерия называют вероятность попадания критерия вкритическую область при условии, что верна конкурирующая гипотеза.Если обозначить вероятность ошибки второго рода (принятия неправильной нулевойгипотезы) β, то мощность критерия равна 1 – β. Следовательно, чем больше мощностькритерия, тем меньше вероятность совершить ошибку второго рода. Поэтому послевыбора уровня значимости следует строить критическую область так, чтобы мощностькритерия была максимальной.Критерий для проверки гипотезы о вероятности события.Пусть проведено п независимых испытаний (п – достаточно большое число), в каждом изкоторых некоторое событие А появляется с одной и той же, но неизвестной вероятностьютпоявлений А в этой серии испытаний. Проверимр, и найдена относительная частотаппри заданном уровне значимости α нулевую гипотезу Н0, состоящую в том, чтовероятность р равна некоторому значению р0.Примем в качестве статистического критерия случайную величинуM − p0 nnU=,(19.1)p0 q0имеющую нормальное распределение с параметрами M(U) = 0, σ(U) = 1 (то есть нормированную).
Здесь q0 = 1 – p0. Вывод о нормальном распределении критерия следует изтеоремы Лапласа (при достаточно большом п относительную частоту можно приближенносчитать нормально распределенной с математическим ожиданием р и средним квадратиpqческим отклонением).nКритическая область строится в зависимости от вида конкурирующей гипотезы.1)Если Н0: р = р0, а Н1: р ≠ р0, то критическую область нужно построить так, чтобывероятность попадания критерия в эту область равнялась заданному уровню значимости α.При этом наибольшая мощность критерия достигается тогда, когда критическая областьαсостоит из двух интервалов, вероятность попадания в каждый из которых равна .2Поскольку U симметрична относительно оси Оу, вероятность ее попадания в интервалы (∞; 0) и (0; +∞) равна 0,5, следовательно, критическая область тоже должна быть66PDF created with FinePrint pdfFactory trial version http://www.fineprint.comсимметрична относительно Оу.
Поэтому икр определяется по таблице значений функции1−αЛапласа из условия Ф(и кр ) =, а критическая область имеет вид (−∞;−и кр ) ∪ (и кр ;+∞) .2Замечание. Предполагается, что используется таблица значений функции Лапласа,хзаданной в виде Ф( х) = ∫ е−t22dt , где нижний предел интегрирования равен 0, а не -∞.0Функция Лапласа, заданная таким образом, является нечетной, а ее значения на 0,5меньше, чем значения стандартной функции Ф(х) (см. лекцию 6).Далее нужно вычислить наблюдаемое значение критерия:т − p0 nnU набл = .(19.2)p0 q0Если |Uнабл| < uкр, то нулевая гипотеза принимается.Если |Uнабл| > uкр, то нулевая гипотеза отвергается.2) Если конкурирующая гипотеза Н1: р > p0, то критическая область определяетсянеравенством U > uкр, то есть является правосторонней, причем р(U > uкр) = α.