Б.В. Гнеденко - Курс теории вероятностей (1119912), страница 58
Текст из файла (страница 58)
Сама гипотеза о существовании априорного распределения параметров не всегда осмысленна. В самом деле, как можно говорить о распределении параметра а а законе Пуассона для любой задачи, я которой характеризующая зту задачу случайная величина распределена по закону Пуассона? Однако, если условная вероятность (2) не зависит от значений параметров и равна одному и тому же значению ы, то естественно считать безусловную вероятность (1) существующей и равной ы даже в тех случаях, когда существование априорного распределения параметров не предполагается.
Условимся говорить, что предлагаемое правило имеет доверительную вероятность ы, если при всех возможных значениях параметров условная вероятность (2) равна ы. Обратимся теперь к рассмотренным в $ 60 задачам. В случае первой из рассмотренных зам задач положим «( в «з а =и+ — о; а =и+ — о, з/й ',/й Каковы бы ни были значения параметров а и о, мы имеем, очевидно: 1 ( «зо «,о .(. «..
~<.1=.1.— — <ю<.— †...) = ~гй,я -и и =+1- '1-Ъ)-= —,,—./- '1-~)' -и Отсюда мы заключаем, что доверительная вероятность правила «(о «гв В+ — < а < В+— з/и з/и равна ц В частности, имеем, следовательно, равенство Во второй задаче мы считаем известным параметр а, тогда как параметр а подлежит оценке. Положим в,<Гй я в,(й 11 <2 348 Глава 1!. Элементы статистики где 1 — (хз — а)' з=! Легко видеть, что В $ 21 (распределение з~г) мы нашли плотность распределения величины з при условии, что а и е заданы. Именно Отсюда мы находим, что кг, /</а <чг/</й н Мы видим, что условная вероятность неравенств О' <<т<е при условии, что параметры а и гт известны, не зависит от значений этих параметров.
Следовательно, по предыдущему, доверительная вероятность правила 1 — (хз — а)' з=~ равна 21"-г)/гГ(п/2) / " ( 2 1 н Перейдем, наконец, к рассмотрению последней задачи, когда оба параметра а и е неизвестны. Положим а', =х+с~з/йзг и аг =х+сгзуйзн за~ и е~ —— 1г 063. Доверительные границы и доверительные вероятности 349 где 1 в! — — — Е (х» — х)2 к=! При условии, что о и о заданы, мы имеем: о — х <(4«!!, 2=~(« — « . ) в! з/и Р(о! < о < с,~!о,озу = Р~$2 < — < $! а,сг ( в! т/й а — х Нам нужно найти теперь условные плотности распределения лля— в! т/и в! т/й и — при условии, что о и о известны.
Так как о ь — (хк — а) и к ! ь Е (хк — х')2 к=! ч где хк — — хк-а и х' = — ~, хк (величины хк независимы и распределены и к=! нормально с математическим ожиданием 0 и дисперсией !тз). Введем теперь и и-мерном пространстве (х',,х»,..., х'„) новую ортогональную систему координат (р!, рз,..., р„) так, чтобы у! =,/и х',. При этом пв! = ~~! (хк — х') = ~~! хк — пх' = ~~! ук — р! —- ~ ук к=! и, следовательно, х — о у! 8! т/Я п~ рк )! «=г Так как и ! рк = ~~ ак2х, <=! где величины аы уловлетаоряют соотношениям ~1 при 2 =х, 7;а!за к -— (О при 2;612 350 Глава 11.
Элементы статистики и величины х'; нормально распределены, то величины у» также нормально распределены. Далее Му» = О (к = 1, 2,..., и). Наконец, из того, что к н ( 2 )2 2%~ (Е ПРИ 2=2Г МУ2У» = 1 абаз»Мх' = е ~~а;.а» = ~~ О при »фй, мы заключаем о независимости величин у» (й = 1, 2,..., и) и о том, что 0у» = е2 (й = 1, 2,..., и). Так как далее у~ У~ т/и — 1 и к Еу» Е у,' »ю2 »=2 и — 1 и в этой дробной числитель и знаменатель независимы, причем плотность распределения числителя равна ,/В - 1 ( х2 ехр ~ — — (и — 1) е~/2я ( 2е2 а плотность распределения знаменателя (согласно В 21, распределение уз) равна ,,г(,-ц („„к-т) -' ( р еГ 2 то согласно в 21 (распределение Стьюдента) плотность распределения частного у~ равна н < Г фгГ Плотность распределения величины, как в этом легко убеу~ и 2, У» диться, равна ,/йГ 1с(х~а,е) =,, (1+их ) чгкГ~— 2 1 в 63.
Доверительные границы и доверительные вероятности 351 следовательно, .(.,«' **.1= в~з/и 1 'и — 1' з/яГ~ — ), 2 с~а~з/и < а — я < сза,ъ/й равна ь/и Г Нам остается найти доверительную вероятность правила, устанавливающего границы для <т. Использовав произведенные нами преобразования, находим, что 1,, «. л~.,.1-.(ь < "<т <,(.,.(= о — р <за< ") я ~~> рь < 1~о Отсюда, в силу результатов 5 21 (распределение Хз) Р(о( < о «т((а, о1 = <<2( — ~) ~ (<< — |) ( < (" 0( оà — иа,,Б=-, Г~ ~— Снова эта вероятность не зависит от значений параметров а и о. Следовательно, правило з/йа ~ з/йа ~ — <о<— $з Эта вероятность не зависит от значений, которые принимают параметры а и о.
Мы можем поэтому сказать, что в третьей задаче доверительная вероятность правила Зб2 Глава 11. Элементы статистики имеет доверительную вероятность, равную 8 ы = л ехр — — Йл. 2(" ~1/ à — и Заметив в заключение, что из того, что прн любых Вн Вм..., В» имеет место равенство Р(В' < В < В" ~Вн Вм..., В») = и из него вытекает равенство ( ) еще не следует, что и = Р(В'(хи хз,..., х„) < В < Вк(хм хн..., х„) (хи хн..., х„). 564. Проверка статистических гипотез Р(х) = 0 при х<0, 1 — р при 0<х<1, 1 прн х) 1. Параметр р, от которого зависит распределение, неизвестен.
Наша задача состоит в том, чтобы проверить гипотезу р < ре. Предположим, что иам известна функциональная форма распределения случайной величины С', но неизвестны значения параметров Вн Вм..., В», от которых оно зависит. Имеются основания считать, что параметры имеют некоторые определенные значения В, = Вы Вз = В~», ..., В» = В»ю (простая гипотеза) или же принадлежат некоторому множеству (сложная гипотеза).
Требуется выяснить, подтверждают или не подтверждают зту гипотезу результаты наблюдений над величиной с. Для того чтобы подчеркнуть практическую важность задачи, рассмотрим примеры. Пример 1. Имеется большая партия продукции некоторого производства. Каждая единица этого продукта относится к одной из двух категорий: годная, бракованная. Вся партия считается пригодной к сдаче, если относительное число р бракованных единиц продукта невелико, скажем, не больше, чем некоторое число ре (О < ре < 1).
Число р нам неизвестно; его нужно найти путем исследования сравнительно небольшого (по отношению ко всему объему партии) числа изделий. Рассмотрим случайную величину с, равную О, если взятое наудачу изделие окажется пригодным, и равную 1, если взятое наудачу изделие окажется бракованным. Функция распределения С равна ЗВЗ 5 64. Проверка ствтистическик гипотез Пример д Случайная величина с распределена нормально 1 ( (х — а)з1 р(х) = — ехр ~- счг2к ( 2сз параметры а и о неизвестны.
Требуется проверить гипотезу, что )а — ао)<а и с(со где ао, со и а — некоторые известные числа. Эти и аналогичные задачи постоянно возникают в теории измерений, а также в естественнонаучных и производственных задачах. Обозначим через и число наблюдений, на основании которых необходимо сделать заключение о подтверждении или опровержении сделанной гипотезы. Пусть хи хм...,х„ (1) результаты этих наблюдений. Процесс проверки, ведуший к подтверждению или опровержению гипотезы, есть некоторое правило, согласно которому множество В„всех возможных результатов и наблюдений разбивается на две непересекаюшие части Вю и В„з.
При этом приналлежность чисел (1) к множеству В„, будем считать подтверждением проверяемой гипотезы, а принадлежность их к множеству В„з — отрицанием проверяемой гипотезы. Если мы станем изображать числа (1) как координаты и-мерного евклидова пространства В„„то, очевидно, каждый процесс проверки означает разбиение пространства В на части В„, и В„з. Прн этом, если точка (хн хп..., х„) оказывается в части В„п то гипотеза принимается, а если (хн хз,..., х„) оказывается в части Вяз, то гипотеза отбрасывается. Множество В„з носит название критической области.
Выбор правила проверки, таким образом, эквивалентен выбору критической области. Для иллюстрации вернемся к примеру 1. Множество В в этом случае состоит из всевозможных совокупностей п чисел, каждое из которых может принимать лишь значения 0 н 1. Критическая область В„з состоит из тех элементов В„, для которых 1 — (х, +хо+...+х„) >р,. Мы перейдем теперь к следуюшей частной задаче проверки гипотез, для которой имеется точное решение: имеются две простые гипотезы Н1 и Нз. 1ипотеза Н~ состоит в том, что д< = д,' (( = 1, 2,..., й), гипотеза Нз — в том, что д; = д," (( = 1, 2,..., Й).
Эти гипотезы конкурируют друг с другом и на основанйи произведенных наблюдений требуется одной из них отдать предпочтение. Заметим, что при подтверждении или отрицании гипотезы Нм мы можем совершить ошибки двух видов. Ошибку первого рода мы совершаем тогда, когда отвергаем Н~ в то время, когда в действительности она верна. Иными словами, ошибки первого рода имеют место тогда, когда точка (хи хо,...,х„) попадает в область В„з в то время, когда верна и курс тсорнч мраатнасчео 354 Глава П. Элементы статистики гипотеза Нп Ошибку второго рода мы совершаем в том случае, если принимаем Н~ в то время, когда она неверна. Если критическая область выбрана, то вероятности ошибок первого и второго рода можно рассчитать; обозначим их для данных и и Воз соответственно буквами а~ и аз.