Б.В. Гнеденко - Курс теории вероятностей (1115334), страница 61
Текст из файла (страница 61)
Условимся говорить, что предлагаемое п р а в и л о и м е е т д о в ерит ель ну ю вероятность сг, если прн всех возможныхзначениях параметров условная вероятность (2) равна ы. Обратимся теперь к рассмотренным в а 60 задачам. В случае первой из рассмотренных там задач положим 1 г а =х+ — о; и г т а =х+ — о. Каковы бы ни были значения параметров а и о, мы имеем, очевидно: гго г,о ~ Р(а'( а< а" ~а, о)=Р а — — < х < а — — и, о „~л- .л, 1 13 гг 3' е-"1гс1г= / — г*/2,1г /~я г2 х/2я Отсюда мы заключаем, что доверительная вероятность правила тга тго х+ — < а(х+— равна гг ы= / е-г'!г,1г г1 о = г ~/л/Гг, о' = ух/л/г,, где l г 1 г = ь~ — Е (х„ — а) . л ь 1 В частности, имеем, следовательно, равенство Р 1а — х ! ( — о ~ = — )' е ' 1ггй.
,/;,/2я ° Во второй задаче мы считаем известным параметр а, тогда как параметр о подлежит оленке. Положим Гл. 11. Элементы статистики 372 Легко видеть, что Р(о < о < о !а, о) = Р(огз/х/л < т < гто/х/л )а, о). В а 21 (распределение Х') мы нашли плотность распределения величи- ны а приусловии,что а и о заданы. Именно Отсюда мы находим, что / л — 1 — с*12 ! л — 2 2 Г(п/2) Мы видим, что условная вероятность неравенств о <о<о при условии, что параметры а и о известны, не зависит от значений этих параметров.
Следовательно, по предыдущему, доверительная вероятность правила л (хь — а)2 < о < — х/ Х (ха — а)' 12 с=1 равна ! ! ал — 1е — е !2112 Г(и/2) л — 2 2 з/2п оГ(л/2) ет,lч л у л , у;/и( оГ(и/2) ох/2 а 63. доверительные гранины Перейдем, наконец, к рассмотрению последней задачи, когда оба параметра а и о неизвестны. Положим л + сг ьГ па!, а, = х + сг ь!гпгг ! о! = ь/пг! /тг, о! ъ/лаг /Гг, где — г г, = — Х (хк — х) л к=! При условии, что а и о заданы, мы имеем: а — х Р(а! <а<а, [а,о) =Рс, — « се[а,о г, ь/л аг ч/я Р(о' ,< о < от[а о) = Р гг « — г,[а о а — х Нам нужно найти теперь условные плотности распределения Лдя н а! ь/л юг !!/и — при условии,что а и о известны.
Так как о 1 — Х (х* — а) клг ! х х — а л (х' х !)г г, ч/л л Х [(хг, — а) — (х — а)[г л где х' = х„— а и х = — Х х„' (величины х' независимы и распределены к Л к к=1 нормально с математическим ожиданием 0 н дисперсией о ) . Введем теперь в л-мерном пространстве (х,, хе, ..., х„) новую ортогональную систему координат (у,, уа, ., ул) так, чтобы уг = ь/л х,'. Ги. 1!. Элементы статистики При этом « « « « л»2 = Х (х'„- х')2 = Х х'2 — лх'2 = Х ут-уз = Х ут !с 1 » 1 » 1» 2 и, следовательно, х — а У! з! ч/л / л у,', !с = 2 Так как у»= Х а»х;, 1= ! где величины а»; удовлетворяют соотношениям « 1 при !' Iс, Х а!!а!» = !« О при ! ь » и величины х! нормально распределены, то величины у„танже нормально распределены.
Далее Му» = О (к = 1, 2, ..., и), Наконец, из того, что « « ! а при !' = », Му,у»= Х а!!а!»Мх, =о' Х аца„=, ! =- 1 1«! 10 прн !и»/с, мы заключаем о независимости величин у» (/с = 1, 2, ..., л) и о том, что Ру» = о' (1с = 1, 2, ..., л) . Так как далее у, /з/г~ — 1 у! « « Х ут ( Х ут)/(л .. 1) »=2 !с = 2 и в этой дроби числитель н знаменатель независимы, причем плотность рас- Гл. ! 1. Элементы статистики 376 Эта вероятность не зависит от значений, которые принимают параметры а и о. Мы можем поэтому сказать,что в третьей задаче до в е р и тел ь н а я вероятность правила С11, т/Л < а — Х < Сгтг т/Л равна т/л Г(л!'2) 11 = ) (1+11х ) «721(х.
ъ/лГ Нам остается найти доверительную вероятность правила, устанавливающего гранины для о. Использовав произведенные нами преобразования, находим, что 31 ~/Л Р(о,'< о < ог'1а, о) л Р)гг < < 11 ~а, о = Р(!го < х/ Х уаг < гго ~а,о). Отсюда, в силу результатов 5 21 (распределение уг) пс у 1«-1) ~1л — 1 1~« — 2«а ! е Ыу= оч' 2 ,/ «-1 2 2" Е Ыг. л — 3 2 Г( — ) Снова эта вероятность не зависит от значений параметров а и о. Следова- тельно, пра в ил о х/л 11 ~/Л 11 <о<— 11 12 377 з а4. Проверка статистических гипотез имеет доверительную в еро ятно оть, равную 2 г" з е с11.
ь з 2 Г( — ) Заметим в заключение, что из того, что при любых В г, О,, ..., Вь имеет место равенство Р(В < 0 < В 1О,, 0„.,„, Ве) = сс и из него вытекает равенство Р(В <0<0 )=ш, еще не следует, что оз = Р(0'(х,,х,,...,х„) < < В < В '(х,, хз, ..., х„) ~ х,, х,, „. „х„) з 64. Проверка статистических гипотез Предположим, что нам известна функциональная форма распределения случайной величины 3, но неизвестны значения параметров В,, Вз, ..., Ва, от которых оно зависит.
Имеются основания считать, что параметры имеют некоторые определенные значения В, = В,, Вт = В„..., 0„= В„(простая о о о гипотеза) или же принадлежат некоторому множеству (сложная гипотеза) . Требуется выяснить, подтверждают или не подтвержцают зту гипотезу результаты наблюдений над величиной $. Для того чтобы подчеркнуть практическую важность задачи, рассмотрим примеры. П р и м е р 1. Имеется большая партия продукции некоторого производства. Каждая единица зтого продукта относится к одной из двух категорий годная, бракованная. Вся партия считается пригодной к сдаче, если относительное число р бракованных единиц продукта невелико, скажем„ не больше, чем некоторое число ре (О < ре < 1) .
Число р нам неизвестно; его нужно найти путем исследования сравнительно небольшого (по отношению ко всему объему партии) числа изделий. Рассмотрим случайную величину $, равную О, если взятое наудачу изделие окажется пригодным, и равную 1, если взятое наудачу изделие окажется бракованным. Функция рас- Гж 11. Элементы статистики 378 пределения $ равна прн х ~ О, при 0<х <1. при х > 1. Р(х) = 1 — р Параметр р, от которого зависит распределение, неизвестен, Наша задача состоит в том, чтобы проверить гипотезу р ~ р,.
П р и м е р 2. Случайная величина $ распределена нормально (а-а) 3 а~ р(х) = е о~/г параметры а и о неизвестны. Требуется проверить гипотезу, что ~а — аа ! < и и о ( оа, где ае, о, и и — некоторые известные числа. Эта и аналогичные задачи постоянно возникают в теории измерений, а также в естественно научных и производственных задачах. Обозначим через н число наблюдений, на основании которых необходимо сделать заключение о подтверждении или опровержении сделанной гипотезы.
Пусть хы хз,. резулыаты этих наблюдений. Процесс проверки, ведущий к подтверждению или опровержению гипотезы, есть некоторое правило, согласно которому множество всех возможных результатов н наблюдений разбивается на две непересекающиеся части А„, и А„з.
При этом принадлежность чисел (1) к множеству А„, будем считать подтверждением проверяемой гипотезы, а принадлежность их к множеству А„з — отрицанием проверяемой гипотезы. Если мы станем изображать числа (1) как координаты п.мерного евклидова пространства А„, то, очевидно, каждый процесс проверки означает разбиение пространства А„на части А„г и А з.
При этом, если точка (х„хз, ..., х„) оказывается в части А„,, то гипотеза принимается, а если (х„хз, ..., х„) оказывается в части А„з, то гипотеза отбрасывается, Множество А„з носит название к р и т и ч е с к о й о б л а с т н. Выбор правила проверки, таким образом, эквивалентен выбору критической области. Для иллюстрации вернемся к примеру 1. Множество А„в этом случае состоит из всевозможных совокупностей и чисел, каждое из которых мо- а 64. Проверка статистических гипотез 379 жег принимать лишь значения 0 и 1. Критическая область Явз состоит из тех элементов А„, для которых — (хг +хэ + — + хв) > Ро.
1 л Мы перейдем теперь к следующей частной задаче проверки гипотез, для которой имеется исчерпывающее решение: имеются две простые гипотезы Н, и Н,. Гипотеза Н, состоит в том, что Ое = О, (1 = 1, 2, ..., х), гипотеи эа Н, — в том, что О, = Ог (1 = 1, 2, ..., 1Г).
Эти гипотезы конкурируют друг с другом и на основании произведенных наблюдений требуется одной из них отдать предпочтение. Заметим, что при подтверждении или отрицании гипотезы Н, мы можем совершить ошибки двух видов. Ошибку первого рода мы совершаем тогда, когда отвергаем Н, в то время, когда в действительности она верна. Иными словами, ошибки первого рода имеют место тогда, когда точка (х,, хз, ..., х„) попадает в область Я„э в то время, когда верна гипотеза Н,.
Ошибку второго рода мы совершаем, если принимаелг Н, в то время, когда она неверна. Если критическая область выбрана, го вероятности ошибок первого и второго рода можно рассчитать; обозначим их для данных л и 11„э соответственно буквами а, и пз. Понятно, что чем меньше для данной критической области числа а, и ат, тем удачнее выбрана критическая область.