Теория вероятности. Вентцель Е.С (4-е издание) (1082431), страница 27
Текст из файла (страница 27)
Очевидно, это есть некоторая случайная величина. Закон распределения этой случайной величины зависит от закона распределения случайной величины Х, над которой производились опыты, и от числа опытов а. Вели гипотеза Н верна. то закон распределения зелпчяны У определяется законом распределения величины Х (функцией г"(х)) и числом л. Допустим.
что этот закон распределения нам пав~стен. 3 ре- ультате данной серии опытов обнаружено, что выбранная нами мера КРИТЕРИИ СОГЛАСИЯ Т.б1 расхождения У приняла некоторое а начение и . Спрашивается, можно л н объяснить это случайными причинами и ли же это расхождение слишком велико и указывает н а н аличне существенной разницы мемсду теоретическим и статистическим распределениями и, следовательно, н а непригодность гипотезы Н Г' Для ответа н а этот вопрос предп олож им, что гипотеза Н верна, и вычислим в этом предположении вероятность того, что за счет случайных пр нчин, связанных с недостаточ ным объемом опытного материала, мера расхождения У окажется не меньше, чем наблюденное нами в опыте значение и, т.
е. вычислим вероятность события: и>. Если эта вероятность весьма мала, то гипотезу Н следует отвергнуть как мало правдоподобную; если же эта вероятность значительна. следует признать, что экспериментальные данные не противоречат гипотеае Н. Возникает вопрос о том, каким же способом следует выбирать меру расхожления У? Оказывается, что при некоторых способах ее выбора аакон распределения величины У обладает весьма простыми свойствамн и при достаточно большом а практически не зависит от функции Р(х). Именно такими мерами расхождения и пользуются в математической статистике в качестве критериев согласия. Рассмотрим один из наиболее часто применяемых критериев согласия †т называемый «критерий у2» Пирсона.
Предположим. что произведено и независимых опытов, в каждом из которых случайная величина Х приняла определенное значение. Результаты опытов сведены в )б разрядов и оформлены в виде статистического ряда: Ха' Хб ХА; ХАТ2 ХП Хб Требуется проверить, согласуются лн экспериментальные данные нпотезой о точ, что слу пиная велич,ша Х имесг дан пяй закон распределения (ааданный функцией распределения Р(х) или плотностью у (х) ). Назовем этот закон распределения ктеоретическнм». Зная теоретический закон распределения, можно найти теоретические вероятности попадания случайной величины в каждый из разрядов: Проверяя согласованность теоретического и статистического распребббеннн, м~~ буден исходить нз расхождения между теоретическими вероятностями р, и наблюденными частотами р,*.
Естественно 162 ВАконы РАспРеделения случАйных Величин )тл. т выбрать в качестве меры расхождения между теоретическим и статистическим распределениями сумму квадратов отклонений (р — р ), ! 1)' взятых с некоторыми «весами» ср (7= ~~.", с,(р, — р,). 1 1 (7.6.1) Коэффициенты с1 («веса» разрядов) вводятся потому, что в обшем случае отклонения, относящиеся к различным разрядам, нельзя считать равноправными по значимости. Действительно, одно и то же по абсолютной величине отклонение р,' — р, может быть мало аначительным, если сама вероятность р, велика, и очень заметным, если она мала. Поэтому естественно «веса» с, взять обратно пропорциональными вероятностям разрядов р1.
Далее возникает вопрос о том, как выбрать коэффициент пропорциональности. К. Пирсон показал, что если положить н С1=— Р1 (7.6.2) т и ч(Рс-Р1)' Р1 1 1 (7.6.3) Для удобства вычислений (чтобы не иметь дела с дробными величинами с большим числом нулей) можно ввести и под знак суммы ') Распределением т' с г степенями свободы называетск распределение чйиена нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице.
Это распределение характеризуется плотностью Г к 1 — 1 из е а при и)0, 2з1 ~ — ) 0 Ф (и)= где Г(а) = ~ С' 1е 'Лà — изкесгнаа гак1ма-функция. о то при больших а закон распределения величины (7 обладает весьма простыми свойствами: он практически не зависит от функции распределения с'(х) и от числа опытов л, а зависит только от числа разрядов й, а именно, зтот закон при увеличении и приближается к так называемому «распределению ут»'). При таком выборе коэффициентов с, мера расхождения обычно обозначается )(11 КРИТЕРИИ СОГЛАСИЯ (7.6.4) распределение ~а зависит от параметра г, называемого числом «степеней свободы» распределения.
Число «степеней свободы» г равно числу разрядов й минус число независимых условий («связей»), наложенных на частоты р'. Примерамн таких условий могут быть а Х р',=П если мы требуем только того, чтобы сумма частот была равна единице (зто требование накладывается во всех случаях); ~~ дгрг лг«' если мы подбираем теоретическое распределение с тем условием, чтобы совпадали теоретическое и статистическое средние значения; ~~'., (х — ла')а р', А) если мы требуем, кроме того. Совпадения теоретической и статкстической дисперсий и т.
д. Для распределения )(а составлены специальные таблицы (см. табл. 4 приложения), Пользуясь втими таблицами. можно для кавсдого значения )(а и числа степеней свободы г найти вероятность р того, что величина, распределенная по закону уа, превзойдет зто значение. В табл, 4 входами являются: значение вероятности р и число степе ней своболы г. Числа, стояшие в таблице.
представляют собой соответствуюшие значения )(а. Распределение уа лает возможность оценить степень согласованности теоретического и статистического распределений. Будем исхолить из того. что величина Х ле яств иге льно распределена по закону г" (л). Тогда вероятность р, Опрелеленная по таблице, ест» вероятность того, что за счет чисто случайных причин мера расхожления теоретического и статистического распределений (7.6.4) будет не меньше, чем фактически наблюденное в данной серии опытов знч»»ч»» Л Вел» зта »»ло»т»ость л весьма и»ла /настолько мала что событие с такой вероятностью можно считать практически невозможным). то р зультзт оп;гга следует считать и р о т и в о р е ч а ш и и пшотезе Н о том, что закон распределения величины Х есть г" (л).
Эту н, учитывая, что р = †, где глг — число значений в Г-м разряде, лн 1 л ' привести формулу (7.6.3) к виду: цч (ль — лр~)т (7=Х =,~~ лр~ 8! 154 законы алспввдзлвння слгчлпных вялнчнн 1гл. т гипотезу следует отбросить как неправдоподобную, Напротив, если вероятность р сравнительно велика, можно признать расхождения между теоретическим и статистическим распределениями несущественными и отнести их за счет случайных причин. Гипотезу Н о том, что величина Х распределена по закону Р(х), можно считать правдоподобной или, по крайней мере, не противоречащей опытным данным Таким образом, схема применения критерия уз к оценке согласованности теоретического и статистического распределений сводится к следующему: 1) Определяется мера расхождения у' по формуле (7.6А).
2) Определяется число степеней свободы г как число разрядов й минус число наложенных связей з: г=й — г. 3) Г(о г и уа с помощью табл. 4 определяется вероятность того, что величина, имеющая распределение у' с г степенями свободы. превзойдет данное значение )(з. Если эта вероятность весьма мала, гипотеза отбрасывается 'как неправдоподобная. Если эта вероятность относительно велика,,гипотезу можно признать не противоречащей опытным данным. Насколько мала должна быть вероятность р для того, чтобы отбросить или пересмотреть гипотезу, †вопр неопределенный; он не может быть решен из математических соображений, так же как и вопрос о том, насколько мала должна быть вероятность события для того, чтобы считать его практически невозможным.
На практике, если р оказывается меньшим чем О,1, рекомендуется проверить эксперимент, если возможно †повтори его и в случае, если заметные расхождения снова появятся, пытаться искать более подходящий для описания статистических данных аакон распределения. Следует особо отметить, что с помощью критерия )(з (нли любого другого критерия согласия) можно только в некоторых случаях о п р овергнуть выбранную гипотезу Н и отбросить ее как явно несогласную с опытными данными; если же вероятность р велика, то этот факт сам по себе ни в коем случае не может считаться доказательством справедливости гипотезы Н, а указывает только на то, что гипотеза н е п р о т и в о р е ч и т опытным данным.
С первого взгляда мозхет показаться, что чем больше вероятность р, тем лучше согласованность теоретического и статистического распределений н тем 09лее обоснованным слелует считать выбор функции ь'(х) в качестве закона распределения случайной величиньь В действительности это не так. Допустим, например, что, оценивая согласие теоретического и статистического распределений ~о критерию;(', мы полу шля р =0,99.
Это значат, чго с вероя~нчстью 0,99 за счет чисто случайных причин при данном числе опытов 155 КРИТЕРИИ СОГЛАСИЯ т.е! должны были получиться расхождения ббльшие . чем наблюденные . Мы же 'получили относительно весьма малые расхождения, которые слишком малы дла того, чтобы признать их правдоподобными. Разумнее признать, что столь близкое совпадение теоретического и статистического распределений не является случайным и может быть объяснено определенными причинами, связанными с регистрацией и обработкой опытных данных (в частности, с весьма распространенной на практике «поди и сткой» опытных данных, когда некоторые результаты произвольно отбрасы в аются или несколько изменяются) .