Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 7
Текст из файла (страница 7)
Таким образом, согласно формуле (7) х (99,95%; 100) = = 100 — 3,2905 14,1421 + 6,431 = 59,896, х (0,05%; 100) = = 100 + 3,2905 14,1421 + 6,632 = 153,167. — 20— в каждом из которых может осуществиться один из я« попарно несовместимых исходов А„А„..., Аю с вероятностями р„р„... ..., Р,„соответственно (р1 + р« + ° ° ° + Ре4 = = 1). Пусть п — общее количество испытаний и т« — количество тех испытаний, в которых осуществлялся исход А« (1 = 1, 2,..., п«; т1+ т«+... + т = и).
Средние значения случайных величин т1 равны ир1. Согласно теореме К. Пирсона функция распределения нормированной суммы квадратов отклонений т1 от своих средних значений 4 1 4 1 при п ь оо стремится к функции распределения )(2 с т — 1 степенями свободы (см., например, [24, 38, 68, 122)). В математической статистике этим свойством распределения случайной величины пользуются для построения так называемого критерия согласия 7(2.
Пусть, например, истинные значения вероятностей р1 неизвестны и требуется проверить, согласуются ли результаты наблюдений т„ т„ ..., т с гипотезой о е е Р1 Ры Р« Р« Р«4 Ре« (р; — заданные положительные числа, удовлетворяющие условию Р,'+ Р,'+...+ р' = 1). Согласно критерию 7(2 указанную гипотезу следует отвергнуть, если сумма квадратов е т 2 (т« — ЯР«)' =Е ' ' =Š—.,-" 4=1 4 4=1 превосходит заранее заданное критическое значение х ((4, т — 1) (в качестве х ((4, п« вЂ” 1) выбирают некоторую ()-процентную точку распределения 7(2 с т — 1 степенями свободы).
Если же Ч <. х («4, л« вЂ” 1), то результаты наблюдений считают непротиворечащими основной гипотезе. Таким образом, по теореме К. Пирсона вероятность ошибочно отвергнуть гипотезу р« = р«, когда она верна, приближено но равна (ИОО, или„точнее, Р (т) ~ х(«4, т — 1) ) Р. = Р9) -ь ~ (и -4 оо) (величину 4) называют уровнем значимости критерия К'). В сборнике статистических таблиц [Т56) ва стравицах 231 — 234 помещены 2000 четырехзначных случайных чисел, заимствованных иа книги М. Кадырова «Таблицы случайных чисел« (Ташкент, 1936). Этя числа предлагается рассматривать как 2000 реализаций независимых случайных величин, каждая из которых может принимать 104 значений (от 0000 до 9999) с вероятностями 10 4.
Отсюда вытекает, что первые цифры етих случайных чисел представляют собой реализации ве- зависимых случайных величин, цривимающкх значения О, 1, 2,..., 9 с одинаковыми вероятвостямк 0,1. Пусть т„т„т, в т, — количества тех случайных чисел из общего числа я = 2000, у которых первая цифра есть О, 3, 6 нли 9 соответственно, и пусть т = = я — т, — тз — т, — т, — количество остальных чисел. Если таблица случайных чисел составлена корректно, то пяти величинам т„ т«, т„ т, и т должны соответствовать вероятности ре = ре = рс = ре = 0,1 и р« = 0,6 (р« — вероятность появления на первом месте цифры, отличной от О, 3, 6 н 9).
Для проверки атой гипотезы были подсчитаны величины т„т„т„т, в т. Подсчеты производились по тем страницам книги М. Кадырова, которые воспроизведены в сборнике [Т56) (более полное исследование распределения случайных чисел М. Кадырова проведево в заметке [19)). В реаультате оказалось, что т, = 160, т« = 247, т« = 191, т« = 185 и т = 1217, йозтому в данном случае 1 Г Ч = — ~(160)4+ (247)«+ (191)'+ (185)4+ 1 + 6 (1217)2] — 2000 = 20,816.
Положив, например, () = 0,1«А« и учитывая, по в этом примере п« вЂ” 1 = 4, по таблице 2.2а находим (0,1«А; 4) = 18,467 < ч = 20,816; следовательно, гипотезу.о доброкачественности случайных чисел в сборнике таблиц [Т56[ нужно отвергнуть (так как Ч превосходит даже з (0,0594; 4), то зта гипотеза отвергается также и критерием с уровнем звачкмости 0,0544). Рекомендацию случайных чисел М. Кадырова для статистических расчетов едва ли можво признать окравдапкой. П р и и е р 4 ([Т27), стр.
13). Нецентральный критерий 2'. Для определения некоторой физической постоянной х произведены 20 измерений $1 со случайными ошибками 61 и неизвестными систематическими ошибками Ь1, т. е. $1 = х + Ь, + 61 (1 = 1, 2,..., 20). Случайные ошибки 6; распределены одинаково нормально с нулевым средним значением и дисперсией а« = 4. Требуется проверить основную гипотезу Не, согласно которой все Ь1 = О. При этом предполагается, что с гипотевой Н, конкурирует другая гипотеза Н„по которой какие-то 10 измерений (номера их неизвестны) отягощены систематическими ошибками Ь1 = 4, а в остальных десяти случаях Ь« = О.
Для проверки гипотезы Н, можно воспользоваться критерием 22. Рассмотрим случайную величину 2« Ч= Еа« 9) =4 Х ($1 9)' 4 1 4=1 20,/ Если основная гипотеза Н, верна, тр т) подчиняется распределению )(2 с 19 степенями свобо- — 21— Спрашивается, какова вероятность отвергнуть по такому критерию гипотезу Не, когда она невернау Иначе говоря, какова вероятность выявить наличие систематических ошибок, когда они действительно существуют (т, е. когда верна конкурирующая гипотеза Н1)7 Так как в случае справедливости гипотезы Нт случайная величина т) подчнняетси нецентральному распределению хз с 19 степенями свободы и параметром иецевтральности 1 ьч Ь= — 7 Ь=2 — 20 .У 1- 1 ч'Ч а = — з 7 (Ь.
— Ь)з = 20, — с. ,7 1 то искомая вероятность (так иааываемая мощность критерия) совпадает с вероятностью события (~(~ (20) ) 36,19Ц. ды (см. (28, 47, 68)). По таблице 2.2а находим х (1%; 19) = 36,191, поэтому критерий )(з, соответствующий уровню значимости 1%, представлнет собой следующее правило: если 7).ь ) 36,191, то гипотеза Н, отвергается (принимается гипотеза Н,); если же т) с~ 36,191, то считается, что результаты измерений гипотезе Не не противоречат; при этом вероятность отвергнуть гипотезу Н„когда она верна, равняется 0,01. Согласно аппроксимации Э. Пирсона (12) Р (7"', (20) ) 36,191) — Р (Утз ) л), где (19 + 40)' У (19 ( 60р = 32~91~ 19+ 40 400 19 + 60 (36~191 + 19 ) 60 ) = 30~81.
Линейной интерполяцией таблицы 2яа по аргументам л и о = ( находам Р (уз ) л) = 0,572. Аналогично можно вычислить приблюиевное аначение, предложенное Патнайком: Р (Х~~ ) у) = 0,568, где согласно (13) я = 25,78 н у = 23,92. Таким образом, оба приближения свидетельстеутот, что в данном случае мощность критерия 2з с уровнем значимости 1% приближенно равна 0,57. Более того, обратной интерполяцией таблицы 4ЛО можно убедиться, что в етом примере есе три знака приближения Э. Пирсона (0,572) верны. Как и следовало ожидать, приближение Патнайка оказалось менее точным. Дальнейшие сведения о распределении и о приближениях таблиц 2.1 и 2.2 можно найти в учебниках (28, 38, 47, 68, 72, 115, 137), а также в таблицах (Т2, Т22).
Уточнениям предельных теорем для критерия 7(з посвящены работы (101, 122); о применениях этого критерия см. (66). Таблица 3.16. Поправки для вычисления функции распредолсвия Стьюдонта В таблице даны значения разности (см. (3)) В (12 п) = 8„«) — 8 «) = Я„«) — Ф «) для и = 20, 24, 30, 40, 60, 120; 1= 0,0 (0,1) 4,0 (0,5) 6,0.
С помощью таблиц 1.1 и 3 16 можно вычислять функции распределения Стьюдента 8„«) с пятью верными десятичными знаками для всех п ~ 20 (не обязательно целых) по формуле 8к «) = Ф «) + В «, и). (8) Таблица 3.1б составлена заново по шестизнач ным таблицам [Т40!. ИНТЕРПОЛЯЦИЯ Таблица 3 1а. Так как в этой таблице разности функции 8„ «) не указаны, то для интерполяции по аргументу 1 рекомендуется пользоваться квадратичной интерполяционной формулой Лагранжа. Пусть 1 д, 1» и 12 — три последовательных значения аргумента такие, что (1( 1„и пусть и = « — 1»)/«д — 1»). По формуле Лагранжа имеем 8.«)= — "", "' 8.«-.)+Н1 — )+ +и(1 — и)) Я»«о)+ ~и —" " 1 Я»«д) ° (9) Погрешность формулы (9) не превышает 10 о.
При вычислениях по этой формуле с помощью настольных вычислительных машин или таблицы 7.7 удобно сначала вычислить и записать (1 — и), и(1 — и) и и (1 — и)/2,1 а затем уже вычислять правую часть (9) последовательным накапливанием произведений. Так нан для малых и функция о'„ «) при 1-» оо стремится к единице довольно медленно, то «хвосты» распределения Стьюдента, соответствующие значениям 1) 8 и п ( 10, оказались вне таблицы 3.1а (некоторые предварительные сведения о поведении таких «хвостов» дает упоминавшаяся выше таблица верхних процентных точек 1 (Ь), п)). Для вычисления Я»«) при 1) 8 и п„( 10 рекомендуются приближенные формулы, представляющие собой следствие формул (4), 1 — Я» «) = [1 — Я» (8)) (8/1)", (10) »/2 л(я+1) + (л+ 3» «) [1 ~» (8)[ а (и+ 1) + (л+ 2) Абсолютные погрешности этих формул при и ~ 10 не превышают 10 ' и 10 ' соответственно.
Таблица 3.1б. Во всей области изменения аргументов 1 и и допустима линейная интерполяция функции В «, п) по/ и 1/и; погрешность линейной интерполяции не превьппает 5 10 о. Пусть 1„12 и и, и, — последовательные табличные значения аргументов такие, что 1» %.:, 1 ( од и и, ( п ( п„и пУсть и= —, и= — 1/и — 1/лд вд — и = 120— сд — до ' 1/ло — 1/яд квд (в таблице 3.16 шаг по аргументу и выбран так, чтобы по аргументу 1/и шаг был одинаковым: (1/по) — (1/и,) = 1/120).