Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 25
Текст из файла (страница 25)
Распределенно вероятностей случайной величины р выражается формулой Р(р =т(М, и) = С,е(См-м) С."ч, если шах (О, М + п — Л() ( т ( пп'и (М, и), 0 в остальных случаях (20) (вероятности р (т ( ЛХ, п) = Р (р = т ( ЛХ, и) зависят, разумеется, и от Л(). Так как отнотпенпе сочетаний в формуле (20) пропорционально коэффициенту х гнпергеометрического ряда (см. (ТЗО)), то распределение вероятностей случайной величины р нааывают гипергеометрическим распределением. Используя формулу (20), нетрудно убедиться в справедливости равенств р(т(М,и) = = р (т ( и, М) = р (М вЂ” т ( М, Л( — и) = =р(и — т(Л( — М, и)= = р (Л( — п — М + т ) Лс — М, ЛС вЂ” п), (21) причем пы и]! (П вЂ” и) (Д( — М) Мр= ь Ор= -,Хс- ) (22) (- —.) = пМ '(5 (]ч — 2п) 0» — 2М) (3 (23) ̄— — )= ~, „.; р.
Функция гипергеометрического распределения определяется формулой Р (т ) М, п) = Р (р ( т ( ЛХ, и) = р(1) М, и), (2ч) — 73 из которой в силу равенств (21) получаются соотношения Р(т [М, и) = Р(т [п, М) = =1 — Р(п — т — 1 [Аг — М, и) = = 1 — Р (М вЂ” т — 1 [ ЛХ, Л' — и) = = Р (Аг — п — М + т [ Аг — М, Аг — п)' (25) Для определения значений функции Р можно воспользоваться таблицами [Т15]. Если ни одна из величии и, гу — п, М и Л' — ЛХ не слишком мала (иногда это условие формулируют в виде неравенства (3[г ) 9; слг.
[137!), то гипергеометрическое распределение аппроксимируется нормальным с параметрами, заданными формулами (22): Р(т[ЛХ,п)=Ф( ' ' ). (26) Подробнее о нормальном приближении см. [8, 137). Если же п и ЛХ не превышают 0,1Аг (см. [137[), то гнпергеометрнческое распределение близко к распределению Пуассона с параметром ь = пМ/Л/ (см. предисловие к таблице 5.3). Обобщение пуассоновского приближения указано в статье А. Н. Колмогорова [62). При Аг -«оо и фиксированных п и р =М/Л/ гипергеометрическое распределение сходится к бнномиальному: р(т [М, п)«С„р (1 — р)" В книге [137[ биномиальное приближение рекомендуется применять при п ~ 0,1Аг.
Указанные выше аппроксимации действуют в различных областях изменения параметров и поэтому, как правило, не заменяют друг друга. В этих условиях заслуживает внимания В-аппроксимация, дающая удовлетворительные результаты прн всех А(:в 25 независимо от значений М и и: Р(т[ЛХ, п)=Х,„(п' — т+с, т — с +1), (27) где Хг „(а, Ь) — функция В-распределения (см. формулу 3.14)), 1У (и+ М вЂ” 1) — 2пМ д ((9 „ , (28) (Лг — 2)г и'= — Х дг — 1 ИМ (У вЂ” в) (Лг — М) Х [(гг — М) (гг — п)-т.пМ вЂ” гг) [гч (и+М вЂ” Ц 2ггМ) 1 (29) с— вМ(М вЂ” 1) (в — 1) — ф 1)[(Я М)(й п)чаМ-Л~! (30) О, ОООО 0,0011 0,0005 В-врггблггжевие Норггальнов лрвблв- жевве Точное значение 0,0094 0,0938 0,0148 0,0955 0,0115 0,0894 0,3342 0,3315 0,3281 свидетельствуют, что точность обоих приближении примерно одинакова.
В несимметричном случае, когда и и ЛХ ~ Л(/2, В-приближение точнее нормального. Величины х, п' и с удовлетворяют условиям (см. формулы (22) и (23)) М[г = и'х (- с, (3[г =- п'х (1 — х), М ([г — пМ/Аг)з = и'х (1 — х) (1 — 2х), поэтому, если [г' — случайная величина, под- чиняющаяся биномиальному распределению с параметрами (и', х), то первые три момента для р,' + с будут совпадать с соответствующи- ми моментами гипергеометрического распре- деления. Разумеется, значение и', вычисленное по формуле (29), вообще говоря, будет дробным, и поэтому биномиального распределения в обычном смысле слова здесь не существует.
Однако это не может явиться сколько-нибудь серьезным затруднением, так как в силу фор- мулы (1) мы можем доопределить функцию биномиального распределения при дробных п' с помощью функции В-распределення: Р(р'~(т[и',х[ = О, если т "' О, Хг „(и' — т,т+1), если 0~(т(п', 1, если т~~ гг'. В качестве приближенного значения для Р(т[ЛХ, и) можно воспользоваться тем значением функции распределения величины [г' + с, которое получается интерполяцией по аргу- менту т.
Если в качестве интерполяционной формулы выбратв функцию В-распределения, то мы и получим приближенную формулу (27). Легко можно убедиться, что правая часть (27), во-первых, удовлетворяет условиям (25), во- вторых, для нее справедливы те же предельные теоремы и асимптотические формулы, что и д: я Р (т [М, и). Сравним, например, формулы (26) и (27) в са- мом выгодном для нормального приближения случае, когда и = ЛХ = Лг/2.
Пусть Аг = 20, тогда согласно равенствам (28), (29) и (30) получим х = 0,5, и' = 100/19 и с = 45/19, поэтому при 2 ~( т ~~ 7 Р (т [ М, и) = Хми (145/19 — т, т — 26/19). Результаты вычислений по этой формуле (с помощью таблиц [Т25[), а также по формуле (26) г — 74— ПРОЦЕНТНЫЕ ТОЧКИ ГИПЕРГЕОМЕТРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ Верхняя (то) н нюкняя (т,) Ч-процентные точки гппергеометрического распределения представляют собой целые числа, удовлетво- ряющие неравенствам Р (и, ] ЛХ, п) ( 0,01 (), Р(т, +1 ]М, п))0,.01(), Р (гпг 1 ] ЛХр и) ~ 1 0 01()ф Р (гпо — 2 [ ЛХ, гг) ( 1 — 0,01(), где О ( г,'г ( 50%.
В силу равенств (25) про- центные точки пг, = т, ((): ЛХ, и) и то = =- пг«гО; М, и) как функции параметоов М и и 1'дозлетвэряют соотногпенпям гпг Ю; ЛХ, и) =- тг (~С и, ЛХ) т»(г,г; ЛХ, и) = т»((Х; и, М), (31) гггг(Хг; ЛХ, и) + гиг(г.г; ЛХ, ЛХ вЂ” п) = ЛХ, т, (гг; М, п) + гпо ((г; ЛХ вЂ” ЛХ, и) = — и, и, г,); ЛХ„гг) = =- пгг ((); .Ъ вЂ” ЛХ, ЛХ вЂ” и) т ЛХ + и — Л, г3ог т (г,г; ЛХ, и) = = тг(Сг; гг — ЛХ, У вЂ” и) + ЛХ + и — ггг.
Согласно равенствам (32) для вычисления т, и то достаточно иметь лишь таблицы верхних процентных точек т„которые в дальнейшем для простоты будем обозначать буквой гп, по- нимая под т = т (ч'; ЛХ, и) кваптнль гипер- геометрического распределения, соответствую- щую вероятности (1 — 0,01~), где 0 ( г, ( ( 50',о. Итак, т — целочисленное решение неравенств Р (т — 1 ] ЛХ. и) ) 1 — 0,01г',г, Р (гп — 2 ] )', гг) (1 — 0,01гг1 (34) причем в силу соотношений (31) и (33) без огра- ничения общности можно считать (для опре- деленности), что 2п ь Л' и ЛХ ( п. Для приближенного определения верхних процентных точек гнпергеометричесного рас- пределения удобна аппроксимация (26), с по- мощью которой получаем т — [гу (1 — 0,01()) [г Ег[г + 1,5 + М]г], где [у] — целая часть числа у и Ч' (р) есть р-квантнль нормального распределения с пара- метрами (О, 1), Найденное приближенное значе- ние в случае необходимости можно уточнить по формуле (27).
ДОНЕРИТЕЛЬНЫЕ ПРЕДЕЛЫ ДЛЯ ПАРАМЕТРАМ Пусть И вЂ” случайная величина, подчиняющаяся гппергеометрнческому распределению с параметрами ЛХ и и. Так как функция этого раскр дглшгпя Р гт ] ЛХ, и) с увеличенном ЛХ монотонно убывает, то нижний М, и верхний ЛХ, доверительные пределы для параметра ЛХ,. соответствующие коэффициенту доверия 1 — 0,01(г (О (() ( 50%), представляют собой целочисленные решения неравенств (см. [18!) Р (р, — 1 ] М„п) ~ 1 — 0,01(), Р (]г — 1 ] М, + 1, и) ( 1 — 0,01(), (35) Р (и [ Мм и) ( 0,01 (), Р ((г ] М вЂ” 1, и) ) 001г,.
Так как (ЛХ вЂ” М,) — нижний доверителыпгй предел для (Аг — ЛХ), построенный с помощью случайной величины п — [г (формально такой вывод следует из второго равенства (25)), то для практических целей достаточно иметь лишь таблицы нижних доверительных пределов ЛХ, для различных г,г, Аг, и и р. Верхняя процентная точка т, определенная неравенствами (34), представляет собой монотонно неубывающую функцию от ЛХ, причем согласно последнему нз равенств (25) при переходе от М к М + 1 величина т если и изменяется, то не более чем на единицу.
Поэтому для т = т (ф М, п) можно построить «обратную» функцию М = ЛХ (гг; т, п) (при каждом фиксированном т = то значение атой функции определяется как максимум тех значений ЛХ, для которых т ф;, М, п) = гпо). Нетрудно убедиться, что эта функция представляет решение неравенств (35) при т = рл М, = ЛХ (г«гг )г, п).
Таким образом, для отыскания нижних доверительных пределов М, следует вычислить все верхние процентные точки гп (ггг; г»Х, и) и прн т = ]г построить по аргументу М обратную функггггю в указанном выше смысле. Значение этой функции ЛХ, = М (9 р, и) является искомым нижним доверительным пределом для М. ОПИСАНИЕ ТАБЛИЦЫ В таблице 5.6 даны значения разностей М, — )г как функций от «Х, п, Лг — п и [г для гг = 5; 2,5; 1; 0,5%; п = 3 (1) 25; Л' — и = = 2 (1) и; [г ( и. Величины ЛХ, — [г являются нижними доверительными пределами для М— — [г (т. е. для числа элементов, обладающих признаком У и не попавших в выборку объема п). Рядом со значениями] ЛХг — р указаны (в бо) истинные значения вероятностей Р (р— — 1 ] М, п).