Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 26
Текст из файла (страница 26)
Из-за дискретности гипергеометрического распределения эти вероятности, как правило, меньше соответствующих номинальных зчачений 0,011Х, указанных в верхней части таблицы. Прочерки в таблице 5.6 означагот, что при данных значениях г,г, Лг, п и [г доверительное множество для М вЂ” [г охватывает все возможные значения О, 1, ..., ЛХ вЂ”,".. Таблица 5.6 составлена лишь для тех п, которые удовлетворяют неравенству 2и ) Ж. Если 2п ( Лг, то для отыскания М, — р, соответствующего заданным с), Л/, и и р, следует рассмотреть гипергеометрическое распределение с параметрами и* = Л' — п, Лгп — ип = = и и положить Мт — (гп = п — И.
Затем по таблице 5.6 для указанных значений и* и Л'* — ип найти минимальное значение )зп, отвечающее вычисленной величине М,п — )зй(если числа ЛХ," — р* в рассматриваемом разделе таблицы 5.6 нет, то в качестве (зп выбираем такое значение, которое соответствует ближайшему числу, превышающему М, — р*). Искомый нижний доверительный предел ЛХ, — р выражается формулой Мг — И = Л' — и — р.* (36) (этот вывод — следствие последнего равенства (25) и неравенств (35)). Пусть, например, Лг =- 20 и и = 10, и пусть требуется вычислить нижяио доверительные пределы для М вЂ” (з при (г = 5%, (з = 5 и 10.
По таблице 5.6 непосредственно находим, что значениям () = 5%, п = 10, Л' — п = 10 и )з =- 5 и 10 соответствуют М, — )з = 0 и 6, т. е. М, = 5 и 16. С другой стороны, так как в данном случае ип = Лс — и =.= 10, Л'и— — и =и=10, М, — (з = — п — )»=5 и О, е то согласно указанному выше правилу по таблице 5.6 находим )зп = 10 и 4; в силу формулы (36) окончательно получаем М, — )з = = Л' — п — (з = 0 и 6.
Вычисленные значения совпадают с теми аначеяиямн, которые были найдены непосредственно по таблице 5.6. Для отыскания верхних доверительных пределов ЛХ, следует рассмотреть случайную величину )зп = и — И, подчиняющуюся гипергеометрическому распределению с параметрами Лгп = /'г', и* = и, М* = Лс — М. Пусть М,— нижнии доверительный предел для параметра М*, соответствующий заданным значениям и*, Л'* и )зп, тогда верхний доверительный предел для М будет выражаться формулой М, = = Лг — М,".
Например, если (г = 2,5%, Л" = = 28, и = 15, И = 10, то Лгп = 28, из = 15, Ие = 5, и так как в таблице 5.6 этим значениям соответствует прочерк, то доверительное множество для М* — )зп содержит все целые числа от 0 до 13, поэтому М*, = 4 и, значит, М, = 24 и ЛХ, — )з = 14. Кроме того, как нетрудно убедиться, в данном случае М, — р = 2, поэтому доверительный интервал для М вЂ” И (с коэффициентом доверия 95»%«) задается неравенствами 2 ( М вЂ” р ( 14. Таблица 5.6 составлена заново в отделе математической статистики 5(атематического института АН СССР. Вычисления производились на ЭВ51 «Стрела» Вычислительного центра АН СССР.
Результаты вычислений позволили несколько расширить таблицы (Т12, Т27, Т48). НАЗНАЧЕНИЕ ТАБЛИЦЫ И ПРИМЕРЫ ЕЕ ПРИМЕНЕНИЙ Интервальная оценка числа дефектных изделий. Пусть для контроля качества партии, состоящей из Л~ изделий, произведено выборочное обследование и случайно выбранных единиц, из которых дефектными оказались )з штук. В этом случае М,— (з и ЛХ,— (з — нижний и верхний доверительные пределы для числа дефектных изделий, не попавших в выборку.
Критерий значимости для таблиц сопряженности признаков 2 х 2. Пусть Л' элементов случайным образом разбиты на две группы по п и Л' — и элементов в как<дай, и пусть во всей совокупности объема Л' имеется М элементов, обладающих признаком 1, а остальные элементы этим признаком не обладают. Результат разбиения можно записать в виде следующей таблицы 2 х 2 (И вЂ” количество элементов с признаком 1', попавших в первую группу): С прпзнзпом Г Вез приз- нзпз Г Всего Выборка, впи з-и группа Остаток, нля 2-н группа и — и и "г' — и — АХ+и Л' — и Всего Если разбиение на две группы действительно осуществлялось случайно и независимо от наличия или отсутствия у элементов признака У, то М)з — -- иЛХ/Л', и поэтому М ()з/и — (ЛХ вЂ” )з)/(Лг — п)) = О. Для проверни гипотезы о случайности разбиения (при конкурирующей гипотезе М ((з/и— — (М вЂ” )з)/(Лс — и)! чз= 0) можно воспользоваться таблицей 5.6.
Пусть М, — И и ЛХ,— — и — критические значения для М вЂ” И, соответствующие уровням значимости () «%. Если М, — (з ( М вЂ” )з ( ЛХ, — И, то нет оснований сомневаться в справедливости основной гипотезы; в противном случае, когда нарушается какое-либо из последних неравенств, гипотеза случайности разбиения должна быть отвергнута. Уровень значимости такого двустороннего критерия равен 2/го%.
Построение критерия значительно упростится, если а) в качестве первой группы выбрать наибольшую часть Л', т. е. потребовать, чтобы было 2п ) Л'; б) назвать обладающими признаком У элементы того столбца, в котором доля первой группы не меньше доли второй группы, т. е. потребовать, чтобы выполнялось неравенство )з/и ~з (М вЂ” )с)/(Л/ — и).
В этих — 76— 25+)» — » л — гг М вЂ” гг )'1г — л — гг) л-гг 25 Ж вЂ” л ЛУ вЂ” М 25+)Ч вЂ” и 25+ М вЂ” и Все»с и — т Ж вЂ” л — М+т т М— и )гг — и 25 — гг Л вЂ” л — М+гг Всего 25+Я вЂ” л 25+ г1' — и — М М 77— условиях, если М, — р — к ритическое значение, соответствующее уровню значимости г'„), и М вЂ” р ( ЛХ, — р, то )г)и следуетсчитатьзначимо превышающим (М вЂ” )г))(Лг — и) (односторонний критерий с уровнем значимости г',)).
В случае двустороннего критерия при ЛХ— — р ( М, — р следует считать, что )г/и значимо отличается от (М вЂ” )г))(Лг — и) (уровень значимости такого критерия равен 2гг). В обоих критериях пары значений «на полях» таблицы 2 Х 2 (п, Л вЂ” и) и (М, Л' — М) эквивалентны друг другу, поатому их»гоя«но менять местами. Если компоненты одной из пар не превосходят 25, а для другой пары это условие не выполняется, то именно первую пару следует выбрать в качестве (и, Л' — п), так как таблица 5.6 составлена только для п (25 и гУ вЂ” и (25.
В силу монотонной зависимости функции гипергеометрического распределения от основного аргумента и от параметров таблица 5.6 может оказаться полезной для построения критерия значимости в тех случаях, когда хотя бы в одной паре (и, Лг — и) и (ЛХ, Лг — ЛХ) имеется компонента, не превышающая 25. Пусть (для определенности) п ) 25 ) Лг — и и, кроме того, )гlи м (ЛХ вЂ” )г)!(Лг — п). Основной таблице сопряженности признаков 2 х 2, указанной выше, поставимв соответствие две другие таблицы: Если таблица 1 значима, то исходная таблица с необходимостью будет свидетельствовать о значимости расхождения между )г!и и (М вЂ” )г)/(Лг — п). С другой стороны, это расхождение будет незначимым, если незначима таблица П. Вычисление критических значений, соответствующих исходной таблице, потребуется лигпь тогда, когда таблица 1 незначима, а таблица 11 значима; в этих условиях может быть полезной приближенная формула (26), результаты применения которой можно уточнить с помощью формулы (27).
Критерий сравнен»»я верояпгнсстей. Рассмотрим две последовательности независимых испытаний с параметрами (и,, р,) и (п„р,), где и, и и, — количества испытаний, а р, и р, ' — вероятности «успехов» в отдельных испытаниях. Пусть р, и )㻠— общие количества «успехов» в первой и второй последовательностях соответственно. В таком случае Р ()гг = гим )г« = лга) = Ст')гт1 (1 р )т-т С™р~~- '(1 р )и;т, Если вероятности «успехов» одинаковы, т. е.
если р, = р, = р, то Р ()гг = т„)г» = т») = 'ртис» (1 р)п»п.-ттт. Ст'С„' Первый сомножитель — условная вероятност. события ()гг = т,), вычисленная при условии, что р, + )г, = т, + т,. Этим обстоятельством можно воспользоваться для проверки гипотезы р, = р,.
С атой целью положим Лг = и, + и,, п = — пг, ЛХ = )гг + р», )г = )гг и построим таблицу 2 х 2 так, как было указано выше (при этом без ограничения общности можно считать, что 2п» Л' и )г)и > (М вЂ” )г)/(Лг — п)). Если с заданным уровнем значимости эта таблица окажется значимой, то гипотеза р, = р, должна быть отвергнута.
Истинный уровень значимости такого критерия не превьппает предписанного вначения; подробнее об атом см. [28), $ 9. Критерий независимости признаков. Если элементы выборки могут обладать двумя признаками у и г, то результаты эксперимента можно записать в виде таблицы 2 х 2: В втой таблице и — число элементов, обладающих признаком г, т — число элементов, обладаюгцих одновременно признаками у и г, (и —, т) — число элелгентов, обладающих признаком г и не обладающих признаком У, и т.
д. Такой результат эксперимента при условии независимости всех отдельных испытаний будет иметь вероятность Мг т! (и — т) г (М вЂ” т) г (ггг — п — М + и)1 Х х(р(Рг))'"(рд"г)) -"х х(р(уг))п- (р(Рг)) —.— » где р (УЕ) — вероятность того, что данный элемент будет обладать признаками У и 2, р (УЙ)— вероятность того, что даняый элемент будет обладать признаком У и не будет обладать признаком 2, и т. д., причем р (Уг) + р (УУ) + р(.
2) + р (УЕ) = 1. Если признаки У и Я независимы, то это озлачает, что р (УЯ) = р (У) р (2), где р(У) = р(Уг) +р(УЕ), р (2) = р (Уг) + р (Уг). Отсюда следует, что р(УЕ) = р(У) И вЂ” р(Я)!, р (У2) =- И вЂ” р (У))р (2), р (УЕ) = И вЂ” р (У) [ И вЂ” р (2)). Поэтому в случае независимых признаков У и Я вероятность получить таблицу 2 Х 2, ука- занную выше, равна сдс",-"„', -"'„' "' Сч [р(У)[м[1 - р(У/)и-мС» [р(г)) Х с" Х [1 — р (2)) ' Таким образом„условное распределение т при условии, что М = соле» н и = солз$, является гнпергеометрнческим распределением, и, следовательно, для проверки независимости привнаков У и Я можно воспольаоваться указанным выше критерием для таблиц сопряженности признаков 2 Х 2. При этом в таблице 5.6 следует считать; что т = [» (выполнения условий ри ) /У и [«/п ) (ЛХ вЂ” [»)/(Лг — п) можно добиться, меняя в случае необходимости У ла Я, Яна_#_нУнаУ).