Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 16
Текст из файла (страница 16)
г=1 зг $. = — „',»" ~,,„ 1-1 т)=ь1 ьз ь1 аг Случанная величина т) распределена нормально с параметрами (ст, тт' Л,о + Л,о,), где Л, н Л, — известные постоянные; случайные величины г, и г, не зависят от Ч и друг от друга, причем (и, — 1) 21/о, и (и, — 1) гз/оз распределены как уз с тг = и — 1 и = и, — 1 степенями свободы соответственно. Если и, и и, стремятся к бесконечности, го распределение статистики п стремится ц нор- раздел П и таблицы 2.2). При атом, разумеется, значение () не обявательно должно равняться 1 или 5%.
П р и и е р. Значимо ли различие пяти выборочных значений несмещенной оценки для дисперсии: 239, 653, 156, 120 в 111, если для всех оценок тт = 57 По таблице чнзб для О = 5% и з = т = 5 находим г = 0,5063. Так как в данном примере ' 653 653 239+ 653+ 156+ 120+ 1Ы 4279 = 0,5106) 0,5063 — — г, мальному распределению с параметрами (О, 1). В этом смысле распределение и асимптотически не зависит от неизвестных параметров. При конечных вначеииях и, и и, (или, чтотожесамое, при конечных значениях тл и т,) распределение п существенно зависит от отношения неизвестных дисперсий о,'/о',. Более того, как показали Ю. В. Линник и О. В. [Палаевский (см.
[75!), распределение любой регулярной функции от и, г, и г, (но не от о,и о,) таки!е зависит от 2 2 2 2 этого отношения. Однако при надлежащем выборе такой функции зависимость от оз/озз можно ослабить и сделать практически несущественной. Одной из наиболее удачных функций этого рода, пожалуй, является отношение Уэлша и/т' (с; т„тм ~), с = Л,г,/(Л,гг + Л,г,). Знаменатель У выбирается так, чтобы при всех положительных о, и о, с достаточной точностью имело место приближенное равенство Р [и з )х (с; тт, т„Д)) = Ог014) (50оо ~~~ () ~100%) Иначе говоря, значения функции У являются приближенными г,-процентными верхними критическими аначениями для и и приближенными 2()-процентными критическими значениями для [ п [.
О вычислении функции Г см. [105, 1261. Разултеется, если величина отношения о,/о, известна, то для сравнения неизвестных средних а, и а, следует воспользоваться критерием Стьюдента со статистикой Г )121 т Л 22 =(ч — [)//~г —,,' „1, [-, ',, „+„, где с' = Ллог/(Лго", + Л,о,'). В этом частном случае функцию [' (с; т„тм ~) можно было бы определить формулой + тг с' т,+ы, ! — с' ег+т где 1 ((х, т) есть ()-процентная точка распределения Стьюдента с т степенями свободы (см. описание таблиц 3.2, пример 2). В таблице 4.4 даны значении функции [г (с; т„т„тг) (с двумя десятичными знаками) для() =5; 25; 1; 0,5% (2~) =10,5,2,1%) и с =- О,О (0,1) 1,0; аргументы т1 и т, изменяются от 6,8 илн 10 (в зависимости от ()) до бесконечности. Интерполяция табличных значений по аргументу с не сложнее квадратичной.
По аргументам тх и тз рекомендуется применять линейную гармоническую интерполяцию (т. е. обычную линейную интерполяцию, но не по тт и тм а по их обратным величинам 1/и, и 1/то). Таблица 4,4 заимствована из работ [Т[, Т451. — 49— Таблицы 4.5. Нормальная корреляция Пусть (з„т)т), (с„т)х),..., (с„, т)„) — взаимно невависимые, одинаково распределенные двумерные случайные величины, подчиняющиеся нормальному распределению, функция которого задается формулой 1 Р($(*,т)(И= г ., Х (х-.аьт/аь (Х-а )/с Х ~ ~ ехр~ —, ~, (т(ттт( . (10) Функция (10) зависит от пяти параметров: а1 = Мь, а„=Мт~, а.
= ыс, а,, = ьтт), р = М ) (ьс — аз) (ц — ач) ~/(ото„). Параметр о по абсолютной величине не превосходит единицы и называется коэффициентом корреляции случайных величин с и т). В случае нормального распределеяия коэффицвент р полностью характеризует степень зависимости случайных величин с в тт (р = 0 тогда и только тогда, когда с и т) независимы; р = ~1 тогда и только тогда, когда, с вероятностью единица, величины $ и т) связаны линейной зависимостью вида А$ + Вт1 + С = О).
Если же корреляция случайных величин $ и тт отлична от нормальной (т. е. если функция распределения этих величин не принадлежит семейству, заданному формулой (10)), то коэффициент р может принимать значения, близкие или даже равные нулю в тех случаях, когда $ и т) зависимы. Подробнее о теории корреляции см. (8, 28, 47, 68, 137).
Для вычисления значений функции (10) можно рекомендовать таблицы (Т21, Т24, Т34). Если параметры функции распределения (10) неизвестны, то в качестве оценки для р обычно используют выборочный коэффициент корреляции И ,Г х и г= ~чз ($т — Е)(ттт — т0/~/ тч Ят — $)х~ (т); — тт)х, 1=1 1 /=1 (11) где 5 = '~~Яда и т) = 5п'/и. Распределение случайной величины г не зависит от а;, аю о;, ов и при и ) 3 в интервале — 1 (г (+ 1 определяется плотностью вероятности (см. (52, 131)): Р (гт Р) = (1 — Рх)Ш ц/2(1 — г Ф -М!х Х 1 яГ (и — 2) а'" т ( атссоз( — х) ) ,/х~ с ~ У1 — х' 2п-э (1 — р')ш тлх (1 — г')<"-и/х ~с яГ (и — 2) ~Р ( и+ ~и — 1 )~т (2рг)~ Вне интервала — 1 ~ г ~ + 1 плотность (12) равна нулю.
Если и = 2, то г принимает одно из двух значений: +1 или — 1. Если р = О, то плотность распределения выборочного коэффициента корреляции выражается формулой Р„(г,0)= — ' ', (1 —.)<.- (" ') (п — 2) ()г((1, и> 3). Из этой формулы, в частности, следует, что при р = 0 случайные величины / х — 2 х=г', /=г 1/ 1 — гх обладают плотностями вероятностей Ж1/с-1 (1 х))п-2)/э-1 (1 и — 2) /и — 15 Г( 2 ) / тх 1-т -т>/э / ~1+ 1 )/я(п — 2) /п — 2)( ' и — 2/ г( т. е.
х подчиняется В-распределению с параметрами а = 1/2 и Ь = (и — 2)/2, а 1 подчиняется распределению Стьюдента с ч = и — 2 степенями свободы (см. таблицы 3.1, 3.2, 3.3, 3.4). Если ясе Р ~ О, то распределение выборочного коэффициента корреляции становится довольно сложным (см. формулу (12)). Для вычисления функции распределения величины г в случае малых выборок можно воспользоваться таблицами [Т8). Если и-э оо, то распределение г будет асимптотически нормальным с параметрами (р, (1 — рх)/)/ и), поэтому прв больших значениях и можно было бы распределение г аппроксимировать нормальным распределением. Однако для р, близких к +1, такая аппроксимация надежна лишь при очень больших значениях и.
Р. А. Фишер указал замечательное нормализующее преобразование случайной величины г: = — 1п — = агд$Ь г, 1+г 2 1 — г которое не зависит ни от р, ни от и (см. (132)). Если и ) 20, то распределение случайной величины з близко к нормальному распределению, — 50 причем 1, 11о р Г 3 — Р Мг=, ) — +-,— ~1- +-1. 2 1 — р 2(е — 3) ) 4(л — 3) (13) р$2 — брз+ Зрв 3)1 2( — 3) 6( — зр (14) где 1 1+г гт = —,!и 2 1 — г Чв (1 — св) )г — 3 'К (1 — а) ге = — )и — + 1+г 2 1 — г Рл — 3 (Ч" (р) есть р-квантиль нормального распределения; см.
таблицу 1.3). Для уточнения получен- (М (з Мз)з)г Рв ( з) ( — З)з + ' ' ' ' М(з М ) 2 2рв — Зр' ==3+ — + + (Пзр ' л — 3 (з — 3)з Таким образом, случайная величина (г— — Мг)$')$г0г распределена приближенно нормально с параметрами (О, 1).
В формулах для математического ожидания и дисперсии (13) и (14) обь.чно ограничиваются липгь первыми слагаемыми М = агд 1Ь р и (зг = 1$$(и — 3). Остальные слагаемые формулы (13) малы по сравнению с Мфги — 3 и могут оказать влияние липзь при суммировании нескольких величин г„ г„... (например, при вычислении арифметического среднего г). Функция распределения выборочного коэффициента корреляции Рв (Л, р) = Р (г ( Л) при фиксированном Л по аргументу р монотонно убывает (более того, 1 — Л$„(Л, р) как функция аргумента р обладает всеми свойствами функции распределения), поэтому для того, чтобы получить нижнии рд и верхний р, доверительные пределы для р, нужно основной аргумент функции распределения Л заменить выборочным коэффициентом корреляции г и решить относительно р, и р, уравнения Р'я(г,р,) =1 — а, г"„(г, р,) = а (О (а (1/2). (15) Каждому из таких пределов соответствует коэффициент доверия 1 — а.
Так как при всех возможных значениях р справедливо равенство Р (р ( р ( Рз) = 1 — 2а, то (рк, р,) — доверительный интервал для р с коэффициентом доверня 1 — 2а. Для приближенного определения р, и р, можно воспользоваться г-преобразованием Фишера; в результате получатся формулы ввл — ! 1)1 гз = —, (1б) ных приближенных доверительных пределов следует рк и р, принять за начальные приближения и повторить вычисления с учетом дополнительных членов в формулах (13) и (14) (см., далее, пример). Коли нормальные случайные величины 4 н ч представнмы в виде сумм неаавнсимых, нормально распределенных слагаемых 4„..., 4к.' 3=3'+ ~ с$4$, ч=и'+ Х, 3Д$ (18) $ — 1 где вв н 31 — постоянные, а 4' н $)' не зависят от всех 4$, ьвв ..., 4к, то коэффициентом частной корреляции р- и .
сличайвых величин 4 н и называют обычный в, п)Г коэффициент корреляцнв случайных величин 4' и Ч', т. е. Рй, 14 = рв, „,. Имеет ввесто формула к РЬ „— Х РМ гкрп, гв $ $ Рь п)1 к (1 — Хрз- )(' — Хрз ) $=1 1=1 Выборочный коэффициент частной корреляции г, п) вычисляют по этой же формуле, заменяя все р соответствующнмн выборочными оценками (см. формулу (11)): Х "' $ "и ь $=1 " Ь п)1 (1- Х гв,.) (1- Х гз,.) $ец 1 Случайная величина га „)Г распределена так же, кав и обычный выборочный коэффициент корреляции (11), вычпсленпый по выборке объема л — й.
Иннин словами, плотность веРоЯтности ЛлЯ гв в), заДаетсЯ фоР- мулой (12), в которой следует заменить л на л — й н р на р,)ю Таким образом, все сказанное выше о козффнционте г относитсЯ Я к г, п1ю подРобнее о частной корреляции см. )28, 47, 68, 137). Т а блиц а 4.ба. Процентные точки выборочного коэффицяента корреляция г, когда р = 0 В таблице даны с тремя значагцими цифра- ми в,в-процентные точки Л, (()) выборочного коэффициента корреляции г, когда р = О. Функция Л, (ь)) определяется как решение уравнения Р (г ( Л) = 1 — 0,01(7 (О ( () ( 100оге), причем т = и — 2 для выборочного коэффи- циента обычной корреляции и т = и †.)с — 2 для выборочного коэффициента частной корре- ляции, Й вЂ” количество независимых слагаемых Гв з суммах (18).