Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 17
Текст из файла (страница 17)
Аргументы вг и т принимают значения: Ч = 5; 2,5; 11 0,5; 0,25; 0,05эб, т = 1 (1) 20 (5) 50 (10) 100. Так как распределение г при р = 0 симметрично относительно нуля, то Л (чв) представляют собой также 2(/-процентные. точки распределения случайной величины ) г ). Интерполяция табличных значений по аргументу т не слоя<нее квадратичной. Для экстраполяции поясно воспользоваться тем обстоятельством, что случайная величина г' подчиняется В-распределению с параметрами а = = 1/2 и Ь = (и — 2)/2 = т/2, поэтому Ит ф)Р = Х (1 — 0,02()1 0,5, 0,5т) = = 1 — Х (0,02ь); 0,5т, 0,5) (см. формулы (3.29) и (3.31), а также описание таблиц 3.4). Кроме того, как уже упоминалось, г)/т/(1 — г') подчиняется распределению Стьюдента с т степенями свободы, поэтому 2%, ) р,+(>(е„н ' — (Е,(Е))э =1©» где 1((с>, т) есть (/-процентная точка распределения Стьюдента с ч степенями свободы (см. таблицы 3.2).
Заметим, наконец, что для проверки гипотезы р = 0 удобнее вместо /)т ф) вычислить величину 1= г ргт/(1 — г'), критические точки которой для больших т указаны непосредственно в таблицах 3.2. Таблица 4.5б. ПреобразоваииеФишераг=агй 1Ьг В таблице даны значения функции 1 1+г г = агя 1Ь г = — 1п— 2 1 — г для г = 0,000 (0,002) 0,748 (с четырьмя десятичными знаками) и для г =- 0,750 (0,002) 0,998 (с тремя десятичными знаками). На отрезке 0 (г (0,97 таблица допускает линейную интерполяцию (необходимые пояснения даны на с. 248). Если же 0,97 ( г ( 1, то для вычисления г следует воспользоваться формулой г= — — ( —,+1п —,, ) (таблица натуральных логарифмов 7.8 дана в заключительном разделе >гН).
Таблица 4.5в. Доверительные пределы для козффнцяента корреляции р В таблице даны графики функций р,(г;и, а) н р, (г; и, а) (см. уравнения (15)) для а = = 0 025 и 0 005 и п = 3 (1) 8, 10, 12, 15, 20, 25, 50, 100, 200, 400. Графики обратных функций гд (р; и, сс) и г, (р; и, а) являются графикамн верхнего и нижнего критических значений для г при фиксированном р, причем Р (г,( (г(г>) =1 — 2а = 0,95; 0,99. Таблицы 4.
5 заимствованы из сборника [Т27). П р н м е р. Для исследования причин нестабильного параметра некоторых однотипных трансформа— 5 Сопротивление сз ом> Индуктввность 1в гн> эге э'е ззе эзе >осе >Эге 10 Н 12 13 14 15 16 3 10 22 27 16 10 4 4 ~ 11 ( 17 ~ 20 ~ 14 ~ 12 ~ 10 Сумма Так как в данном случае можно считать, что результаты набл>оденин распределены нормально, то справедливость гнпотезм р = 0 означала бы, что индуктивность н сопротивление невависимы.
Вычисления по формуле (11) показывают, что г = 0,291 н т = ив — 2=90. По таблица 4.5анаходимЛ,э(0,5э4) =0,267, поэтому согласно двустороннему критерию с уровнем значимости Р (1г1) 0,267) = 0,01 гнпотеаа незави снмости должна быть также отвергнута. Вычислим нижний доверительный предел для р. соответствующий коэффициенту доверия 1 — а = = 0,975. Согласно формулам (16) и (171 по таблицам 1.3 и 4.56 находим Ч" (1 — а) 1,960 з, = агб >Ь г — ~ — — 0,2997 — 9'434 — 0,0919, )/л — з р, р)э> = 1Ь з, 0,0916, Для уточнения полученного аначения р>сэ> прннимае.н г аа начальное приближение (з, = з)э>1 н, воспользо- вавшись формулами (131 и (141, вычисляем з)» по фор- муле Р';ю 0,0916 Таким образом, р =рс» =- 1Ьзс» = 0,0911.
Исправ- ленное значение мало отличается от 0,0916. Аналогично можно вычислить исходное прибли- жение для верхнего цоверительного предела: а)э> = = 0,5075 и рзю> 0,4660. Так как величина рзш> близ- ка к 0,5, то для уточнения целесообраано воспользовать- ся формулой 1 ' (""1 <э> за=~э 2(п — 3) 1 4(в — 31 1 Ч> (1 — сс) (Рз ) Ргл 3 4( — З) ' торов в 92 первичных обмотках были намерены индуктивность (в гн) и сопротивление на постоянном токе (в ом).
Если бы количества меди во всех обмотках были одинаковыми, то, как иавестно, индуктивность была бы пропорциональна сопротивлению; естественно ожидать, что в этом случае коэффициент корреляции результатов измерений индуктнвностн и сопротивления будет близок к единице. Однако корреляционная таблица, в которую сведены окрувленные значения всех 92 измерений, понааывает, что гипотеаа р — 1 должна быть сразу же отвергнута 1если бы эта гипотеза была верна, то отношение индуктивности к сопротивлению было бы приближенно постоянно). Более того, расположение чисел в таблице наводит на мысль, что р = О.
Ниже приводится корреляционная таблица. В таблице даны количества наблюдений, при которых были получены результаты, указанные на полях. Твк ввв по втой формуле в дввком примере х, = 0,5075 †,0026 0,99219 †,2078 0,00062 = 0,5048, то рз Йзз = 0,4659. Следовательно, с коэффициентом доверия, првблвжевяо равным 0,95, можво заключить, что 0,091 < р < 0,466. Этп доверительные пределы хорошо согласуются е пределами, вычисленными по таблице 4.5в: 0,09 в 0,47.
В рассмотренном примере столь зввчитевьэое отличие р от единицы нельзя объяснить лишь вляяввем овшбок язмероввя в овруглеввя. По-видимому, нестабильность параметров есть следствие вествбильвоств количества в качества меди. Таблицы 4.6. Доверительные зоны для линии регрессии Таблицы позволяют строить доверительные зоны для прямой линии, оцениваемой по методу наименьших квадратов. ПУсть и РезУльтатов наблюДений вы 5з,... ..., 9„представляют собой взаимно независимые случайные величины, подчиняющиеся нормадьному распределению с параметрами М$; = а (Х; — Х) + Ь, (79; = Пз (1=1,2,...,и), где хю х„..., х„предполагаются неизвестными, х = ~х~lи, а коэффициенты а и Ь неизвестны.
Требуется указать оценку для линейной функции у = а (х — х) + Ь на отрезке с ~( х ~( д (с и г1 — заданные числа) и построить доверительную зону для графика этой функции. Согласно теории метода наименьших квадратов (см. [74)) эффективная оценка для линейной функции у имеет вид ~ бг(хг — х) т)=а(х — х)+р, а= '=' и (19) ~Ч~~ (х. — х)е Функция т) = т) (х) подчиняется нормальному распределению, параметры которого зависят от х; Мт) = р = а (х — х) + Ь„ В качестве меры отклонения т) (х) от у (х) естественно выбрать верхнюю грань модуля разности т) (х) — у (х), нормированной таким образом, чтобы ее распределение не вависело от х.
Если параметр о известен, то такой мерой является, например, случайная величина Ьг ! ч (х) в (х) ! у 00 (х) еахвы() ~/2",(хе — х)е (э* ! ' е — ) ~) *= — "'-[7Е(х; — х)', 6 = — '' )~=. а о где 1+ пСВ зр= агссоз Р (1 + вСз) (1+ в77э) С е — х 1) а — х ~/ 2,(х. — х)' ~/ 2 (х. — х)э (20) Если же параметр о неизвестен, то за меру отклонения Ч (х) от у (х) можно принять случайную величину о Уг = — Ьу 3 (21) в 1 ч-ч вз = — ~ [5з — ц (х,)]з, = и 2. Таким образом, е,— - [~ э) — вв/*у' / (х — хр 11 еах<в У В(; — х): е<.а«(1 1/ -'(хг — х)- +те=~/~~уг 2 ~, -)- — ~, (22) где ' 1/Х(хг — х)з, т, = ~ )/й. е е Распределение случайной величины Ог выражается формулой ( ( ~ ) ф ( 1 + ) 7 + еез<Ч1З> 2( ие вх .(.„е ' ~ ( При ч -ь оо эта вероятность стремится к Р (О ) и).
Если эр = О, то Ь7в распределена как ( Ц [ (т. е. модуль случайной величины, Можно показать, что распределение случая~ой величины Ь7 выражается формулой (см. !10), а также (ТЗ4), пример 5) Р (Ьг ~ и) = — с-вяз+ ф ыв (е(зэ в-Н+хчиЧз * (и "ъ 0) е — 55— подчиняющейся распределенито Стьюдента с т степенями свободы; см.
таблицы 3.2). Если же т9 = я, то //,'/2 подчиняется Р-распределению с параметрами т, = 2 и т, = т (см. таблицы 3.5). Так как в остальных случаях 0 (ф ( и, то можно вместо тр ввести новую переменную Л = з(в (ф/2). Согласно формулам (20) 2 ( )/(1.( вбв) 0 ) в77~) 1 ~ 1+вСг' Пусть ит (р, Л) есть р-квантиль распределения случайной величины У, (функция и... (р, Л) прв фиксированных т и Л определяется в интервале О ( р ( 1 как решение и уравнения Р (У и) = р). В таком случае вероятность того, что прн всех х на отрезке сь,. х ~( 1 будет выполняться неравенство ~ т) (х) — у (х) ~ ( и„т (р, Л) г (24) равна р; эта вероятность не зависит от неизвестных параметров а, Ь и о.
Если параметр а известен, то в правой части неравенства (24) следует и„в (р, Л) г заменить на и (р, Л) а. Согласно неравенству (24) область в плоскости хОу, ограниченная графинами функций и(х — х)+~-'-ив т(р,Л)г)/ * ., + служитдля линейной функции у = а (х — х) + + Ь доверительной областью с коэффициентом доверия р.
Если бы нужно было построить не доверительную зону на отрезке с ( т ( 0, а лишь два совместных доверительных интервала для у(с) и у (Ы), то для этой цели следовало бы воспользоваться статистикой Р„аналогичной статистике У,т а (/Ч(с) — у(с)/ )тт(в') — уЩ)) (25) причем 2 т ьл т-т/т Р (Р в ) и) = — (1+ — ) Х мг<е/ю ,(, ) Нв Х савв тпт -тг1е/ю (1+*') (1+ 0в+,)! Пусть вт (р, Л) есть р-квантиль распределения случайной величины т',.
В таком случае с вероятностью р в точках х = с и х = тт одновременно будут выполняться неравенства ) т) (с) — у (с) ) ( А (с), ) Ч (с)) — у (7) ! ( 11 (~) где Л(х)=г„-т(р,Л)г)/ „(' ' )з + ' . (26) Так как разность т) — у есть линейная функция от х, то неравенства справедливы тогда и только тогда, когда прямая с уравнением у = = а (х — х) + Ь на отрезке с ~(х ~~ т( заключена в полосе, ограниченной прямыми, соединяющими точки с координатами (с, Ч (с) +. .+ Л (с)) и (д, т7 (т)) + Л (г))).
Следует отметить, что если параметр а известен, то в формуле (26) нужно ив, (р, Л) г заменить на о (р, Л) а. Таблица 4.6а. Доверительные зоны двя линии регрессви. Критические ввачевия и (Р, Л) В таблице даны с тремя десятичными знаками верхние доверительные пределы статистики У, (см. формулу (22)) для коэффициентов доверия р = 0,9; 0,95; 0,99. Параметры т и Л (см.
формулу (23)) изменяются в пределах ч=1(1) 20,25,33 —, 50, 100, со; Л = 0,00 (0,05) 1,00. 11 12 13 14 15 16 17 18 гз 20 0,0 0,0 0,0 0,0 0,1 0,1 0,1 0,5 0,5 1,0 1,0 2,0 1,5 1,9 1,9 2,0 2,0 2,0 2,0 3,32 4,49 2,01 5,07 0,27 3,59 3,42 ! 5,00 ~ 0,44 ' 5,42 ! 1 2 3 4 5 6 7 8 10 7,87 5,64 1,27 7,45 7,58 0,00 8',32 10,25 6,56 4,21 то 20 ьч и= —, х4=1 20 ' 4 т (вг — Цт= 13,86, Е Таблица 4.66.
Доверительные зоны для лавин регрессии. Критические значения в (тт, Ц В таблице даны с тремя десятичными знаками верхние доверительные пределы статистики )', (см. формулу (25)) для тех же значений р и т, что и в предыдущем случае. Параметр Л изменяется в пределах Л = 0,00 (0,05) 0,70, 1/у'2. Если 1/)/2 ( Л ( 1, то для вычисления ит (р, Л) следует воспольаоваться формулой ив (р, Л) ж и, (р, ф'1 — Л').
(27) По аргументам 1/т и Л табулированные функции ив (р, Л) и ит (р, Л) допускают линейную интерполяцию с погрешчостью не более 2.10 з. Таблицы 4.6 вычнслепы в отделе математической статистики МИ АН СССР. П р в и в р. Пусть и= 20 и величины (хм $1) заданы габлвцей — 54— поэтому согласна формулам (19) 22,16 92,18 а = 13'86 = 1,599, 6 = с 20 — — 4,609, Ч = 1,599 (х — 1) + 4,609. Построим теперь доверительную зону для линейкой функции у = а (х — 1) + 5 на отрваке — 3 ~ х ~ 5. Согласно формуле (24) такая зона в данном случае задается неравенством [ Ч (х) у (х)[ ( вм (р, Х) э [~0,05 + 0,0722 (х — 1)'-, гпе в силу формул (20), (21) н (23) / 123,23 г ~ 18 — — 2 616.