Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 25
Текст из файла (страница 25)
прн заданном о' величина о-и К// является верхней границей для г', а при заданном е' величина еа //К является нижней границей для сг'. Точно так же из нижней границы К' получается верхняя граница га//К' для оа. Вероятность' нарушения каждого из этих неравенств в отдельности в'//К < о.к и еа//К' ) сге, равна /Л д дв. Критерий Стьюдента в. лддитивность слкчлйных величин х' В э 23 была доказана теорема: если две независимые случайные величины подчиняются распределению 7е с ~ и д степенями свободы, то сумма этих величин имеет распределение уа с Г --; д степенями свободы.
Эту теорему можно легко доказать непосредственно, не пользуясь характеристическими функциями. Случайные величины у' и Д имеют те же функции распределения, что и суммы Уев + ° ° ° + Ус " Ус+1 + - ° + УС+в независимых одинаково нормально распределенных случайных величин у„..., у~+ с нулевым средним значением и единичной диснерсиеи. Следовательно, д', + К, имеет такую же функцию распределения, как и сумма У1 + ° ° ° + УС+в т. с. т', + К~ подчиняется распределению Ке с С + д степенями свободы. $ 28. Критерий Стьюдента Вернемся к вопросу, поставленному в конце у 26.
Можно ли, применяя правило !М вЂ” х! — ( 1,96, с вероятностью 0,95, ыМ или !М вЂ” х! < 2,58, с вероятностью 0„99, ым заменить в знаменателе ам па вм? Для ответа на этот вопрос нужно найти функцию распределения для отношения ем Г!реждс всего упростим задачу. Смещением начала отсчета на оси Ох можно добиться равенства х = О, и в этом случае С= —. ЭХ (2) ем При изменении масштаба на оси Ох отношение С остается неизменным, поэтому мы можем считать, что о. =!.
Если числитель в. л. еан дар Верден - гвве 146 Гт Д Гауссова теории ошибок и критерии бо1ОЮдента Умножая в (3) числитель и знаменатель на Д7 = ~(а — 1 и принимая во внимание равенство 7ег = Хв, найдем У1 О Х (4) 'Таким образом, задача отыскания функции распределения Н(а) случайной величины 2 сводится к вычислению вероятности события (5) Если мы положим (6) то неравенство (5) упростится: У1 ( ех. (7) В 2 27 В было доказано, что у, и Хв независимы, следовательно, плотность вероятностей пары случайных величин (у,, Хв) равна произведению плотностей вероятности у, и Хв, 1 1 1 1 — — и' -„-/-1 7(у) д(г) = = — е г ага е '1 ги (8) а= 22 г( — ) Поэтому искомая вероятность имеет вид 1, 1 1 ,Гà —— Н(а) = а'ц е г гг е - "с(ус7г =. у «- с Г* с 1'» Г' 1 Г 1 , Г .-! — 1 —.
. "à — -а' а =а')гя е 2 сй) е 1 а1у ~а'= =). ~ -ю~ (9) Для того чтобы при интегрировании по у верхний предел был постоянным, сделаем подстановку у = х ) г: и знаменатель (2) умножить на )'в, то, в обозначениях 2 27, получим дг)'и и, (3» вм)п 28. Критерий Сть?с?дента !4т с Г/??Г Н(а) =-сс') з - 'е "- с/е) е - 'с/х е (10) п изменим порядок интегрирования, гсо допустимо в силу поло- жнтелыюсти подинтегральпых функции: с г /-й Н(а) =- а') с/х) х '- е х с/з. (11) Интегрируя по г, получим, согласно ~ 12 (2), гамма-функцию / .?. т х з ' й/ — ( т*) Х)с+ ) о Поэтому с а Н(а) = у (1 + х') - с/х = /) !1 +' ! - 'с//, (12) ! где , =- а:т е ьх Г~ — —, — ) =--?г е Г~ — --)/Г~;), (13) Формула (12) янляется решением поставленной задачи.
Интеграл Н(а) можно вычислить в элементарных функциях. Плотность вероятнос1и случайной величины / задается равенством /?] ь(/) =-,'"=(! +'-,') ' )7/т ! (14) График функции (14) имеет колоколообразную форму и похож на тауссову кривую ошибок. При ~ — функция (14) стремится, очевидно, к плотности нормальи>го распределения /(/) = -;= е )2е Если Н(а) вычислена в явном ниде как функция а, то можно найти, при каком а вероятность Н(а) принимает заданное значение 1 — /д, причем /т можно выбрать, например, равным 0,025 или 0,005. Тогда вероятность того, что / превзойдет границу а = /„, будет равна б. Так как — / имеет то же самое распределение, что и /, то — / сможет превзойти границу / также лишь с вероятностью /з. !Ое 1аа Гя. Рд Гоуссооо теория ошибок и критерий Стьюденто Абсолютнаи величина )г! может пРевзойти гРаницУ 8р с веРоЯтмостью 2ф.
Указанная выше постановка вопроса и ответ на этот вопрос в виде формулы (12) исходят от английского статистика Гассета, который под скромным псевдонимом »Стьюдент» опубликовал работу', совершившую переворот в статистике. Поэтому распреде.ление случайной величины гназывают распределением Стьюдента. В свою очередь правило, согласно которому гипотетическую величину среднего значения х отвергают тогда, когда модуль отношения 1 превосходит границу 1, называют критерием Стьюдента. Граница 1» зависит от уровня значимости р и от числа степеней свободы ) =- и — Е Границы гттабулнрованы в табл.
7 н конце книги. При использовании одностороннего критерия предполагаемое среднее значение х отвергают лишь ~огда, когда 1 положитель- НО И ПРЕВОСХОДИТ Гт ИЛИ ЛИШЬ тОГДа, КОГДа 1 О1РИЦатЕЛЫЮ И НЕ превосходит — 1х При двустороннем критерии на знак 1 пе обращают внимания, а лишь учитывают абсолютную величину )1(, Вероятность того, что правильное значение х по кри|ерпю Стьюдента будет отвергнуто, в случае одностороннего критерия равна )т, а в случае двустороннего критерия равна 2р'.
При этом предполагается, что все х, — независимые одинаково нормально распределенныс случайные величины. Если это не так, то ф и 26 будут лишь прнближеннымн значениями для уровней значимости соответствуюших критериев, $29.
Сравнение двух средних значений Во всех экспериментальных естественных науках большое значение имеет следуюшая постановка вопрсса: Пусть имеется д случайно выбранных значений х, , х некоторой случайной величины х и Ь значений у, , у„ друго»» случайной величины у. Обозначим х и у выборочные средние в первой и второй выборке соответственно. Предположим, что у оказалось несколько меньше (или нссколько больше), чем х. Означает ли это, что истинное среднее значение у, в силу 1ех или иных условий, также меньше (соответственно больше) другого ис1инного среднего значения х, или различие выборочных средних носит чисто случайный характер? Иными словами: как велика должна быть разность О = х — у, чтобы ее можно было считать значимой, т.
е. чтобы можно было утверждать, что хф у? "Б»а не а», Тье рсоьаые етос от а касаи, рдоьаепдйа, а (1908), 1. д 29. Сравнение двух средних значений На этот вопрос гауссова теория ошибок дает следуюший ответ: так как при больших д и Ь выборочные средние х и д имеют приближенно нормальные распределения с дисперсиями о'" = — о . П гез = — -се„ 2 2 н приближенные значения этих дисперсий задаются формулами 1 .
(х — х)е. д ч(у — 1) 2 1 ' (у — у)' 88= -У= — „-' (2) то разность имеет также приближенно нормальное распределение с дисперсией 2 2 й ЕГР = ЕГ2 + О У, приближенным значением которой является 2 2, й ап = 82 + 88 . (3) Если истинная разность х — у = О, то отношение д =- В/а~> распределено приближенно нормально с нулевым средним значением и единичной дисперсией. Следовательно, с вероятностью, близкой к ! — 2ф, (д( не превосходит границы др, которую можно найти по заблицам нормального распределения: например, при 2Р = 0,01 граница д = 2,58. Однако так как знаменатель оо неизвест н, то его заменают величиной ап. ВслеДствие таной замены ненадежность границы усиливается, поэтому обычно несколько завышают; например, в качестве границы для отношения В/зп часто выбирают 3 или, если желают достичь еше большей надежности, 4.
Если нормированная выборочная разность (В(/вр превьапаст эту границу, то гипотезу х = у следует отвергнуть н считать, что х) у или х < д, смотря по тому, положительна пли отрицательна выборочная разность В. Как видно, это грубое правило лишено вполне удовлетвори1ельного обоснования. Что же в конце концов нужно выбирать в качестве границы для В/зр. 2,58; 3 или 4, и каков уровень значимости этого критерия? Для очень больших д и Ь все ясно, так как в этом слУчае с п можно заменить на зп без Риска совеРшить сколько-нибудь значительную ошибку, но для малых или умеренно больши х д и Ь хотелось бы уже знать точнее, сколь большой должна быть выбрана граница дз для В/зр, чтобы в случае х = у ~вероятность события (В,'/ап > д равнялась бы, скажем, 0,012 100 Гя. И. Гауееоеа теория ошибок и критерий Стыодекеяа (6) К сожалению, на этот вопрос нельзя ответить совсем точно, Вероятность того, что отношение Х)/вп превысит заданную границу, зависит (хотя и в незначительной степени) от неизвестного отношения истинных квадратичных отклонений т„и ег .
Поэтому постановку вопроса несколько изменяют. Согласно основной гипотезе, которую нужно проверить и, может быть, отвергнуть, различие между х и у является чисто случайным и истинные средние значения х и у равны друг другу. Но если различие между х и у чисто случайное, 1о можно предполагать, что соответствующие средние ошибки о.„и |т также равны друг другу. Таким образом, мы исходим из гипотезы, что х и у имеют не только одинаковые средние значения х = у = р., но также и одинаковые квадратичные отклонения о., Нужно проверить, согласуется ли найденная выборочная разность 2) = х — у с этой гипотезой? Если истинные дисперсии аг и | ' равны друг другу, то неразумно вычислять для них два различных приближенных значения вв и вп В этом слУчае следУет вычислить одно-единственное приближенное выражение для обеих дисперсий, а именно, взвешенное среднее в г и вге.
Веса, которые следует приписать величинам Я„и вт согласно 9 26 Б, должны быть обратно пропорциональны дисперсиям случайных величин вк и в'. Эти дисперсии, согласно 9 27 (11), равны 2о.е 2о.| и д — 1 1 †Следовательно, вес д„' относится к весу дв, как д — 1 к Ь вЂ” 1, Поэтому взвешенное среднее равно вв = (д — 1) е'„+ (Ь вЂ” 1) ее,к (х — Мг)'+ ~ (д — Мг)е (д — 1) + (Ь вЂ” 1) д+ Ь вЂ” 2 — — — — — (4) С помощью этого в' образуем ~еперь (5) д (1 1| В большинстве случаев величина 8е лишь незначительно отличается от ф, вычисленной по формулам (1), (2) и (3). Если д =?е или если в„' = в|о то 8' = вш Таким образом, результаты вычислений по формулам (1), (2), (3) и (4), (5), (6) практически будут одинаковыми. Следуя Стьюденту н Фишеру', построим отношение (7) ' д|вьег В.
А., Арр!)кацапа от „ььпдспдв" Лагцвимогь Ыгпоп, В (1920), 90. у" су. Сравнение двух средних значений и постараемся определить функцию распределения этого отношения в предположении, чзо справедлива гипотеза, согласно которой х„..., хе и у„...,у„— независимые одинаково нормально расиределейные случаипые величины со средним значением 1х и квадратичным отклонением а..
Так как при одинаковом изменении масштабов осей Ох и Оу отношение 1 не меняется, то мы можем считать, что;и = 0 и о. = 1. Положим Хз = (у — 1) зз = 'У.' (х — х)' ХЗ = (Ь вЂ” Ц У = (у — у)м Тогда (д + Ь вЂ” 2) г' = тз, +;сзз. (8) Покажем, что случайные величины тз, т, 'х н у являются независимыми. Вероятность одновремешюго выполнения неравенств а,-Ц<Ь,, а,— х<6„~ (9) а, тз<Ь„а, у<Ь,1 равна интегралу от совместной плотности вероятности системы случайных величин (х„, ху уп .. уи): ~...~'Л*,)...ПМ(у,)".~(у.) (х,...