Теория универа (555138), страница 15
Текст из файла (страница 15)
= n s′−1 = n ⋅( xi − xi −1 ), i = 1,2,..., s − 1;b * −a *1n ′s = n ⋅(b * − x s −1 ).b * −a *Здесь s – число интервалов, на которые разбита выборка.Наблюдаемое значение критерия Пирсона вычисляется по формуле (20.1‘), а критическое– по таблице с учетом того, что число степеней свободы k = s – 3. После этого границыкритической области определяются так же, как и для проверки гипотезы о нормальномраспределении.Затем, предполагая, что f ( x) =71PDF created with FinePrint pdfFactory trial version http://www.fineprint.com3. Проверка гипотезы о показательном распределении.В этом случае, разбив имеющуюся выборку на равные по длине интервалы, рассмотримx + xi +1, равноотстоящих друг от друга (считаем, чтопоследовательность вариант xi* = i2все варианты, попавшие в i – й интервал, принимают значение, совпадающее с егосерединой), и соответствующих им частот ni (число вариант выборки, попавших в i – йинтервал).
Вычислим по этим данным x B и примем в качестве оценки параметра λ1величину λ* =. Тогда теоретические частоты вычисляются по формулехВni′ = ni p i = ni p( xi < X < xi +1 ) = ni (e − λxi − e − λxi +1 ).Затем сравниваются наблюдаемое и критическое значение критерия Пирсона с учетомтого, что число степеней свободы k = s – 2.Критерий Колмогорова.Этот критерий применяется для проверки простой гипотезы Н0 о том, что независимыеодинаково распределенные случайные величины Х1, Х2, …, Хп имеют заданную непрерывную функцию распределения F(x).Найдем функцию эмпирического распределения Fn(x) и будем искать границы двусторонней критической области, определяемой условием(20.3)Dn = sup | Fn ( x) − F ( x) |> λ n .| x| < ∞А.Н.Колмогоров доказал, что в случае справедливости гипотезы Н0 распределениестатистики Dn не зависит от функции F(x), и при п → ∞p ( n Dn < λ ) → K (λ ), λ > 0,гдеK (λ ) =∞∑ (−1)me −2m λ 2 2(20.4)m = −∞- критерий Колмогорова, значения которого можно найти в соответствующих таблицах.Критическое значение критерия λп(α) вычисляется по заданному уровню значимости α каккорень уравнения p ( Dn ≥ λ ) = α .Можно показать, что приближенное значение вычисляется по формулеz1λ п (α ) ≈−,2n 6n λ = α.где z – корень уравнения 1 − K 2На практике для вычисления значения статистики Dn используется то, чтоm −1mDn = max( Dn+ , Dn− ) , где Dn+ = max − F ( X ( m ) ) , Dn− = max F ( X ( m ) ) −,1≤ m ≤ n n1≤ m ≤ nn а X (1) ≤ X ( 2 ) ≤ ...
≤ X ( n ) - вариационный ряд, построенный по выборке Х1, Х2, …, Хп.Можно дать следующее геометрическое истолкование критерия Колмогорова: еслиизобразить на плоскости Оху графики функций Fn(x), Fn(x) ±λn(α) (рис. 1), то гипотеза Н0верна, если график функции F(x) не выходит за пределы области, лежащей междуграфиками функций Fn(x) -λn(α) и Fn(x) +λn(α).72PDF created with FinePrint pdfFactory trial version http://www.fineprint.comхПриближенный метод проверки нормальности распределения,связанный с оценками коэффициентов асимметрии и эксцесса.Определим по аналогии с соответствующими понятиями для теоретическогораспределения асимметрию и эксцесс эмпирического распределения.Определение 20.1.
Асимметрия эмпирического распределения определяется равенствомma s = 33 ,(20.5)σBгде т3 – центральный эмпирический момент третьего порядка.Эксцесс эмпирического распределения определяется равенствомmek = 44 − 3 ,(20.6)σBгде т4 – центральный эмпирический момент четвертого порядка.Как известно, для нормально распределенной случайной величины асимметрия и эксцессравны 0. Поэтому, если соответствующие эмпирические величины достаточно малы,можно предположить, что генеральная совокупность распределена по нормальномузакону.73PDF created with FinePrint pdfFactory trial version http://www.fineprint.comЛекция 21.Корреляционный анализ.Проверка гипотезы о значимости выборочногокоэффициента корреляции.Рассмотрим выборку объема п, извлеченную из нормально распределенной двумернойгенеральной совокупности (X, Y).
Вычислим выборочный коэффициент корреляции rB.Пусть он оказался не равным нулю. Это еще не означает, что и коэффициент корреляциигенеральной совокупности не равен нулю. Поэтому при заданном уровне значимости αвозникает необходимость проверки нулевой гипотезы Н0: rг = 0 о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе Н1: rг ≠ 0. Такимобразом, при принятии нулевой гипотезы Х и Y некоррелированы, то есть не связанылинейной зависимостью, а при отклонении Н0 они коррелированы.В качестве критерия примем случайную величинуr n−2T= B,(21.1)1 − rB2которая при справедливости нулевой гипотезы имеет распределение Стьюдента (см.лекцию 12) с k = n – 2 степенями свободы.
Из вида конкурирующей гипотезы следует, чтокритическая область двусторонняя с границами ± tкр, где значение tкр(α, k) находится изтаблиц для двусторонней критической области.Вычислив наблюдаемое значение критерияr n−2Tнабл = B1 − rB2и сравнив его с tкр, делаем вывод:- если |Tнабл| < tкр – нулевая гипотеза принимается (корреляции нет);- если |Tнабл| > tкр – нулевая гипотеза отвергается (корреляция есть).Ранговая корреляция.Пусть объекты генеральной совокупности обладают двумя качественными признаками (тоесть признаками, которые невозможно измерить точно, но которые позволяют сравниватьобъекты между собой и располагать их в порядке убывания или возрастания качества).Договоримся для определенности располагать объекты в порядке ухудшения качества.Пусть выборка объема п содержит независимые объекты, обладающие двумя качественными признаками: А и В.
Требуется выяснить степень их связи между собой, то естьустановить наличие или отсутствие ранговой корреляции.Расположим объекты выборки в порядке ухудшения качества по признаку А, предполагая,что все они имеют различное качество по обоим признакам. Назовем место, занимаемое вэтом ряду некоторым объектом, его рангом хi: х1 = 1, х2 = 2,…, хп = п.Теперь расположим объекты в порядке ухудшения качества по признаку В, присвоив имранги уi , где номер i равен порядковому номеру объекта по признаку А, а само значениеранга равно порядковому номеру объекта по признаку В. Таким образом, получены двепоследовательности рангов:по признаку А … х1, х2,…, хппо признаку В … у1, у2,…, уп .При этом, если, например, у3 = 6, то это означает, что данный объект занимает в ряду попризнаку А третье место, а в ряду по признаку В – шестое.Сравним полученные последовательности рангов.1. Если xi = yi при всех значениях i, то ухудшение качества по признаку А влечет засобой ухудшение качества по признаку В, то есть имеется «полная ранговаязависимость».74PDF created with FinePrint pdfFactory trial version http://www.fineprint.com2.
Если ранги противоположны, то есть х1 = 1, у1 = п; х2 = 2, у2 = п – 1;…, хп = п, уп = 1,то признаки тоже связаны: ухудшение качества по одному из них приводит кулучшению качества по другому («противоположная зависимость»).3. На практике чаще всего встречается промежуточный случай, когда ряд уi немонотонен. Для оценки связи между признаками будем считать ранги х1, х2,…, хпвозможными значениями случайной величины Х, а у1, у2,…, уп – возможнымизначениями случайной величины Y.
Теперь можно исследовать связь между Х и Y,вычислив для них выборочный коэффициент корреляции∑ nuv uv − nu v ,rB =(21.2)nσ u σ vгде u i = xi − x , vi = y i − y (условные варианты). Поскольку каждому рангу xiсоответствует только одно значение yi, то частота любой пары условных вариант содинаковыми индексами равна 1, а с разными индексами – нулю. Кроме того, извыбора условных вариант следует, что u = v = 0 , поэтому формула (21.2) приобретаетболее простой вид:∑ u i vi .rB =(21.3)nσ uσ vИтак, требуется найти∑u v ,i iσu и σv.n3 − n. Учитывая, что x = y , можно выразить12∑ ui vi через разности рангов d i = xi − y i = ui − vi . После преобразований получим:Можно показать, что∑u2i= ∑ vi2 =d i2n2 −1n3 − nn3 − n∑ ui vi = 12 − ∑ 2 , σ u = σ v = 12 , откуда nσ uσ v = 12 .
Подставив эти результатыв (21.3), получим выборочный коэффициент ранговой корреляции Спирмена:6∑ d i2ρB = 1− 3.(21.4)n −nСвойства выборочного коэффициента корреляции Спирмена.1. Если между А и В имеется «полная прямая зависимость», то есть ранги совпадаютпри всех i, то ρВ = 1. Действительно, при этом di = 0, и из формулы (21.4) следуетсправедливость свойства 1.2.
Если между А и В имеется «противоположная зависимость», то ρВ = - 1. В этомn3 − nслучае, преобразуя di = (2i – 1) – n, найдем, что ∑ d i2 =, тогда из (21.4)36(n 3 − n)= 1 − 2 = −1.ρB = 1−3(n 3 − n)3. В остальных случаях -1 < ρB < 1, причем зависимость между А и В тем меньше, чемближе | ρB | к нулю.Итак, требуется при заданном уровне значимости α проверить нулевую гипотезу оравенстве нулю генерального коэффициента ранговой корреляции Спирмена ρг при конкурирующей гипотезе Н1: ρг ≠ 0.