Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 16
Текст из файла (страница 16)
Они позволяют по заданномузначению вероятности p, 0 < p < 1, находить точку x, такую, чтоP (ξ < x) = p. Последнее бывает часто необходимо при проверкестатистических гипотез.2.5. &……… …Область применения. Двумерное нормальное распределение ис"пользуется при описании совместного распределения двух случайныхпеременных (двух признаков). В этой ситуации двумерное нормальноераспределение является столь же важным, как одномерное нормальноераспределение для описания одного случайного признака. Обсуждение78двумерного нормального распределения начнем с обсуждения много"мерных распределений вообще.Многомерные распределения. В главе 1 мы установили, что длянепрерывной одномерной случайной величины ξ ее функция плотностивероятности, скажем, p(x) полностью задает распределение случайнойвеличины: для любых чисел a, b (a < b) bP (a < ξ < b) =p(x) dx .Частные (маргинальные) плотности. Если ξ = (ξ1 , ξ2 ) — двумер"ная случайная величина, то ее компоненты ξ1 и ξ2 — тоже случайныевеличины.
Можно показать, что если ξ имеет плотность p(x, y), тоξ1 и ξ2 тоже непрерывные случайные величины, имеющие плотностиp1 (x) и p2 (y) (называемые частными плотностями), и эти плотностивыражаются формулами: ∞ ∞p1 (x) =p (x, y) dy,p2 (y) =p (x, y) dx.−∞aАналогичным образом можно задать закон распределения случай"ной величины, принимающей значения не на числовой прямой, а наплоскости, в трехмерном пространстве, на сфере и т.д. Надо толькоиметь соответствующую функцию плотности p(x).
Тогда для любогомножества X его вероятность P (X) равнаp(x) dx ,P (X) =−∞Характеристики многомерных распределений. Чаще всего вкачестве характеристик многомерных распределений используются теили иные функции от компонент (координат) многомерных случайныхвеличин, имеющих данное распределение. Например, для двумернойслучайной величины ξ = (ξ1 , ξ2 ) мы можем рассматривать ее математи"ческое ожидание M ξ = (M ξ1 , M ξ2 ) и вторые центральные моменты:σ11 = Dξ1 ,Xσ22 = Dξ2 ,σ12 = σ21 = cov(ξ1 , ξ2 ) .где интегрирование производится соответственно по области X в плос"кости, трехмерном пространстве, сфере и т.д.Если ξ = (ξ1 , ξ2 ) имеет плотность p(x, y), то эти моменты, есте"ственно, выражаются в виде интегралов от плотности.
Например,Двумерное нормальное распределение. В качестве примера определимдвумерное нормальное распределение на плоскости. Пусть η1 и η2 — незави"симые случайные величины, имеющие стандартное нормальное распределение.Тогда двумерная случайная величина η = (η1 , η2 ) имеет стандартное двумерное нормальное распределение. Его плотность p(x, y) равна:x2 + y 21exp −.p(x, y) =2π2+∞+∞ M ξ1 =x p(x, y) dx dy .Для одномерного случая все нормальные распределения могут быть полу"чены как линейные преобразования стандартного нормального распределения:если ξ ∼ N (a, σ 2 ), то ξ можно представить в виде ξ = a + ση, где случайнаявеличина η имеет стандартное нормальное распределение. Аналогичным обра"зом можно определить двумерные нормальные распределения — это те распре"деления, которые можно получить из стандартного двумерного распределениялинейным преобразованием.
По определению, случайная величина ξ = (ξ1 , ξ2 )имеет двумерное нормальное распределение, если ее можно представить в видеξ1 = a1 + b1 η1 + c1 η2ξ2 = a2 + b2 η1 + c2 η2где a1 , b1 , c1 , a2 , b2 , c2 — некоторые вещественные числа. Заметим, что соглас"но свойствам нормальных случайных величин, компоненты двумерной нормаль"ной случайной величины, т.е.
ξ1 и ξ2 , являются нормальными (одномерными)случайными величинами. Разумеется, случайные величины ξ1 и ξ2 могут бытьзависимыми. Ниже мы покажем, что ξ1 и ξ2 зависимы тогда и только тогда,когда их ковариация (или корреляция) не равна нулю.Аналогичным образом можно определить и многомерные нормальные рас"пределения.79−∞ −∞Двумерная нормальная плотность. Укажем формулы для плотностидвумерного нормального распределения. Пусть ξ = (ξ1 , ξ2 ) — двумернаянормальная случайная величина.
Формула для плотности будет выглядетьпроще, если√ мы от ξ перейдем√к случайной величине η = (η1 , η2 ), где η1 =(ξ1 − a1 )/ σ11 , η2 = (ξ2 − a2 )/ σ11 , где a1 = M ξ1 , a2 = M ξ2 , а σ11 и σ22 былиопределены выше. Тогда η1 и η2 — случайные величины, имеющие стандартноенормальное распределение. √Пусть их корреляция (она же ковариация) равна ρ.Легко видеть, что ρ = σ12 / σ11 σ22 — то же самое, что величина корреляцииисходных случайных величин ξ1 и ξ2 . Тогда можно показать, что функцияплотности p(x1 , x2 ) двумерной случайной величины η = (η1 , η2 ) равна:1x2 − 2ρ x1 x2 + x22p(x1 , x2 ) =exp − 1.2(1 − ρ 2 )2π 1 − ρ 2Для исходной двумерной случайной величины ξ = (ξ1 , ξ2 ) плотность веро"ятности в точке (x1 , x2 ) равна11(x1 − a1 )2p(x1 , x2 ) =× exp −−222(1 − ρ )σ112π σ11 σ22 (1 − ρ )(x1 − a1 )(x2 − a2 )(x2 − a2 )2− 2ρ+.√σ11 σ22σ22Практически это выражение используют редко.802.6.
#…,ƒ…… ……Область применения. При операциях с нормальными случайнымивеличинами, которые приходится проводить при анализе данных, воз"никает несколько новых видов распределений (и соответствующих имслучайных величин). В первую очередь, это распределение Стьюдента,χ2 и F "распределения.
Эти распределения играют очень важную рольв прикладном и теоретическом анализе. Так, при выяснении точностии достоверности статистических оценок используются процентные точ"ки распределений Стьюдента и хи"квадрат. Распределение статистикмногих критериев, использующихся для проверки различных предполо"жений, хорошо приближается этими распределениями.2.6.1. #… -Определение. Пусть случайные величины ξ1 , ξ2 , ..., ξn — незави"симы, и каждая из них имеет стандартное нормальное распределениеN (0, 1).
Говорят, что случайная величина χ2n , определенная как:χ2n = ξ12 + · · · + ξn2 ,имеет распределение хи"квадрат с n степенями свободы. Для обозначе"ния этого распределения также обычно используется выражение χ2n .Ясно, что χ2n (для любого n 1) с вероятностью 1 принимает поло"жительные значения. Функция плотности χ2n в точке x(x > 0) равна12n/21xn/2−1 ex/2 .Γ(n/2)где Γ(·) есть гамма"функция.
На практике эта плотность распределениянепосредственно используется редко.Заметим, что показательное распределение с параметром θ = 1/2 изпараграфа 2.3 — это распределение χ2 с двумя степенями свободы.На рис. 2.6 изображены функции плотности распределения хи"квадрат с различным числом степеней свободы.Свойства. Нетрудно убедиться, что математическое ожидание идисперсия случайной величины χ2n равны:M χ2n = n,Dχ2n = 2n.Рис. 2.6. Функции плотности распределенияхи"квадрат с различным числом степеней свободы nвыражена в процентах, их называют процентными точками и, соответ"ственно, говорят о таблицах процентных точек).
Аргумент p, 0 < p < 1,при этом пробегает тот или иной набор значений.2.6.2. #… '…Определение. Пусть случайные величины ξ0 , ξ1 , . . . , ξn — незави"симы, и каждая из них имеет стандартное нормальное распределениеN (0, 1). Введем случайную величинуξ0tn = n1nЕе распределение называют распределением Стьюдента. Саму случай"ную величину часто называют стьюдентовской дробью, стьюдентовымотношением и т.п. Число n, n = 1, 2, ... называют числом степенейсвободы распределения Стьюдента.Плотность распределения Стьюдента в точке x равна−(n+1)/2Γ((n + 1)/2)x2√1+.nΓ(n/2) πnИз определения видно, что плотность симметрична относительноx = 0.
Это обстоятельство используют при составлении таблиц.На рис. 2.7 изображены функции плотности распределения Стью"дента с различным числом степеней свободы.Таблицы. Для случайной величины χ2n составлены разнообразныетаблицы (см. [19], [65], [77]). Чаще всего они содержат значения p"квантилей случайных величин χ2n , n = 1, 2, ..., m (если вероятность81.2i=1 ξiСвойства. Можно показать, что:M tn = 0,82Dtn =n.n−2Рис. 2.7. Функции плотности распределенияСтьюдента с различным числом степеней свободы nРис. 2.8.
Функции плотности F "распределения с различным числом степеней свободыТаблицы. В сборниках обычно приводятся таблицы процентныхточек для последовательных n = 1, 2, ... вплоть до некоторого значения.При больших n обычно рекомендуют использовать таблицы стандартно"го нормального распределения, иногда с поправками.Таблицы. Семейство F "распределений зависит от двух натуральныхпараметров m и n, в связи с чем даже таблицы процентных точекзанимают большой объем. Ради экономии места они часто публикуютсяв сжатом виде, поэтому при их практическом использовании приходитсяприбегать к дополнительным вычислениям и интерполяции.2.6.3. F-…Определение.
Пусть η1 , . . . , ηm ; ξ1 , . . . , ξn (где m, n — натураль"ные числа) обозначают независимые случайные величины, каждая изкоторых распределена по стандартному нормальному закону N (0, 1).Говорят, что случайная величина Fm,n , определенная как 212η + · · · + ηmFm,n = m1 12,2n (ξ1 + · · · + ξn )имеет F "распределение с параметрами m и n. Натуральные числа m, nназывают числами степеней свободы.
F "распределение иногда называютеще распределением дисперсионного отношения (смысл этого названиястанет ясен в гл. 6).Плотность Fm,n выражается довольно сложной формулой, котораяредко непосредственно используется на практике, поэтому мы ее при"водить не будем.На рис. 2.8 изображены функции плотности F "распределения сразличным числом степеней свободы.Свойства. Математическое ожидание и дисперсия случайной ве"личины Fm,n равны:M Fm,n =nn−2для n > 2,DFm,n =2n2 (m + n − 2)m(n − 2)2 (n − 4)для n > 4.832.7. (… … … STADIA SPSSСтатистические пакеты могут предоставлять обширную справочнуюинформацию по различным семействам вероятностных распределений,наглядно иллюстрируя их свойства и заменяя статистические таблицы.2.7.1. STADIAПакет предоставляет возможность работать с пятью дискретными ивосемью непрерывными распределениями вероятностей, приведенныминиже на рис.
2.9. Доступ к ним осуществляется из раздела Распределенияи частоты меню блока статистических методов (см. рис. 1.17). Разберемнесколько примеров.Пример 2.1к. Построим графики плотности распределения веро"ятностей нормального распределения с параметрами a = 0, σ 2 = 1;a = 0, σ 2 = 4; a = 2, σ 2 = 1.Âûáîð ïðîöåäóðû.