XVI_Terver (969543), страница 40
Текст из файла (страница 40)
Естественно, хотелось бы иметь безразмерную 2 4. Коиариоция и коэффиииеит корреакиии саутайиых величии 317 характеристику степени линейной зависимости. Но это очень просто сделать — достаточно поделить ковариацию случайных величин на произведение их средних квадратичных отклонений. Определение 7.11. Коэффициентпом корре ищии случайных величин Х и У называют число р = р(Х, У), определяемое равенством (предполагается, что 1хХ ) 0 и 12У ) 0) сот(Х,У) нйх.ох' Теорема 7.5. Коэффициент корреляции имеет следующие свойства.
1. р(Х,Х) =1. 2. Если случайные величины Х и У являются независимыми (и существуют РХ > 0 и РУ > 0), то р(Х,У) = О. 3. р(а1Х1 + Ьм а2Х2 + Ь2) = ~р(Х1, Х2). При этом знак плюс нужно брать в том случае, когда ас и а2 имеют одинаковые знаки, и минус — в противном случае. 4. -1 <р(Х,У) <1. 5. ~р(Х,У)~ = 1 тогда и только тогда, когда случайные величины Х и У связаны линейной зависимостью. < Доказательство теоремы следует из свойств ковариации, и мы предлагаем провести его самостоятельно.
~ Пример 7.22. Найдем коэффициент корреляции случайных величин Х вЂ” числа очков, выпавших на верхней грани игральной кости, и У вЂ” на нижней (см. пример 5.5). Для этого сначала вычислим МХ, МУ, РХ, РУ и сот(Х,У). Воспользовавшись табл. 5.3, получим 1 1 1 1 1 1 МХ = МУ = 1 — + 2. — + 3 — + 4 — + 5 — + 6 — = 3,5, 6 6 6 6 6 6 2 1 1 2 ПХ = ПУ = (1 — 3,5) — + (2 — 3,5) . — + (3 — 3,5) — + +(4-35) -+(5-35) — +(6-35) 2 2 35 1 6 12' 318 Т.
ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН сот(Х, У) = (1 — 3,5) (1 — 3,5) . О + (2 — 3,5) (1 — 3,5) О+ 1 + ... + (6 — 3,5)(1 — 3,5) — + (1 — 3,5)(2 — 3,5) О + ... + + (5 — 3,5)(2 — 3,5) — + (6 — 3,5)(2 — 3,5) О + ... + 1 1 1 + (4 — 3,5)(3 — 3,5). — + (3 — 3,5)(4 — 3,5) — + ... + 1 1 35 + (2 — 3,5)(5 — 3,5) — + ... + (1 — 3,5)(6 — 3,5) Таким образом, -35/12 Р= 35/12 = -1. Впрочем, это мы могли бы установить и без всяких вычислений в силу свойства 5 коэффициента корреляции, если бы вспомнили, что сумма чисел очков на противоположных гранях равна семи и, значит, Х = 7 — У (Х и У связаны линейной зависимостью с отрицательным коэффициентом пропорциональности).
Пример 7.23. Температура воздуха Х1 и Хз в два последовательных дня представляет собой двумерную случайную величину с вектором средних (там твз), дисперсиями оз~ > О и озз > О и коэффициентом коРРелЯции Р. РассмотРим новУю слУ- чайную величину (7.11) Хз =хХ1+Ь, где х, Ь вЂ” некоторые числа. Назовем Хз линейным прогнозом температуры воздуха на следующий день при известной температуре воздуха в предыдущий день. Подберем числа х и Ь таким образом, чтобы математическое ожидание М(Х вЂ” Х )з приняло минимальное значение. В этом случае Хз называют наилучшим в средне квадратичном линейным прогнозом. В 7.4. коаарианил и лочффиииеит лорреллиии случайных аеличии 319 соответствии со свойствами математического ожидания и дис- персии находим М(Хг — Хг) = 12(Хг — Хг) + ~М(Хг — Хг)1 = РХг — 2сои(Хг, Хг) + 1лХг + (МХг — МХг) = (х а1 — 2храгаг+аг) + (хпг1+ Ь вЂ” упг)~. Заметим, что первое слагаемое хга1г — 2хра1аг+ агг в последнем выражении зависит только от х.
Второе слагаемое (хуп1 + Ь вЂ” епг) является неотрицательным, причем при любом фиксированном х его минимальное значение, равное нулю, достигается при ь= Минимум первого слагаемого достигается при аг Х =,О— а1 (7.12) Следовательно, минимальное значение математического ожидания М(Хг — Хг) достигается при х = Раг/а1 и Ь = упг— — Й$1Раг/а1 и равно: М(Хг — Хг) =Рог — 2Р аг+аг =(1 Р )аг Поэтому М(Хг — Хг) = О, т.е. Хг = Хг в случае ~р~ = 1, и наилучший линейный прогноз является абсолютно точным. Качество прогноза ухудшается с уменьшением ~р~.
При р = О наилучший линейный прогноз Хг — — Ь = упг, состоит в указании средней температуры на следующий день и не зависит от температуры в предыдущий день. Примеры 7.22 и 7.23 показывают, что коэффициент корреляции (также как и ковариация) отражают „степень линейной близости" случайных величин. При этом, если р ) О, то коэффициент пропорциональности (7.12) в наилучшем линейном приближении (7.11) одной случайной величины другой является положительным, а в случае Р ( Π— отрицательным.
320 7. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН Поэтому при р > 0 говорят о положительной корреляционной зависимости Х и У, при р ( 0 — об отирицательной. Например, рост и вес человека связаны положительной корреляционной зависимостью, а температура и время сохранности продукта — отрицательной. Однако, коэффициент корреляции (ковариация) может не улавливать „степень нелинейнойблизости" случайныхвеличин. Для этой цели служат другие характеристики, например, корреляционное отношение, которое будет рассмотрено в 8.2.
По аналогии с ковариационной матрицей для случайного вектора Х = (Х1, ..., Х„) можно ввести корреляционную матрицу. Определение 7.12. Хорреллционной (нормированной новориацнонной) матприцей случайного вектораХ называют матрицу Р = (р;;) = (р(х;,х,)), состоящую из коэффициентов корреляций случайных величин Х;иХ. КОрреляционная матрица Р порядка н имеет вид 1 Р|г " Р1п Рг1 1 ° ° ° ргя Ре1 Рнг . 1 Т.б. Другие числовые характеристики случайных величин В этом параграфе мы дадим краткое описание некоторьпс других применяемых на практике числовых характеристик случайныя еелнчин.
Отметим, что зти характеристики, как и все остальные, рассматриваемые в настоящей главе, по 7.в. Друтие числввме харахтвристихи случайивтх величии 321 сути дела, являются характеристиками законов распределений случайных величин. Поэтому в дальнейшем вместо слов „характеристика случайной величины, имеющей некоторое распределение (закон распределения)" будем говорить „характеристика распределения". Случайную величину Х называют симметрично распределенной относительно математического ожидания, если Р(Х ( МХ - х) = Р(Х > МХ+ я) для любого я. В частности, непрерывная случайная величина Х является симметричной тогда и только тогда, когда график ее плотности распределения симметричен относительно прямой *= мх.
Определение Т.13. Асилтметприеб А случайной величины Х называют отношение тпретпьего иеншрального моментпа о тпэ к кубу среднего квадратпичного отпнлоненил вч о тпз А = —. оэ Нетрудно видеть, что (при условии существования третьего момента) для симметрично распределенной относительно матпематпичесного ожидания случайной величины Х асимметрия равна нулю. Определение 7.14. Экст4ессолл Е случайной величины Х в называют отношение четвертого иентпрального моментпа тп4 к квадрату дисперсии эа вычетом числа 3: о тп4 Е= — — 3.
о4 Ясно, что асимметрия и эксцесс — безразмерные величины. Пример 7.24. Вычислим асимметрию и эксцесс случайной величины, имеющей нормальное распределение. Согласно опре- !! — 10047 322 т. числОВые хАРАктеРистики случАЙных Величин делению1 +оо Г о Г 3 Г(*- ) ГПЗ= / (Х-ГП) ватто,а(х)г(яоо У Е Х, ,г' гтг/2я +оо +оо 4 (Х вЂ” Ггг) -(х — ог)г/(2аг) ~х тй4 = / (Х вЂ” та) Дог а(Х) 4(х = ( ~- — Е Х. гтг/2тг Делая замену у = х-гп, имеем о~/2~г Я откуда в силу нечетности подынтегральной функции следует, о что гтгз = О и асимметрия уг = О. Для того чтобы найти гй4, применим формулу интегрирования по частям. Полагая )з -(х-то)г/(2аг) ( гг = и г(о= — е \ ~/2~г гт имеем +со о 2 Г (х-пг)' (.
)г/(заг)„ ггг4=3гт у е а гт~/2я Воспользовавшись теперь результатом примера 7.17, окончао тельно получим, что гп4 = Зо4, и, следовательно, эксцесс Е = О. Таким образом, для нормального распределения асимметрия и эксцесс равны нулю. Определение 7.15. Квантпилью уровня а, или сг-иваитпильто, (О < а < 1) случайной величины Х (распределения случайной величины Х) называют число Яо, удовлетворяющее неравенствам Р(Х < Я„) < а и Р(Х ) Я„) < 1- а. Т.в. Другие числовые характеристики случвйвыв величин 323 1/2-квантиль называют также лведканой М случайной вели- чины Х. Для непрерывкой случайной величины Х а-квантиль ф„ является решением уравнения Р(Я ) =а, где Р(х) — функция распределения случайной величины Х.
Таким образом, для непрерывной случайной величины Х кван- тиль Яа — это такое число, меньше которого Х принимает значение с вероятностью сс. Если известна плотность распределския р(х) случайной величины Х, то, учитывал связь между функцией распределения и плотностью распределения, уравнение для определения аквантили можно записать в виде р(х)ах = св. Пример 7.25. Найдем св-квантиль и медиану экспоненциального распределения. В этом случае ~„представляет собой решение уравнения (рис.
7.1) ] е-М1в р Поэтому 1п(1 — а) 'ча = Л Ясно, что медиана экспоненциального распределения 1п2 М= —. Л Если трактовать экспоненциальное распределение как распределение времени распада атома (см. 4.6), то медиана будет соответствовать периоду полураспада. 324 7. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН Рис.
7.1 Пример 7.26. Пусть случайная величина Х представляет собой число успехов в одном испытании по схеме Бернулли с вероятностью успеха р. Тогда, как видно на рис. 7.2, Яа = О при О < а < д, Я =1 при о<а<1, а д-квантиль может быть любым числом от О до 1 включительно. Этот пример показыРис.