Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 8
Текст из файла (страница 8)
У/ (Х) Рнс. 2.4. Равномернан плотность Выражение(2.5) задает среднее ариф- метическое значение Х, причем 1" (Х) представляет собой веса. Знаменатель выражения (2.5) можно не писать, так как Х ~(Х) = 1 при любом распределении вероятностей. Для иллюстрации предположим, что мы определяем равномерную плотность распределения как ~ (Х) =- —, 0 ~ Х з 3; 3' 0 в остальных точках. Зта функция изображена графически иа рис. 2.4. Сначала убедимся, что ~(Х) представляет собой функцию плотности.
Два необходимых и достаточных условия для функции плотности состоят в следующем: (1) ~ (Х) больше или равна нулю при любых значениях Х и (2) ~ ~(Х)дХ =1,0. Ясно, что заданная выше функ- ~ Под непрерывной случайной величиной авторы псаразумевака случайну~~ величину, область возмон(ныл значений которой являетсн всей прямой, полупрямой, отрезком прямой нлн совокупностью отрезков. — Примеч. равд. ~* Под дискретной случайной величиной авторы подразумевают случайну(о величину, область возможных значений которой состоит нз какого-то числа (конечного ннн окатного) атдгнечик точек. — 'П инге. рад. ~ия ~ (Х) удовлетворяет=этим двум условиям, и для этой плотности математическое ожидание равно: Е(Х) = ( — ХдХ = — 1 ХдХ= —.
3 3~ ' 2 ЯЮ о Дисперсия. Если Х есть непрерывная случайная величина, то дисперсия Х равна: Если величина Х дискретна, то айаг (Х) = Х ~(Х вЂ” Е (Х))' ~ (Х)1 = Е Я вЂ” Е(Х)Р. (2.7) Вторая форма выражения (2.7) справедлива как для дискретных, так и для непрерывных величин. Для ранее заданной равномерной плотности айаг(Х) = — Х вЂ” — дХ = —. Заметим, -что, в то время как математическое ожидание может быть вычислено без знания дисперсии, дисперсию нельзя вычислить без знания математического ожидания. Свойства математического ожидания и дисперсии.
В этой книге мы будем попеременно применять символы р. и Е (Х); оба символа обозначают среднее значение совокупности, но в некоторых случаях удобнее пользоваться Е (Х), чтобы избежать индексов. Оператор математического ожидания обладает следующими важными свойствами, которые читателю следует проверить самостоятельно." 1. Математическое ожидание постоянной величины равно этой постоянной. Таким образом, если с — постоянная величина, то Е(с) =с. 2.
Математическое ожидание произведения постоянной величины на случайную величину равно постоянной величине, умноженной на математическое ожидание этой случайной величины. Следовательно, Е (сХ) = сЕ (Х), где с — псстоянная, а Х вЂ” случайная величина. 3.
Математическое ожидание суммы равно сумме математических ожиданий, т. е. Е (ХХ) =- Х (Е (Х)). В этой книге мы будем попеременно пользоваться символами Ф и ~аг (Х); оба символа обозначают дисперсию распределения. Дисперсия обладает следующими важными свойствами, которые читатели следует проверить: 1. Дисперсия постоянной величины равна нулю. Следовательно, если с — произвольная постоянная, то айаг (с) = О. 2. Дисперсия произведения постоянной величины на случайную величину равна квадрату постоянной величины, умноженному на дис- йерсию случайной величины. для постои»ной с н случайной величины Х ~аг (сХ) — -- с" ~аг (Х).
3. Дисперсия случайной величины остается неизменной, если к каждому значению этой величины добавляется постоянная величина. Таким образом, ~ аг (с+ Х) = ~аг (Х). Часто нас интересуют действия не с одной переменной, а с двумя или более переменными. В случае двух случайных величин, например Х, и Х„мы можем их представить 7т вектором Х вида Х' = 1Х1 Х 1. Назовем функцию плотности, относящуюся одновременно к обеим велие ° ' 1 х -р чинам, совместнои' функцией илотности распределения ~ (Х), где4 1(Х) = 1(Х„Х,).' 4 В этом случае обе величины будут ° ~ ' иметь средние значения н обе будут ° е Ъ (р~,РД иметь дисперсии. Кроме того, эти две величины будут иметь совместную вариацию, измеряемую ковариаиией.
На рис. 2.5 показаны элементы„взяРнс. 2.5. Диаграмма Рассеяния с тые из гипотетической диаграммы положительной новариацией рассеяния точек, относящиеся к случайным величина Х, и Х . Точки диаграммы находятся в основном в первом и третьем квадрантах, что указывает на некоторую положительную связь между этими двумя величинами. Допустим, что мы выбрали какую-то определенную точку и нзмерпли ее отклонения и, и рв от центра рассеяния. Так как большинство точек лежит в первом и третьем квадрантах, то для любой точки произведение этих отклонений (Х, — рт) (Хв — р,,) будет скорее положительно, чем отрицательно.
Таким образом, если мы определим ковариацию о~а как с1в = Е ~(Х, — и,,) (Х вЂ” рв)), то в на»пем примере эта величина будет положительной. В общем случае, если две величины связаны монотонно возрастающей зависимостью, тс их. ковариация будет положительной; если две величины связаны монотонно убывающей зависимостью, то их ковариация будет отрицательной.
Если две величины статистически независимы, то их ковариацня равна нулюа. Иы часто будем пользоваться обозначением соч (Х,, Х,) для указания ковариации между Х, и Х,. Заметим, что если р, ил~» р, равно нулю, то соч (Х,„Х,) =- Е (Х,Х,).
4 Совместная Функция плотности определяет среднюю вероятность на единицу илоц»адн ЬХ,ЛХ~. 4 Бо обратное неверно. Две случайные величины могут быть связаны даже функционально и иметь ковариацив, ровную нулю. Ъ„ б0 Если мы объединим два средних значения в вектор, называемый Ве -тором средних, то мы получим: (2 9)- Е (Х,) Е(Х ) р~ы также можем объединить все дисперсии и ковариации в ковариационную матрицу Х.
Таким образом„ Е(Х вЂ” р )' Е(Х вЂ” и1) (Х, - — Р~) Е (Х вЂ” Р.,) (Х, — Р,д Е(Х вЂ” Ы' О11 6'1~ аа1 622 (2.10) В ковариационной матрице дисперсии этих двух величин находятся на главной диагонали, а ковариация — вне главной диагонали. Эта матрица симметрическая, так как а„= о~„и мы будем считагь, что она положительно определена.
Употребление обозначения матрицы Х и символа суммирования Х не должно вызывать путаницы, так как первый всегда будет набираться жирным шрифтом. Заметим также, что мы будем пользоваться двойными индексами, а не аквадратоьр для обозначения дисперсии переменной. Для матричного представления это„кажется, уже стало обычным.
Поэтому для одной переменной с' — дисперсия генеральной совокупности. В ковариацианной матрице эта дисперсия обозначается, например, с~„. Корреляция мсжду Х, и Х, обозначается символом р„. Коэффициент корреляции тесно связан с ковариацианной матрицей., Подобна тому кака„определяет связь между Х, и Х~, так и р„определяет связь между этими величинами. Одно из преимуществ использования р,~ вместо а'„заключается в том, что р,~ не зависит ат единиц измерения случайными величин. Коэффициент корреляции определяется как рь = (2Л1) 1 О11 021 Выражение (2.11) показывает, что коэффициент корреляции должен иметь тот же знак, что и а„, так как а„и а„обе положительны'; Если а„равна нулю, то и р„равен нулю.
Более того,- .— 1<р, <1. - . - ' ' (2.12) -Это следует из предположения, что матрица Х определена положительно, и того факта, что определитель- 3 может быть записан в виде а„а',~ (1 — рЬ), Если р„равен ~1, то двумерная плотность вырождается в одномерную плотность. Коэффициенты корреляции мы также можем объединить в юррелм. ционную матрицу 10 р„ (2,13) ' ' е Если о,е илн оее реены нулю, то рте онределнть ньеьен. Коэффициенты р„и р, равны 1, так как они выражают корреляцию случайной величины самой с собой. Кроме тога, р,» = р,„так как корреляция Х, с Х точно такая же, как и корреляция Х» с Х,.
Следовательно, корреляционная матрица является симметрической, а также положительно определенной. Видно также, что если величины статистически независимы, то и р, и Х будут диагональными матрицами, так как о, = О. Ковариационная матрица может быть записана с помощью дисперсий и коэффициентов корреляции. Согласно (2.1О) и (2.11) о'и. р1» Ф о'и о»а (2.14) р1»1 о~~ о»» О»з Матрица, обратная'~ковэриационной матрице в этой форме, будет иметь вид-' У~~11 ~т (2,15) Уо ъ Этой обратной матрицей мы воспользуемся в следующем разделе.
2.3. ДВУМЕРНАЯ НОРМАЛЬНАЯ ПЛОТНОСТЬ ВЕРОЯТНОСТИ Двумерная нормальная функция плотности, определяющая савмвсииув плотность вероятности двух случайных величин Х1 и Х„ для конечных значений Х, и Х, может быть записана в виде ПХ1, Х») = ехр — 1 (Х вЂ” М)' Х '(Х вЂ” Р), (2,16) где и ~ Хаесть определитель Х. Эту функцгпо можно представить трехмерной поверхностью, подобно той, которая показана на рис. 2.6. Эта поверхность имеет центр в точке (р,1, р,,) и обладает тем свойством, что любая вертикальная плоскость, проходящая параллельно оси Х, или Х„дает в сечении одномерную нормальную функцию плотности.
На рис. 2.7 показано подобное сечение. Плотность, полученная таким образом, называется условной плотностью. На рис. 2,7 изображена условная плотность Х» при заданном значении Х,. Для обозначения условной плотности Х при заданном значении Х1 мы будем польаоааться ааписью ~ тХ,~Х,), где ! читается апра залаииомь. Условная плотность ~ (Х,~Х»), т. е. плотность Х, при заданном значении Х„ получится при сечении плоскостью, параллельной оси Х1.