Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики.djvu), страница 9
Описание файла
DJVU-файл из архива "Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 9 - страница
Плотность распределения, задаваемая (2.16), будет постоянна, если с — некоторая константа, т. е. выражение (2.16) будет содер®~~ь только постоянные величины. Контур, полученный приравниванием показателя степени при е некоторой постоянной, соответствует сечению функции плотности плоскостью, параллельной Рис. 2.7, Условная нормальная плотность ЦХ2~ Х1) Рис. 2.6.
Двумерная нориальная плотность Рис. 2.8. Сечение двумерной нормальной плотности плоскостью постоянной плотности и соотиетствяОщий этому сечению эллипс липса находится в точке (р~,р, ),а его ориентация задается матрицей Х ', Из (2.15) видно, что эта ориентация зависит от двух дисперсий и коэффициента корреляции. Если мы стандартизир~ем как Х~, так и Ха, перейдя к г и г„ то двумерная функция плотности примет вид: (2.18) плоскости осей Х„Х,. Такое сечение показано в левой части рис. 2.8, а в правой части его изображен полученный в результате сечения эллипс. (2.17) представляет собой квадратное уравнение, описывающее эллипс, порождаемый сечением при постоянной плотности. Центр эл- л' = 1г, г 1.
Поскольку средние значения обеих величин г равны нулю, а их дисперсии равны 1, совместная плотность будет иметь центр в точке (О,О), а ковариационная и корреляционная матрицы, вычисленные по этим стандартизованным величинам, будут идентичны. Эллипс, порождаемый сечением нормированной двумерной нормальной плотности плоскостью постоянной плотности, определяется уравнением' е'р 'е = с. Поскольку двумерная плотность — теперь функция только коэффициента каррелуции, ориентация полученного эллипса функциональна зависит теперь только от коэффициента корреляции. Если коэффициент корреляции положителен, то большая ась эллипса будет расположена под углом 45'. Если коэффициент корреляции отрицателен, то большая ось эллипса будет расположена под углом 135'.
Если коэффициент корреляции равен нулю, то эллипс вырождается в окружность. Наконец, по мере увеличепия абсолютного значения коэффициента корреляции большая ось эллипса будет расти относительно его малой оси. Эти положения легко проверить. Большая ось эллипса постоянной плотности имеет наибольший квадрат полудлины среди всех векторов, проходящих через начало координат. Для нахождения большой оси нам нужно определить вектор и'=Ь, г,) с максимальным квадратом полудлины, удовлетворяющий уравнению эллипса к'р Ъ = с.
Пользуясь методом Лагранжа, описанным в разделе 1.5, можно записать: <р = к'и — Цх'р ~х — с), где я'и есть квадрат полудлины. Таким образом, мы рассматриваем уравнение — '~ =--2к — 2Хр-1и = О. дф дя Упрощая и умножая обе части на р, получаем: (р — ы)к = 6. (2.19) Уравнение (2,19) записано в той же форме, что и уравнение (1,27), и, следовательно, А — это характеристические корни р с соответствующими характеристическими векторами к. Оба характеристических корня матрицы р будут положительны, так как р предполагается определен'ной положительно, и равны А, = 1+ р,-, и 3,, = 1 — р„. Х~ будет большим корнем, если р, есть положительная величина; в противном случае если р„Ф О, то большим. корнем будет Х,, Так как мы вычисляем характеристические корни матрицы, обратной к ма~рице квадратичной формы, описывающей эллипс (т.
е. х'р-тих=с), при положитель- т Коэффициент корреляции не зввисит от того, вычисляется ли он на основании исходных величин Х или ствпдартнзоввниых величии Х. 64 и,х значениях р„, йолудлина большой оси равна 1 3,,с и она будет ,Величиваться с ростом р,з. Полудлина малой оси равна 3' Ь,,с и она буудет убывать с ростом р,в. При отрицательных значениях р1в порядок определения большой и малой оси обратный, но утверждение, что при увеличении абсолютного значения р„болыпая ось эллипса астет относительно его малой оси, остается в силе.
В частном случае, когда р,в равен нулю, обе оси имеют равную длину'. С найденными характеристическими корнями связаны два нормированных характеристических вектора: Х, соответствует вектор ~1ф~2 1Дг 2], а Х, соответствует вектор ~16'2 — 1ф 2). Если Х, является большим корнем (р,, имеет положительное значение), то большая ось эллипса находится на прямой г, =г,. Если большим корнем ЯВляются Хв (рв имеет отрицательною значение), то большая ось эллипса находится на прямой г1 = — г~. 2А„МНОГОМЕРНАЯ НОРМАЛЬНАЯ ПЛОТНОСТЬ ВЕРОЯТНОСТИ Многомерная совместная нормальная функция плотности являстса непосредственным обобщением двумерного случая, Для величин Х„Хв, ..., Х„, которые предполагаются лежащими в интервале ( — оо, оо), многомерная нормальная плотность определяется как — — '1х — р)'х-'Ж вЂ” р)1 2 1 1(Х1» Ха»--.» Х~р) ~з 1~2 ехр (2л)" 3 х $ ~Х вЂ” ф' = 1Х,— р,, Х,— р, ...
Х~ — р,) а ковариациоиная матрица, предполагаемая положительно определен- ной, записывается в виде ом ои-" 'Ъу Х ( ) Ф Р Р И Элементы на главной диагонали (о'„, о„, ..., о„„) ковариационнойматрицы суть дисперсии каждой из,р случайных Величин. Элементы Вне главной диагонали есть ковариации этих величин. Матрица симметрическая, так как а;т = бур " В етом случае существует бесконечно больщое чнсло осе», которые можно назвать большой и ыалой. Если подобно двумерному случаю Х'=1Х, Х, ...Хр1, то вектор средних значений задается выражением Е (Х') = И (Х1) Е(Х,) ... Е(Х„)~ = ~р,, ~~, ...
р„1 = р', (2.22) Корреляционная матрица, также предполагаемая положительно определенной, имеет вид: а1р Уаи арр 2рр " Уа„о,„ Уы 1 й " Р1р Р21 1 " Ряр Уа а11 ЄЄ, ° ° * 1 ар, ар~ арр Уарр а„старр а~, 1,'арра ц, Здесь Є— коэффициент корреляции между Х, и Х„р„, — коэффициент корреляцйи между Х, и Х и т. д. Если мы стандартизуем каждую случайную величину, перейдя к ; =- (Х; — р~)Д/ац, то плотность будет равна: 1 Й~„г„..., гр) = ехр — — й'Р-~к е р )р~2 ~ ~3/3 2 р-мерную нормальную функцию плотности с вектором р средних значений и ковариационной матрицей Х мы будем обозначать через Фр (р., Ж).
Заметим, что если р задать равным 1, то выражение (2.20) превращается в одномерную функцию плотности, а если р задать равным 2, то ~2.20) превращается в двумерную совместную нормальную функцию плотности. Следовательно, (2.20) есть общее выражение для нормальной функции плотности. Аналогично (2.25) есть общее выражение для стандартизованной нормальной функции плотности. На основании Р"мерной нормальной плотности можно определить р-мерный эллипсоид постоянной плотности.
Полудлины осей этого эллипсоида находятся по характеристическим корням матрицы Х при использовании исходных величин Х, или, что эквивалентно, по характеристическим корням матрицы Р при использовании стандартизованных величин. Ориентация эллипсоида будет определяться характеристическими векторами, связанными с этими характеристическими корнями. Яы проиллюструем эти вычисления в последующих разделах, 2.5.
ОЦЕНИВАНИЕ В практике статистической работы параметры генеральной совокупности мы почти никогда не знаем, а обычно оцениваем эти параметры иа основе выборочных данных. В литературе в основном рассматриваются два вида оценок: точечная оценка и интервальная оценка. При точечнач оценивании мы делаем приблизительный подсчет, в результате которого приходим к единственному оценен пому значению параметра генеральной совокуппости. Это значение является в некотором смысле «наилуч1пимв, далее мы обсудим смысл этого слова.
Например, мы можем а приблизительно подсчитать, что средний рост всех студентов университета составляет 5 футов 10 дюймов. Часто принимается приблизитель- 66 и е допущение, что тот или иной параметр генеральной совокупности, „апример р„идентичен некоторой выборочной статистике, например Х.
При цнтервальиом оцениеаяии мы делаем приблизительный расчет интервала, которому должно принадлежать неизвестное значение параметра генеральной совокупности. Например, мы можем приблизительно оценить, что средний рост всех студентов некоторого университета находится в интервале от 5 футов 10 дюймов до 6 футов. Перед проведением выборки мы можем сказать, что в какой-то степени уверены в том, что параметр генеральной совокупности будет находиться в некотором интервале, заданном около выборочной статистики.
Если мы сделали случайную выборку студентов университета в данном университете и обнаружили„что средний рост был равен Х = 5 футам 10 дюймам, то можно сказать с уверенностью на 95%, что при повторной выборке среднее значение генеральной совокупности будет заключено в интервале Х -Ь |г, где А может быть равно 2дюймам. Число й может быть постоянным для разных выборок или меняться от выборки к выборке, в зависимости от постановки задачи. В дальнейшем нам понадобятся два метада оценивания.
Первый из них называется методом наименьисих квадратов. Зтот метод находит широкое применение и связан с именами Лежандра и Гауссае. Предположим, что у нас есть и выборочных наблюдений Х„Х„..., Х„, взятых случайно из генеральной совокупности со средним значением р. Допустим, что каждое наблюдение Х; может быть выражено в виде Х~ — — Р. + в~в где е; есть отклонение от истинного среднего значения генеральной совокупности.
Предположим далее, что у нас есть некоторая оценка для р, например р. Для р существует соответствующее отклонение Х~ относительно этой оценки среднего. Одно из этих отклонений, е~ — — Хй — р,, показано на рис. 2.9. Объективный метод получения оценки среднего заключается в выборе такого р, которое минимизирует сумму квщРатов значений е;. Иначе говоря, мы хотим минимизировать величину Хеа= Х (Х вЂ” р)' по всем а выборочным наблюдениям.