Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 67
Текст из файла (страница 67)
е. запись исходных наблюдений в координатах надпространства П»с' (Е). Введем в рассмотрение величины » п М = ', ~ч", (Х вЂ” Х)'(Х вЂ” Х); >=>>=! л» Мр (С) =- ~~"„, ~я~"„, (У! — Ет)' (Е! — Е>), »=!г ! выражающие суммы квадратов расстояний между всевозможными парами имеющихся наблюдений соответственно в исходном пространстве П» (Х) и в подпространстве Пс» (2). Из простых геометрических соображений очевидно, что всегда Мр (С) ~ М„при р'( р. Рассматривая в качестве меры искажения суммы квадратов попарных взаимных расстояний между точками-наблюдениями величину ̄— Мр (С), можно показать (293), что Мв Мр ($ в ) = >п>п (Мр Мр (С))= с =и'(Х, +, + я, +, + ... -Рй,). где 1.
(р') — матрица размера р'Хр, строками которой являются первые р' собственных векторов 1;, 1», ..., 1» исходной ковариационной матрицы Х (т. е. подпространство П'„', (Я) является подпространством, натянутым па первые р' главных компонент вектора наблюдений Х).
С в о й с т в о 3. Среди всех подпространств заданной размерности р' (р' ( р), полученных из исследуемого фактор- ного пространства П»(Х) с помощью произвольного линейного преобразования исходных координат х!'>, ..., х!»>, в пространстве, нап>якутом на первые р' главных компонент, наименее искажаются расстояния от рассматриваемых точек- наблюдений до их общего щентра тяжести», а пиисже углы 352 между прямыми, соединяющими всевозможные пары точас- наблюдений с их общим ««ентром тяясести». Поясним это свойство. Рассмотрим матрицу «» размера (р х п) «центрированных» наблюдений х<'> = х<'> — х<'>.
У ! Здесь, как и прежде, Х, = (х<", ...,х<»>) — исходные наблюдения, а х<'> = (х('> + х<'> + ... + хв<")lп — средняя арифметическая по всем наблюдениям >'-го признака, т. е. х<'> х<'> ... х' " » " и х<2> х<»> ,. х!»! » '" Ф х<»> х~»> ... х<»> Введем в рассмотрение матрицу размера (и х и): Н = = 6'б = — (и>«), >', <) — — !, 2, ..., и. Нетрудно установить геометрический смысл элементов этой матрицы." Ьм = ч, (х<<>)*= Ъ' (><<'> — х<'>)'— <=! <=1 зто квадрат расстояния от точки-наблюдения Х> до общего «центра тяжести» Х, а й = ~ х<о х<<> — ~' Яо —.«н>) (х<о «<о) <=! <=! величина, пропорциональная косинусу угла между прямыми, соединяквцими точки Х«и Х> с центром тяжести Х. Если рассмотреть, кроме того, матрицу б (С) наблюдений с„..., с„, являющихся проекциями исходных (центрированных) наблюдений Х,, ..., Х в подпространство П»с' (Я), и соответствующую ей матрицу Н (С) = С' (С)>< хб (С), то оказывается, что ) Н вЂ” Н ($.
(р') ) = ш ! и )Н вЂ” Н (В) ) = п»(>»» +! < Трл +»+, +Ц) где под ) >А) ) понимается, как обычно, евклидом норма матрицы А, а $. (р') соответствует ранее введенным обозначениям. Из описанного выше следует, что естественной мерой относительного искажения геометрической структуры исходной совокупности наблюдений при их проектировании в про- 12 Зава» № 29! странство меньшей размерности, натянутое на первые р' главных компонент, является величина (р')= — ~(р') = '+' -хР либо величина При неизвестной истинной ковариационной матрице Е ее собственные значения Х» ..., Хя следует заменить собственными значениями 1н ..., Х„выборочной ковариационной матрицы Е (соответственно теоретические характеристики х и у заменятся своими выборочными аналогами х н у). 13.4. Статистические свойства выборочных главных компонент; статистическая проверка некоторых гипотез Смысл математико-статистических методов, как известно, состоит в том, чтобы по некоторой части исследуемой генеральной совокупности (по выборке или, что то же, по ограниченному ряду наблюдений Х„Х,, ..., Х„) выносить обоснованные суждения о ее свойствах в целом.
Применительно к рассматриваемой задаче нас в первую очередь интересует, как сильно свойства и характеристики выборочных главных компонент могут отличаться от соответствующих свойств и характеристик главных компонент всей генеральной совокупности н, в частности, как зта мера отличия зависит от объема выборочной совокупности (и), по которой зги выборочные главные компоненты были построены.
Так, например, для изучения природы внутренних связей между характеристиками различных статей семейного бюджета потребления и для выявления небольшого числа наиболее существенных в атом смысле показателей исследователь может обследовать какое-то количество (и) семей и по полученным результатам наблюдения Х,, Х„..., Х„ построить главные компоненты г~'>, г<'~, ..., г~г'>. Однако, увеличивая объем выборки и, т.
е. добавляя к имеющимся наблюдениям результаты наблюдения по дополнительно обследованным семьям, естественно ожидать, что пересчет главных компонент о учетом добавленных набио- дений, вообще говоря, изменит (хотя, быть может, и незначительно) ранее полученные значения интересующих нас характеристик: Л„1, (> = 1, 2, ..., р) и т.п.
В то же время существует, по-видимому, такое (столь большое) и, дальнейшее увеличение которого уже не будет практически приводить к изменению основных характеристик главных компонент (другими словами, мы вправе ожидать, что главные компоненты выборок достаточно болыцого объема практически совпадают с главными компонентами всей генеральной совокупности).
Выяснению некоторых вопросов, связанных с оценкой близости различных выборочных (э>'>, 1„Л,) и теоретических (го>, 1„Л,) характеристик главных компонент, и посвящен настоящий параграф. Приведенные ниже результаты исследований неизменно опираются на допущение нормальности исследуемой генеральной совокупности и взаимной независимости извлеченных из нее наблюдений. Как и прежде, под Х„Х„..., Х„будем понимать центрированные наблюдения, которые, строго говоря, даже при независимых исходных наблюдениях уже не будут независимыми. Однако при достаточно больших п можно пренебречь этим эффектом нарушения независимости. Таким образом, Х, е Л> (О, л.), >' = 1, 2, ..., п (как следует из предыдущего, вектор средних значений )х = Е Х определяет лишь точку в р-мерном пространстве, в.
которую переносится начало координат при переходе к главным компонентам, и с самого начала будем считать этот перенос уже осуществленным). Вспомогательные факты. относящиеся к свойствам выборочных характеристик главных компонент (16, 279, 177, !76, 236, 235„20!. Если все характеристические корни Л„ Л„..., Лр ковариацнонной матрицы Х различны, что и имеет место в большинстве приложений анализа главных компонент, то справедливо следукхцее: 1) характеристические корни Лп Лы ..., 3,„и соответствующие им собственные векторы 1„1», ...,1 выборочной ковариационной ма>прицы Х являются оценками максилииьного правдоподобия для соответствующих теоретических характеристик (соответственно Л„Лы ..., Лв и 1„1„..., 1э) и обладают всеми хорошими свойствами этих оценок (соспюяп>ельность, асимптотическая эффек>низкость).
Следовательно, выборочные главные компоненты эо> = 1»Х (1 = = 1, р) можно интерпретировать как оценки главных компо>2» 355 нент г»»> всей генеральной совокупности. Если среди характеристических корней Л„Л„..., Л, встречаются равные между собой, то оценки максимального правдоподобия для . Л; и 1; определяются иначе.
Аналогичные результаты имеют место и при оценке характеристических корней и соответствующих им собственных векторов корреляционной матрицы; 2) величины )»и — 1 (Л» — Л») (1 = 1, р) асимптотически (по и -»- ьо) нормальны со средним значением О и с дисперсией, равной 2 Л), и независимы от других выборочных хара ктеристических корней; 3) вектор )» п — 1 (1» — 1»)' (1 = 1, р) асимптотически (по п — ьо) подчиняется многомерному нормальному распределению с веюиором средних значений О и с ковариационной матрицей Ч~ мв (Л» Л»р »»' г»» Этот результат имеет место для всякого Л„отличного от всех остальных характеристических корней, каждый из Которых может иметь произвольную кратность; 4) выборочный характеристический корень Л» распределен асимптотически (па и — ~ ьо) независимо от компонент пютветсп»вуюцего ему собсп»венного вектора 1; (»' = — 1, р); 5) ковариация между г-й компонентой выборочного собственного вектора 1, и а-й компонентой выборочного собственного вектора 1» равна величине Л» Л» »»„ »»ч (и†))(Л; — Л»)ь Следующее (шестое) утверждение 120) относится к весьма специфической ситуации, характеризуемой так называемым чэффектом большой размерности», когда, несмотря на достаточно большой объем выборки и, поведение выборочных характеристик обнаруживает неожиданные особенности из-за соизмеримо (си) большого значения размерности р; при этом для вывода этого факта не требуется нормальности исходных наблюдений, б) если компоненть» хч»> вектора наблюдений Х взаимно независимы и пронормированы анисим образом, что Ех»») =- О и Ох~») = 1, причем существуют все моменты Е (х~»>)", н если объем выборки и и размерность р одновременно доспш- пючно велики, причем Ищ — =с (0(с(оо), р (в) л я то распределение случайно выбранного из последовательности «„л„..., )«и характеристического корня «слабо сходитсяь) к некоторому предельному распределению (сосредоточенному на конечном отрезке), моменты которого задаются формулой ,( (» — )(» — ) ".