Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 102
Текст из файла (страница 102)
538 Ясно, что вектор $„, ~ с Йг распределен по радиальному закону, поэтому для вычисления закона распределения е~о одномерной проекции достаточно вычислить проекцию на одну из координатных осей, скажем е,. Имеем Ц ~е=— Пчхь( Известно, что случайная величина , где 0=(0', ..., 0 ) У(0, ! ), — э (В )' /Л 1 г( ) ) — У распределена по закону— г( ) и !.
Так как ~)ЭС и = (т)', ..., тГ", Ь', ..., ~') )У (О, !р+,), то получаем, что случайная величина $,',,е, распределена по закону 1 к+с †2 — ! р))((У)ею 2 2 т. е. г' = 1 = (р + () ах н Г °, (У) = К,, ~ У; О, — 1 . Следовательно, для любого Х ) 0 Х~ , =Я,,+,, ~У; О,— ) Кхе~,(Х)=й р (Х; О, ох!„), Р. где Х =- ~'Т+ р о. В частности, согласно формуле (20 22) случайный вектор ) 2 -г ро$,„, имеет равномерное распределение в шаре радиуса $ 2 + р о Лля а ) 0 распределение )х„, (К; О, оЧе) является невырожденным Используя теперь, что многомерное распределение полностью определяется своими одномерными проекциями, из формулы (20.22) получаем: Заметим, что при а — !- — 0 распределение /ср, „(Х; О, а21р) стремится к вырожденному распределению, которое представляет собой равномерное распределение, сосредоточенное на сфере радиуса а Это распределение имеет случайный вектор о$, ач Рр= Опишем теперь радиальные распределения, связанные с распределением Стьюдента.
Имеет место следующая теорема. Т е о р е м а 20.2. Для каждого р формула "( — "") (я (а — р+1ЦР/ Г( / а.ф-1 — р) 1 2 ) ор а+! 1Х 12 (20.24) (а — р+ !) о! / / (Х. О о21 ) имеет распределение Стьюдента с н2 степенямн свободы т-)- ! (у) — (1 + Я ) 2 (2' 2) 540 задает двупараметрическое семейство (по а р р — 1 и о) радиальных распределений, где о' — дисперсия.
Одномерная проекция распределения /р имеет вид: /р, а=/!. а — р+! (р' О. ор). (2а2б) Заметим, что /„! (Х; О, о2) представляет собой распределение Коши. Из условия а ) р — ! следует„что не существует радиальных распределений /р„(Х; О, о'(р) при р) 2 Для натуральных т /ь (Х; О, о') задает распределение Стьюдента с т степенями свободы н для всех р т + ! существует радиальное распределение /р,„(Х; О, о21р). Отметим также, что /р, а (Х; О, о'1р)-! !!/(Х; О, о21р) при а -р со и фиксированной дисперсии о'. Опишем схему формирования случайных векторов с плотностью распределения /р, (Х; О, о'1р) для целых а.
Известно, что случайная величина , где (02, ...„0 +') -Ф(0, 1 +,) — (0 ) 2 а одномерная его проекция распределена по закону Коши: )ь (Ю)= — 1!+ — ~ . 20.2.3. Экстремальные многомерные распределения. Пусть Рр (Хь,2) — совокупность всех плотностей р-мерных случайных векторов $ с фиксированными вектором средних Хч и невырожденной ковариационной матрицей Х.
Известно, (см. например, 1129, с. 4761), что интеграл энтропии И()!) = — ()4(Х) 1оя1,(Х) ах для ~й б Рр (Х„21) достигает максимального значения, только когда 1 Х т <ее< т1 2 — <х-х,>. х-«х-х,> 1 хе причем Н(Ж(Х; Х<ь 2>))= — (р+р!оя(2ж)+1оя(<!е121). ),(х)=й((х„х„х) = Пусть т) = (т>', ., т~') и ь =- (ь', ..., ь'") — случайные независимые векторы, распределенные по нормальным законам У (О, 1р) и й> (О, ! ) соответственно. Рассмотрим р-мерный случайный вектор $ = — 1. Ои !Ф! распределен по радиальному закону, а, как следует из механизма формирования закона Стьюдевта, его одномерная проекция распределена по закону ! т+1 ! / ут< т ! .,(У)= 1+— ~2' 2) Используя теперь формулу (20.25), получаем, что р-мерный случайный вектор га распределен по закону 7р +р, (Х).
В качестве следствия получаем: если (т>', ..., т!', т>У+< ) У (О, ! +,), то р-мерный вектор $=г — ", где т) = (т!', ..., т>у) распределен по закону 1 чуь! 1 г( а 2 гр 541 Г!окажем, что аналогичный результат имеет место для рассмотренного выше семейства плотностей Йр а (Х; Хо Х) =Ср а((1 — (Х Хо) Х Х 2а+ р к (Х вЂ” Хо)), а>1, l 1- Г ~ — +а) где с„,„ 1!1ы*1 ( ч ) Г(а) '! 2 Пусть т ф (1) — некоторая непрерывная строго возрасгающая функция при 1 > 0 и ф (0) = О. Тогда для любых а,'а 0 и Ь > 0 имеет место неравенство Юнга о аЬ < $ ф (1) !)1 + $ фт! (т) с)т, (20.
26) о о (20.27) ! причем равенство достигается только при Ь = а'! — ' . Положим а = а! и Ь =- а о — ! . Тогда из (20.27) получаем неравенство ! ! ! — У 1т — 1 паа ' ~ 1 — — а!па — !+ — и аа — '- а а (20.28) Ясно, что (20.28) эквивалентно неравенству а! ( а (па — ' — 1)~ ( и (а (а а — ' — 1)]— ! ! попо-! -(-и а" (20.29) ! Используя теперь, что и ((Р' — ' — 1)-~)п( при а- оо, получаемиз(20.29) неравенство а, (по!о <а,1п а! — а! 1 а„ где ф — ' (ф (1)) =1, причем равенство достигается только при Ь вЂ” ф (а). Рассмотрим случай, когда т = 1' — ', где а ) 1. Тогда ф-! (т) =1= — т — ' и из (20.26) получаем: для любых а > 0 и Ь>0 имеет место неравенство ! 1 т — 1 ИЬ < ~1 — — ) "-! + — ЬЬ"-', а ) а лежащее в основе доказательства экстремальности много.
мерного нормального закона, Положим 1 На Дз) = — ) )з (Х)~а ~~а (Х) ' — 1)1 бХ, ) Н (й)=х !в Положим Ьа Дт) = ( бе! 2нХ ~ ьа ' Ьа (4а) Заметим, что для любого невы рожденного линейного преоб- разования 0: Р' -а- Р'. Ьа Две х,) = Ьа ()т) С л е д с т н и е 20. !. Функционал Ь,", на множестве всех плотностей р-мерных случайных векторов с невырожденной ковариационной чатрицей является инвариантным относительно невырожденных линейных преобразований, ограни- 54э Ь (Ея) = — ~~е(Х)~а(Х) "-' дХ. Например, для целых и ~ 2 Ь,„Чв) = — ~ Я~(Х) бХ=- — Й(Х) К~, а~ — ! в частности, Ь, (~й) = — (!)я (Х)!'а.
Заметим, что Н ф-»НДй) при сс-а аа. Так как На()й) = = а (Ь 0~) + 1), то для каждого а, 1 ( а ( ао, задачи на экстремум для функционалов Н„Дй) и Ь„(~й) эквивалентны. Полагая в (20.29) а, = ~й(Х), а,. = Ря (Х; Ха, Х) н интегрируя его по Йа, получаем после умножения на — — что имеет место следующая теорема.
а — !' Т е о р е м а 20.3, Функционалы Ь„(~й) и Н (1 ) достигают максимальные значения, только когда (й (Х) = = Н„. а (Х; Х,, Х), причем 1 Ь,(К', „) = — с'" — '; "за+ П чен сверху константой с и достигает максимальное значение на радиальной плотности Й„,„ Г ~ — +сс) где с— Р Г (сс) ~ — +сс) 20.3.
Теория процедур оптимизации проекционных индексов Пусть Х<Ю == (Х„..., Х„) — выборка объема и в Й». Каждая статистика ср (У„..., 1'„) на с)-мерных выборках т<"1 =- (1',, ..., 1'„) объема л, 1 < с(( р, задает проекционный индекс Е (А) -= ср (АХ„..., АХ„), где А— некоторая проекция из Й» в Й». Обозначим через МЬ (р, д) — множество всех проекций из Й» в Й» (см. и. 20.2.!). Решение статистической задачи методом целенаправленного проецирования содержит два этапа: 1) выбор проекционного индекса Е (А); 2) решение оптимизационных задач для функции Е (А) на соответствующем подмножестве М: — М). (р, д).
Вопросы, связанные с этапом 1, достаточно подробно разобраны в гл. 19. Основная цель настоящего параграфа— изложить теорию алгоритмов решения задач этапа 2. 20.3.1. Области оптимизации в задачах поиска выразительных проекций. Начнем со структуры множества МТ.(р, д).
Как отмечалось в п. 20.2.1, каждая проекция из Й» в Й» однозначно определяется (рхд)-матрицей А, удовлетворяющей условию с(е1 АА' Ф О. Поставим в соответствие (р х с))-хсатрице А набор из с) ее р-мерных вектор-строк (О„..., О,) и заметим, что с)е1 АА' Ф 0 тогда и только тогда, когда эти векторы линейно независимы.
Пусть 1. (А) — линейное с)-мерное подпространство в Й», натянутое на векторы (О,, ..., 0»), составляющие матрицу проекции А. Тогда имеет место следующая лемма Л ем м а 20.3. Соответствие А- (1. (А), (О„., О»)) позволяет отождествить М1. (р, с)) с множеством всех пар (1., (О,, ..., 0„)), где 1. — с(-мерное подпространство в Й», а 10,, ..., О») — некоторый базис в этом подпространстве. Аналогично пусть МО (р. »1) — множество всех ортогсснальных проекций из Й» в Й» (см. п.
20.2.1). Тогда верна следующая лемма. 544 Л ем и а 20.4. Соответствие А-з- (г'. (А), (О„..., Оч)) позволяет отождествить 0(р, Ч) с множеством всех пар (1., (О„..., О ч)), где 1. — г( -меРное подпРостРанство в Кп, а (О„..., О ч) — некоторый ортоноплгироганнгнй базис в этом подпространстве. Указанное соответствие отождествляет, в частности, множество всех проекций из Кп в Р' с множеством ненулевых векторов 0 Е Кп, а множество всех ортогональных проекций из Рп а Р' с множеством единичных векторов 0 (см.
п. 20.2.1). О п р е д е л е н и е 20.1. Статистика гр ()'„ ..., 'г'„) на г)-мерных выборках называется инвариантной относительно преобразования В пространства Рч, если гр ( В)гт, ..., В1'„)= = ~р (1'„..., 1'„). Практически все важные проекционные индексы строятся по статистикам, инвариантным относительно невырожденных либо ортогональных преобразований В. О п р еде л е н и е 20.2. Проекционный индекс Р, построенный по статистике гр (г'„..., 'го), инвариантной относительно любого нгвырождгиного преобразования, называется б7.-инвариангным и соответственно О-инвариантиым, если гр (1'„..., Уп) инвариантна относительно любого орпгогоналоного преобразования. Введем теперь так называемое многообразие Гроссмана б (р, г)), точками которого являются г)-мерньге линейные подпространства 1.
в Кз П18Р. Возьмем некоторый бг'.-инвариантный проекционный индекс Р (А). Рассмотрим з)-мерное линейное подпространство 1. с: Рп, выберем в нем базис О,, ..., О, и тем самым получим проекцию А (1.) из Рп в Р». Положим, по определению, Ф(1.) = Р (А (1.)). (20.30) Проекция А (1.) определена с точностью до выбора базиса в (., но так как Р (А) является бЬ-инвариантным, то формула (20.30) корректно задает функцию на многообразии Грассмана б (р, з)).
г Многообразие 6 (и, о) — клзссический математический объект, названо в честь немецкого математика, физика и филолога Г. Грзссмзнз (1809 — 1877). В сочинении «Учение о линейном про. стрзнстве» Г. Грвссмзн двл первое систематическое построение теории многомерного евклидовн пространства, ввел скалярное произведение векторов 1301.
18 Заказ ХВ 201 С л е д с т в и е 20.2. Задача поиска выразительной проекции А» для ОЕ-инвариантного проекционного индекса г" (А) эквивалентна задаче: найти 1. = агд ех1г Ф (1,). (20.31) ьсо пи»> С л е д с т в и е 20.3. Задача поиска выразительной ортогональной проекции А» для О-инвариантного проекционного индекса г (А) также эквивалентна задаче (20.3!), Естественно, при построении А„ = А (Е»), в этом случае необходимо взять некоторый ортогональный базис в найденном экстремальном подпространстве 1., с: Й». Таким образом, показано, что поиск выразительных проекций из К» в )»» сводится к решению оптимизационных задач на многообразии Грассмана 6 (р, о). Объясним, какие преимущества дает эта редукция.