Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 32
Текст из файла (страница 32)
Таким обрааом, поскольку области должны исчерпывать все пространство, то линии должны пересечься в точке, а равенство вероятностей определяет с, — с однозначно. г Чтобы сделать это в конкретном случае, в котором мы имеем числовые значенкя компонент векторов 911>, 911>, р>з> и элементов матрицы Х, мы рассмотрели бы три ((р+1) совместных распределения, каждое из которых является распределением величины 21,>1 (7' чь1). Мы могли бы испытать значения с, = 0 и, используя таблицы (П и р с о н [71) лвумерного нормального распределения, вычислить Р(1>1, Я).
Методом проб и ошибок можно было бы получить сп приближенно удовлетворяюшие приведенным выше условиям. Вся предшествуюшая теория излагалась в предположении, что параметры известны. Если же они неизвестны, но имеется выборка из каждой совокупности, то в определение функции и, (х) можно подставить оценки параметров. Пусть наблюдения х>'>, .... лч>> произведены над совокупностью 1'' " Ф1 Ф((ь>1>, л~), 1=!...., л>. Оценим р,"> величиной Ф( х (() = —,, ~>„х~>>, (8) д матрицу Š— матрицей Я, определяемой из уравнения Н О О О /В е А>1 ~~~1~ >>71 — л> Я = 1> ~~~~ (х>„> — х' г)(х,"> — х">) . (9) 1 1 1-1«-1 Тогда аналогом функции и, (х) будет О1 (х) ~х — — (х> >+х<)>)~ 8 (х< > — х<7>).
(10) Поскольку используемые алесь величины являются случайными, то полученные распределения будут отличны от КЛАССИФПКАИИЯ ИАБЧ)ОЛЕИИН (гл. з распределений 47) . Однако при М(-и -о совместные распределения будут стремиться к распределениям (7) Следовательно, при достаточно больших выборках можно использовать изложенную выше теорию. 8.8. Пример классификации в случае нескольких многомерных нормальных генеральных совокупностей Р а о (6) рассмотрел три генеральнь(е совокупности, состоящие из членов индийских каст браминов (я,), ремесленников (и ) и корва (и,).
Для каждого члена касты измерялись рост стоя (х,), рост сидя (хз), ширина носа (хз) и длина носа (х„). Средние значения этих величин для трех генеральных совокупностей приведены в таблице 6. Таблица 6 Ремееаепиини Кирее (ив) ) (е,) ! Брвминм (и1) Корреляционная матрица для всех ностей равна 1,0000 0,5849 0,1774 0,5849 !,0000 0,2094 0,1774 0,2094 1,0000 0,1974 0,2170 0,2910 генеральных совокуп- Стандартные отклонения равны а, — — 5,74; а,:=-3,20; аз — — 1,75; а, = 3,50. Предположим, что каждая генеральная совокупность является нормальной. Задача состоит в том, чтобы разбить пространство четырех случайных величин хи х, х, хв на три области классификации, Предположим, что цены ошибочнь)х классификаций равны между собой. )йы найдем: 1) множество областей в предположении, что новое Рост стоя (х,) Рост сидя (хД Ширина носа (х,) Длина носа (хв) 06151 86,41 25,49 51,24 160,53 81,47 23,84 48,62 0,1974 0,2170 0,2910 1,0000 958 17 81,16 21,44 46,72 пнимРР ггнггютьных совокуп!юстин 209 а а1 наблюдение можно с одинаковой вероятностью отнести к наждой из генеральных совокупностей (>7! = >)г — — >?а= 1/3) н 2) множество таких областей, что наибольшая вероятность ошибочной классификации будет минимальной (минимаксное решение).
Сначала мы вычислим коэффициенты Х ((ь! > — !Р) и л (р,!' — р, >). Тогда Х '(р,' > — р>з>) = л, (р,' ' — р,' >)— — (р — р, ). Затем мы вычислим .>т 0> !г> 2 „!») Мы получим дискриминантные функции' ) н „(х) = — 0,0?08х, + 0,4990хг + 0,33?3х, + 0,0887х, + 43,13, и„(х) = 0,0003х, + 0,3550х, + 1,1063хз+ 0,13?5х, + 62,49, ~ (л) иг,(х)= 00?1!х,— О!440х,+07690х,+00488х,+!936, Другие трн функции определяются следующим образом: иг>(х)= — иж(х), из>(х)= — и>з(х) и изг(х) — игз(х) Если известны априорные вероятности и если они равны между собой, то наилучшее множество областей классификации опредслнстся таким образом: г(>: и„(х)) О, и„(х)) О; тсг ! «„(х) > О игз (х) ) О; и тта .
иа, (Х) > О, ищ(Х) ) О. Например, если при измерении некоторого индивидуума мы получили такой реаультат х, что иж(х) ) О н иш (х) ) О, то мы отнесем его к касте браминон. Чтобы найти вероятности ошибочных классификаций, когда индивидуум взят из совокупности и, необходимо знать средние значения, дисперсии и коварнации соответствующих пар и. Они приведены в таблице 7г), ') Вследствие ошибки, допущенной прн вычислениях, днскримннантные функции, полученные Рао, являются нсточнымн. Я благодарю Питера Франка за помощь в вычнстсннн этна функций. ') Некоторые вычислительные ошибки, допущенные Анде рсо но м [4), исправлены в табак;ге 7 н в (3). 210 кллссификлция нльлюдвнии 1гп.
в Таблица 7 Ствнлартное отклонение Коеффипиент коррелвнин Генервльнвв совокупность л Срелиее 1,727 1,491 «и О,8658 2,641 1,727 1,491 «„ — 0,3894 1,436 1,ОЗ! 2,64! 3,487 0,7983 нв 1,436 1,031 тс~ . иш(х) 0,54; и, (х) ° 0,29; )7з . иш (х) )~ — 0,54; лат (х) )~ — 0,25; йз '. из,(х)) — 0,29; и з(х) > 0,25. (3) Полная вероятность ошибочной классификации (с точностью до двух десятичных знаков) равна 0,30.
Таким образом. максимальная вероятность ошибочной классификации уменьшена с 0,42 до 0,30. ЛИТЕРАТУРА 6 62. Берксои [Ц; Берт [Ц; Блекузлл и Гиршнк [Ц; Вальд [3!. 9 63. Бле к узлл н Г яр шик [Ц; В в л ьд [3[; Нейман и Пирсон [Ц; Хоел и Петерсон [Ц. Вероятности ошибочных классификациИ получаются тогда посредством использования таблиц для двумерного нормального распределения. Эти вероятности равны 0,21 для ки 0,42 для га и 0,25 для ттз.
Например, если измерения произведены над брамином, то вероятность классифицировать его как ремесленника или как члена касты корва равна 0,21. убинимаксное решение получается посредством нахождения констант си ся и сз для (3) $ 6.7 так, чтобы вероятности ошибочной классификации были равны между собой. Области классификации определяются следующим образом: здцдчм 21! б 6.4.
Вальд [2). б 65. Андерсон [4]; бар нард [Ц; Б артлетт [6]. [7]! билл [Ц; В альд [2]; Кендалл [4]< К ос сея [Ц; Кохрен и Б л и с с [Ц; К р а м е р [2); С и т г р и в е с [Ц; Ф и ш е р [5), [6], 8]; Хорст и Смит [Ц. 66. блекузлл и Гиршик [Ц; Вальд [3]; Мизес [Ц. < < < < < < ' 6.7. М наес [Ц; К. Пирсон [7).
6.8. Гам ил ь тон [Ц; К. Ра о [6]. о всей главе 6. Андерсон [4]; А митедж 1; Бартлетт [2]; браун [2], [3]; Квенау ила Ц; Лордж 1; Любви [Ц; Мартин [Ц; Махаланобис 2~; Наида 3; Нараин [3]; Пенроуз [Ц; К. Р. Рао [3], 5~, [6], [7], 9, [13], [15), стр. 273 — 350, [16], [17], [18]: К. Р Рво н Слейтер [Ц; С. Рой [15]; К. Смит [Ц; Х. Смит [Ц; Уодлес н Треверс [Ц; Уэлч [Ц; Узрри [Ц. ЗАДАЧИ 1.
(б 65) Найти критерий ($65.!) классификации !г<з как !Нз зе<оаа или !г!з чета<со!ог на основе данных, приведенных в $5.3.3. 2. Пусть и (х) — критерий классификации, определенный формулой (2) 6 6.5.1. Показать, что величина уч для проверки гипотезы Аг(р«>, Х) = Аг(п<тг, Х) пропорциональна п(х<п) и и(х<м). 3. (б 63) Пусть т< распределена Аг(р, Хг), < =1, 2. Найти вид допустимых методов классификации. 4. (й 6.3) Пусть ггг распределена <<<(п«Ц Хг), ! 1, 2 Найти вид допустимых методов классификации. 5.
(б 6.7) Пусть и, распределена <<<(и<'Ц Х), г 1, ..., ш. Показать, что если п<п лежат на одной прямой (т. е. п<п и+ «гй), то для допустимых методов гтг определяются параллельиымн плоскостями. Показать таким образом, что необходимо использовать лишь одну дискриминаитную функцию и)а(х>. 6. (й 6.7) В б 8.8 приведены данные о выборках мз четырех генеральных совокупностей, состояших из черепов. Рассмотрим первые два измерения и первые три выборки. Построить функции классификации иг)(х). Найти метод для 4< Агг/(Агг+<<< +А<). Найти минимаксный метод. 7. ($6.5) Пустьх,<г' Вх<н+с [<=1, 2 а 1, ..., «7<), где В-иевырождеииая матрица и х Вх+с.
Показать, что статистика (2) й 6.5 для классификации является инвариантной относительно таких преобразований. 8. 5 64) Пусть Р(2[1) и Р(1]2) определяются по формулам (14) и (15) б 6.4. Доказать, что если а возрастает, то с можно подобрать так, чтобы, по крайней мере, одна из величии Р(2[1) илн Р(1[2) убывала, а другая ие возрастала. [У к а з а н не. Доказать, дР(1[2)дР(2[ Ц дР(1[2) дР(2[1) что дс да кльгоиеикяиия нлвлюденип 212 Ггп. ь 9. (6 6.4) Пусть х' (х»', х'з' ).
Используя задачу 10 главы 5 и задачу 8 этой главы, доказать, что класс методов, основанных на х, равномерно не хуже класса методов, основанных на х!». 10. (й 6.3) Локазать, что любой полный класс методов включает класс допустимых методов. 11. (й 6.3) Локаэать. что если класс допустимых методов является полным, то ои является минимальным полным классом. 12. (й 6.6) Локазать, что можно провести замкнутую кривую из точки (!У!. !Гэ, 0) с )а!, ат(к) 1~ до точки (д! 0 !Гз' в (аГ, 1, аз(а!)) к так, чтобы в любой точке на кривой было а, = аг 13.
Я 6.5) Рассмотрим !У'хГГ!. Локазать, что отношение (!т хоп — !т х' ') ~ (с)~х!и — д х"!)э+ ~ (!у х,'т' — сГ х'т!)з -! ! максимально при сс 8 '(х! ' — х'з'). 14. (й 6.3) Фундаментальная лемма НеГ!мана — Пирсона утверждает, что при данном уровне значимости из всех критериев для проверки пулевоГ! гипотезы о том, что х есть выборка из р,(х), при конкурирующей гипотезе, состоящей в том, что х есть выборка нз р,(х), наиболее мощный критерий имеет критическую область р, (х)/р! (х) < д. Локазать этот результат, используя рассуждения, приведенные в 6 6.3. 15. (й 6.3) В случае, когда р(х) = л(х! !т, Х), найти наилучший критерий для проверки гипотезы и = О при конкурирующей гипотсэс Гт= П' ПРИ ЭалаиПОМ УРОВПЕ ЗнаЧИМОСтн !.