Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 33
Текст из файла (страница 33)
6.4.6. Функционалы качества и необходимые условия оптимальност» разбиения. Естественно попытаться проследить, в какой мере выбор того или иного вида функционала качества определяет класс разбиений, в котором следует искать оптимальное. Приведем здесь некоторые результаты, устанавливающие такого рода соответствие. Будем предполагать используемую метрику евклидовой. Обозначим через е = (е„..., ед) группу из л Р-мерных векторов е, (1 = 1, ., А), а через 5 (е) =- (5, (е), ..., 5д (е))— так называемое минимальное дистанционное Разбиение, порождаемое точками е =- (е„...„ед), а именно' 5,(е) =(Х: д(Х, е,) < И(Х, ег), 1=2, ...„й); 5,(е) =5,(е)()(Х:И(Х, вэ)(И(Х, вД, )чь2) 5д (е) = 5, (е) П ...
() 5д, (е) П (Х: б(Х, ед) ч; < а(Х, е), У~ й). (Здесь и в дальнейшем 5, означает дополнение множества 5; до всего пространства Пр(Х), т. е. совокупность всех наблюдений(элементов пространства Пр(Х), не входящих в состав 5,.) Таким образом, класс 5, (е) состоит из тех точек пространства Пр (Х), которые ближе к еь чем ко всем ос- тальным е, (!' -эд1).
Если для некоторых точек из ПР(Х) самыми близкими являются сразу несколько векторов ег (1 = — 1, ..., л), то эти точки относим к классу с минималь- ным индексом. Разбиение 5 =- (5,, ..., 5д) называется несмещенным, если это разбиение с точностью до множеств меры нуль совпадает с минимальным дистанционным разбиением,.
нов ! д рождаемым векторами средних Х~ — — — ) ХР (дХ), где Рд =- — Р), = ~ Р(бХ). э! Утверждение 1 (для функционалов типа (см. (6.11))). Минимальное значение функционала 11, (5) =- — р' (Х, Х,) Р (дХ) достигается олько на несме! л~ шенных разбиениях. Это означает, что оптимальное разбие- ние обязательно должно быть несмещенным [1661. Следующий результат относится к довольно широкому классу функционалов качества разбиения совокупности на два класса. Разбиение на два класса может быть задано с помощью так называемой разделяющей функции. А именно точки пространства Пг(Х), на которых разделяющая функция принимает неотрицательное значение, относятся к одному классу, а остальные — к другому. Поэтому поиск класса оптимальных разбиений в этом случае эквивалентен поиску класса оптимальных разделяющих функций. Для иллюстрации дальнейшего изложения будем рассматривать вероятностную модификацию функционала Я ' (см.
(5.14)). Пусть расстояние 4 (Х, У) задается с помощью соотношения (5.3) потенциальной функцией аида К(Х, У) =- ч' Л~ р, (Х) р (У), 8-1 где ~р~ (Х) (1 = 1, ..., Ф) — некоторая система функций на и (х). Функционал 9; через потенциальную функцию К (Х,У) выражается следующим образом: Ят(5) =2 ~ К(Х, Х) Р(ЙХ) — 2 — ~ ~К(Х, У) х Р, вя ~х~ з, 8, хР(дХ) Р(дУ) — 2 — ( ~ К(Х, У) Р(бХ) Р(дУ). Р, а зе Поскольку в правой части этого равенства первый интеграл не зависит от разбиения, то минимум функционала Яз' (5) достигается на тех разбиениях, на которых функционал О,Р) = — ~К(Х, У)Р(бх) Р(бУ)+ и, а, я, + — '~ ~К(Х, У) (бх)Р(бУ) зв за достигает максимума.
Введем в рассмотрение сирямляющее пространство П"(2), координаты г<'> векторов Я ~ П" (2) которого определяются соотношениями г<п = Л, ~р, (Х) (1 = 1, ..., У). В спрямляющем пространстве П~ (2) вероятностной мерой Р, заданной в исходном пространстве ИЯ (Х), индуцируется 167 своя вероятностная мера Р~~>.
Однако в целях упрощения обозначений будем опускать верхний индекс Я у этой новой меры Функционал я (5) в спрямляющем пространстве примет вид гР (Я) = — [ [ 2 Р 2222 ) + — [ 1 2 Р 22 22 ~ [з, Пусть М)~2 ~ ЯР Р (212) (т =О, 1, ..., г; Е = 1, 2). Здесь 2*2 = [ (Е, Я))г — числа, Ляг~2 = [(Я, Е)[2 Š— векторы. В работе [32[ формулируется утверждение, устанавливающее класс функций в спрямляющем пространстве Пм(Е), среди которых следует искать разделяющую функцию, доставляющую экстремум функционалу качества разбиения. Показано, что если функционал качества 212 является диффереицируемой функцией от М;. (т = 1, ..., г), а вероятностное распределение Рз сосредоточено на ограниченном множестве и обладает непрерывной плотностью, то в случае достижения функционалом Ф своего экстремума на некоторой разделяющей функции, этот же экстремум достигается на разделяющей функции, являющейся полиномом г-й степени вида: где дФ дФ С22 = ° дМ[Ю дМ1РР а (с„Я") означает при четном т произведение чисел с„и Я", а при нечетном ч — скалярное произведение векторов с„ и Л' У т в е р ж д е н и е 2 (для функционалов типа Щ (5) и разбиений на два класса).
Для функционала К утверждение 1 означает, что класс разделяющих функций, среди которых надо искать наилучшее в спрямляющем пространстве разбиение, имеет вид где дй; да; УМ, М,, дМ» дМ 'т Р, Р»,) (5.22) д(1; да (и У (М,У М М)~(! ! 2) Класс разделяющих функций в спрямляющем пространстве очевидным образом определяет класс разделяющих функций в исходном пространстве П» (Х). Если К (Х, У) (Х, У) является скалярным произведением векторов Х и 1', то спрямляющее пространство Пэ(Л) совпадает с исходным пространством П» (Х), а метрика, задаваемая потенциальной функцией К (Х, г'), совпадает с обычной евклидовой метрикой. Ф1нкционалы Я» и Я», рассматриваемые относительно этой метрики, совпадают с точностью до константы.
В этом случае, как нетрудно видеть, разбиение, задаваемое разделяющей функцией ! (Л), является несмещенным разбиением. 5.4.6. Функционалы качества разбиения как результат применения метода максимального правдоподобия к задаче статистического оценивания неизвестных параметров. Приведем пример, иллюстрирующий возможность обоснования выбора общего вида функционала качества разбиения на классы в ситуациях, в которых исследователю удается описать механизм генерирования анализируемых данных одной из классически: моделей.
Пусть априорные сведения позволяют определить ~'-й однородный класс (кластер) как нормальную генеральную совокупность наблюдений с вектором средних а; и ковариационной матрицей ль При этом а, и л„вообще говоря, неизвестны. Известно лишь, что каждое из наблюдений Х„ 'Х„..., Х„извлекается из одной из й нормальных генеральнйх совокупностей йГ (ап Х,) (( !,2, ..., й). Задача исследователя — определить, какие и, из и исходных наблюдений извлечены из класса т' (ам Х,), какие и, наблюдений извлечены из класса Л' (а,, Х,) и т. д. Очевидно, числа л„п„..., л„, вообще говоря, также неизвестны. Если ввести в рассмотрение вспомогательный вектор «параметр разбиения» у — (у„у„..., у„), в котором компонента определяет номер класса, к которому относится наблюдение Хь т.
е, у, = 1, если Х, Р Лг (аь Х,) (! =- 1,2, и), то задачу разбиения на классы можно формулировать как задачу оценивания неизвестных параметров у„у.„..., у„при «мешающих» неизвестных параметрах а~ и Х, — 1,2,..., й). Обозначив весь набор неизвестных параметров с помощью О, т. е. 0 — — (у; а„..., аь', Хо ..., Хд), н пользуясь известной ПО) техникой, получаем логарифмическую функцию правдоподобия для наблюдений Х„ Х„ Хя » ~м- — — ' т [ т ~х, -ьг зг~х,— м ~ я х, я т,<т> + и ( т ) 1 о а ! ~ ! (5.23) Как известно, оценка О параметра О по методу максимального правдоподобия находится из условия 1(0) =- тпах 1(0).
Поэтому естественно было бы попытаться найти такое значение «параметра разбиения» у, а также такие векторы средних а~ н коварнацнонные матрицы уь при которых величина — 21 (0) достигла бы своего абсолютного минимума'. При известном разбиении у оценками максимального правдоподобия для а, будут «центры тяжести» классов Х~т~ (1) == — ~ Х; (1-= 1, 2, ..., Й). л~ х, е з, Подставляя их в (5,23) вместо а, н воспользовавшись оче- видными тождественными преобразованиями, приходим к эквивалентности задачи поиска минимума функции — — 21(0), определенной соотношением (5.23), и задачи поиска мини- мума выражения (Х, — Х<т'(111':й ' (Х,— Х'т'(1)) + 1он1Х, 11, г= ~1х,ез, (5.24) илн, что то же, выражения 18р(пг Ф~?" Р')+п~11ой~ лч1].
г=! В последнем выражении %, — выборочная ковариацнонная матрица, вычисленная по наблюдениям, входящим в состав 1-го класса (см. (5.13)). ' Оговоримся сразу. что дзжефзкт солоятельнос~н полученных нрн атом оненок 0 ос~ае1ся нод сомненнеч. поскольку размерность неизвестного векторного нар»метра В нревосяоднт в данном случае обгнее число наблвзденнй, которнмн расволагаем. 170 Анализ выражений (5.24) и (5.25) в некоторых частных случаттх немедленно приводит к следующим интересным вы- водам: если ковариационные матрицы исследуемых генеральных совокупностей равны между собой и известны, то задача оценивании неизвестного параметра 0 по методу макси- мального правдоподобия равносильна задаче разбиения наблюдений Х, на классы, подчиненной функционалу каче- ства разбиении вида т',т, (Я), в котором под расстоянием т( подразумеваетси расстояние Макаланобиса; если ковариационные матрицы исследуемых гене- ральных совокупностей равны между собой, но неизвестны, то, подставляя в (5.25) вместо з.т -= з.