Налимов В.В. - Теория эксперимента (1062946), страница 19
Текст из файла (страница 19)
Такая ситуация типична не только длл астровома, паблгодак)щего эа поведением Галактик)),-- с ней приходятся иметь дело в лабораторяых и да)ке в производственных исследованиях. В социологии в подавляющем большинстве случаев до сих пор ограпичивжотся пассивным экспер)гментолг. В психологии исследователь предъявляет какие-то тесты испытуемым, регистрируя показатели, ха р» »торнау)ощпе их отклик на эти тесты. Из такого пассивного опыта надосделать вак)почение о психологических факторах, нопосредственно яе поддав)щихся варьировани)о, которые ответственны за поведение человека. В многочисленных лабораторных исследованилх по физике, химии, металлургии и тем более биологии часто приходится иметь дело с экспериментом, органиаованным так, что ничего или почти ничего нельзя иаменпть — остаетсл только яаблюдать за тем, что происходит.
Слиткохг часто с такой ситуацией приходится сталккват),ся при проведониии заводских или полузаводских испытаний. Так называемые пилотные установки, вопреки самому смыслу своего названия, нередко таковы, что ими управл)гть польза. Естественно поставить вопрос; можно ли, пользуясь резул),татами пассивного эксперимента, выделить доминирующие факторы? Интуитивно ясно, что однозначного решения такая задача иметь не может и здесь нужно вводить дополнктельи() рлд сильных предположений. Рассмотрим подробяее логическую модель этой зада )и.
Допустим, что эксперимент заключается в наблюдении за 1г-мерным вектором-строкой независимых перемонных зя мгтодьз, ОснозАннык НА нзучинин Рлюжяння [гл >>! $21 ГлАвнык комнОнянты, 'ьактогны«> АнАлиз Зе х' =" ) т,,„„., х«). Если зксперпмонтатор имеет возможность выполнить Лг яаблюдений над различными аиаченяями вектора-строки х*, то розультаты его исследования продставлл>отея матрицей хы тт! . ь>! ь>з >т ° >ьз ) Х>н Хек ., Х>«Лт ' Бо многих случаях кажется еь.тестиенным предположить, что в изучаемой плохо органиаоваиной системе существует некоторое', количество попосредствоиио ие наблюдаемых, но легко интерпретируемых переменных, ответственных аа поведение вектора х".
Исследователю может понадобиться выразить полученную им при наблюдении информацию через зги непосредственно не набл>одаемые переменные. Можно надеяться, что в некоторых случаях такой способ представления позволит выдвинуть какие-то новые, логко подда>ощиогя осмысливанию гипотезы. В других случалх он позволит хохл бь! понизить размерность того пространства пероменных, в котором представляются результаты наблюдения; тогда подобный приеммоягно будет просто считать одним из методов свертки информации. Дгн! осущоствления такого перехода к новым переменным нужно каким-то образом использовать внутреннюю структуруматрицы Х. Статистические свойства етой матрицы (если вьпюлнлетсл нормальное рагпределенпе) задаются коварланионной матрицей (здесь предполагается, что х-переменные центрировань>), т.
с. Х" Х 1 Л[ — 1 У--1 т'„., Ч >зт Ее диагональные злемепты являются дисперсиями, впедиагопщн ныо — кокариацилмн. Еглк вычислить козариационную матрицу для стандартизированных переменных х! = х>/з (х!), >и ыы получим корреляционную матрицу (щтрих мы здесь опускаем) ф г(хьз з) . ° !'(х>л>'«) ' (хах,) 1 ... г (хть '«) г(х«г>ь «( ь«>2) Здесь по диагонали стоят единицы; недпагональные элементы — обычные парные коэффициенты корреляции. 11ереход к новым переменным моягно выполнить, ориентируясь преимущественно на поведение дисперсий или лоррена>[ий. И первом случае мы будем иметь дело с маподом главных компонент, во втором случае — с р>алтг>ор>>ыл! анализом. Соответственно, и первом случае новые перемепные обычно нааывают главными компонентами, во втором случае — факторами; впрочем, зто различие в терминологии не всегда строго выдерживают.
11 методе главных компонент ') ищут яекг>1>рол>ь[ьь>- ванные нормированные линейные комбинации 2;=-,,"з адхы ), !'-= 1, 2,..., )Н >=! дисперсии которых обладают особым свойством, а именно, расположены в убывающем порядке, т. е. зз(г,) »« » зз(г,) >... зз (г«). Корреляционная (или коварнационная) матрица оказывается р >сщепленной па й Ортогональных компонепт.
Па языке магр>>аной алг>бры мы можем записать зто слсдукьщнм образо!и коэффициентами лыпейнмх комбинаций слуькат компоненты собстеенн зх иекторое коорреляционной матрицы, а дяспорснн глазных ко>шонопт раины собстиепным числам этой матрицы ья(з;) — - Хь ъогорые удоьиютиортот уракпеншо )н — х!) =0 стопани Л относительно Х (1 — единичная матрица). Пскотороиу значошио А; соонеетстььугт собстиеииыи сектор а!. Векторы-столбцы ао удоилетаоряющие расепстеу На. =. А ач ! ' ! ! ') !)тот не!од был предло>кои о>це и >001 г. Пирсонам и позднее ннонь открыт и дотальио разработан Хоттглиигом 110ЗЗ г.). Оп мктоды, ооцоплцныг нА ппуч>гний Рлпскяяия |гл.
>и Э з) гллвнык компопкнты. о>хктогпый лнллиз 91 вычисляются обмчпо с помол,ыо Э ОЫ. Справедливы с>год)попо>а соотяоюопгг>п а;а; .- ( (успокоя нормировки); а.,а == 0 (ортогокааьность преобразования); переход к яовмм >>поря>~патам а матрпчвой форме загпсываогся так: х = Л'х (д — матрица со столбцамп а„а,...., ат); ковариьциовная матрвца хх* оказывается диагональной (ортогоаальпость главных комповемт) с диагональными олемезтамп Хп Геок>етрпчески нахождение главных компонент сводится к переходу к новой ортогональной системе координат: первая координатная ось ищется так, чтобы соотвстствугопп1я ей линейная форма извлекала возможно болыпую диспорсигп, далее ищется ортогональная ей ось, которая делает то же самое с оставшейся дисперсией и т.
д. От новых координат можно вернуться к старым, записав (учитывая ортогональность преобразования) хг= ь„аяэ; (,(=1,2,...,/г >де э> обозначает )цУчо главцУю компонентУ, а ໠— вес /-й компоненты в (-и переменной. Написанное выше выражение — зто основное соотношониг в методе главных компонокт. Оно не содержит остаточной составляющей с„ поскольку все Й главных компонент исчерпывают всю дгпперсию исходных переменных. В методе главных компонент нет необходимости делать какие-либо предположения о х-переменных, но обязательно даже их считать случайными величинами, хотя чаще всего все я:е их рассматривают как выборку из генеральной, нормально распределенноп совокупности (о пормальпости здесь приходится говорить лишь потому, что э>геъ>ентами ковариапионной матрицы служат вторые моменты, которыми задается многомерное пормальпоо распределение).
Основная идея метода главных компонепт вполне легко воспринимается интуитивно. Если мы допустим, что ноиавестпыс нам переменные линейно связаны с иамеряемыми переменными, то на иервын взгляд представляется совершенно естественным предположить, что их легко выделить мотодамн линейной алгебры, если в качестве дискриминиру>ощего критерия взять различно в их дис- персиях. В действительности >ке все оказывается гораадо сложнее.
Главные компоненты не инвариантны относительно ияменеяия масштаба тех шкал, по которым отсчитываются переменные. Эта пеинвариантпость естественно слодует иэ того, что дискриминация производится по величине дисперсий. Нри проводения анализа по методу главных компонент нужно учитывать, что все пап>и измерения, как правило, выра>кают в какой-то произвольно выбранной системе шкал — система СГС в этом отношении не является иск>поченисм. Удобнее всего анализ методом главных компонент проводить в тех, сравнительно редких случаях, когда измерения однородны, т.
е. когда все хпеременныо измереньг в одних и тех же единицах. Некоторые исследователи утверждают, что неприятность с неинвариантностыо преодолевается переходом к стаядартиэированным переменным х, = — (х, — Х~)/э(хг). Квадратичная ошибка служит параметром масштабности функции распределения и на первый вагляд представляется вполне естественным стацдартизировать переменные, деля их яа эту величину. Однако нельзя сколько-нибудь строго обосновать такой прием, производящий все яге произвольное уравнивание величин, несущих разную информацию. Рассмотрим несколько примеров применения метода главных компонент. Г> работе Джефферса [49) приводится интересный прнмор применения метода главных компонент в задаче классификации.
Объоггтоьг исследования служили лстагощие тли. Нужно было разбить этот вид насекомых на подгруппы по варьяруемости пх морфологических признаков. Было измерено 19 различных признаков, которые окавались весьма сильно коррелиропанными между собой; так, коэффициенты парных корреляций по многим прививкам достигали 0,90 — 0,99. Компонентный аналив показал, что можно ограничиться двумя первыми главными компонентами, на которые падает 85,5оо от общей дисперсии.
Первая компонента задается равличием в рааморах насекомых, вторая в значительной степени связана с числом яйцекладок. Графически результаты представлены на рис. 3.3. Здесь ясно видно, что обследованных насекомых можно разбить на четыре хоро>по равличимыэ группы, !!о методы, ОсегозАннык НА иэучк1111и РА!!сеяния [Гл. 111 л з! РИАпнив !ломпонГнты, и Акторпып АпАлиз эз В работе [50[ метод главна!х компонент использован длл пзу !ения качоства епоктрофотометров. Строились кривыс поглощения для бихромата калия пазличной концентрации. Для каждои концентрации измерения производились в 20 точках в интервале длин волн от 230 до 400 Аьик етпм7пуулд, уа 7 + с + г -с -4 — у е о А и И»л.упп < а г + — б -и 1- !'ис.