Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu), страница 10
Описание файла
DJVU-файл из архива "Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 10 - страница
В-четвертых, в эмпирическом подтверждении решения более существенное значение имеет разность мжду числом переменных и числом факторов, а не их отношение. Заметим, что количество ограничений практически одинаково для следующих комбинаций: 1 фактор при 7 переменных (14); 2 в прн 8 (13); 3 —.при 9 переменных (12) и так далее. Однако нет оснований считать разность между числом переменных и числом факторов непосредственной мерой степени эмпирического подтверждения. Альтернативой служит отношение количества ограничений к количеству независимых коэффициентов наблюдаемой матрицы.
Хотя в таблице зти отношения не представлены (знаменатели их приведены в последнем столбце), следует отметить их достаточно высокую информативность. При оценивании степени эмпирического подтверждения факторного решения следует принимать во внимание два осложняющих дело обстоятельства: 1) определенные свойства, присущие генеральной совокупности не обязательно могут проявиться в выборке; 2) даже при использовании генеральной совокупности факторная модель может не совсем точно соответствовать экспериментальным данным. Другими словами, свойства генеральной совокупности должны оцениваться с учетом этих расхождений.
Более того, на практике не представляется возможным отделить действие одного из этих упомянутых обстоятельств от другого. Таким бравом, само по себе выражение (36) не может служить мерой степени эмпирического подтверждения. Решение, на которое накладывается большее число ограничений, обеспечивает более значительную степень подтверждения при заданной степени расхождения между факторным решением и наблюдениями.
Поэтому необходимо научиться оценивать вышеупомянутое расхождение. Степень вмпирнческого подтверждения мли надежность С помощью критерия значимости, применяемого для какого- либо первоначального факторного решения, оценивается возможность приписать расхождение между гипотетической моделью и наблюдениями статистической флуктуации в выборке.
Критерий значимости непосредственно зависит от объема выборки; при достаточно большой выборке любые расхождения между моделью и экспериментальными данными могут стать значимыми. Это следует из того факта, что если модель точно соответствует наблюдениям, то чем больше объем выборки, тем меньше расхождения между выборочными параметрами и параметрами генеральной совокупности. Для очень большой выборки такие расхождения весьма малы.
Применение этого статистического принципа бывает затруднительным, когда исследователь подозревает наличие второстепенных факторов и не имеет возможности определить их природу. Тогда критерий значимости может не подтвердить адекватность модели. Даже если рассматриваемая факторная модель воспроизводит большую долю наблюдаемых ковариаций и привносит определенный порядок в структуру наблюдений, критерий значимости может показать, что модель статистически неадекватна экспериментальным данным.
Поэтому необходима мера адекват- ности, которая концептуально независима от статистической значимости. Итак, необходимо определить меру расхождения между наблюдаемой корреляционной матрицей и воспроизведенной матрицей. Один из возможных подходов описан Харманом.
Ои предлагает использовать среднее значение квадрата отклонения, при котором квадраты отклонений корреляций, полученных для окончательного факторного решения, от наблюдаемых корреляций суммируются и делятся на число этих коэффициентов: л ~Г,ч,(гм — г*;) з/(п(п-1)1, !М! !де суммирование распространяется на все недиагональные элементы (Наппап, 197б). Однако для этой величины не ясен выбор порогового значения. Другая альтернатива, предложенная Такером и Левисом (Тцсйег, (.етч!з, 1973), рассматривает коэффициент надежности для факторного решения методом максимального правдоподобия. Этот подход основан на использовании частных коэффициентов корреляции, при~ем вводится нормировка на число степеней свободы с тем, чтобы учесть возможные расхождения между фактор- ными решениями.
Кроме того, в коэффициенте надежности происходит сопоставление соответствующих статистик со случаем отсутствия влияния факторов. Формула для коэффициента надежности М.-А4. гйо = (37) Л4,— 1 где М,— математическое ожидание статистики х' в отсутствии влияния факторов, деленное на !/з л (л — 1), а Мь — математическое ожидание Хз для окончательного факторного решения„деленное на (!/з) !(л — г)з — (л+г)] (ЗогЬот,,!бгезйод, 197б). Коэффициент гйо принимает значения от О до !, причем О означает наихудшее согласие модели и данных, а! — наилучшее.
На практике чаще применяется приближенное значение гйо, асимптотически эквивалентное (37) при возрастании объема выборки: Е,— ! гйо=1 — — ' Еу — ! где Е = ХЕ( м )'/(/4 ' Ез=ч„'~ (г9)з/'(1/2л(л — 1)1; !Ф! гон †частн коэффициенты корреляции без влияния факторов/ !(гх — число степеней свободы, равное !/з ((п — г)' — (и+г)1, в разведочном факторного анализе. В конфирматорном анализе число степеней свободы несколько больше. Отметим, что частные коэф- 45 фнциенты корреляции есть не что иное, как расхождения между воспроизведенными и наблюдаемыми корреляциями, представленные в стандартной форме. ДРУГАЯ КОНЦЕПЦИЯ ЭМПИРИЧЕСКОГО ПОДТВЕРЖДЕНИЯ: ВЫБОРОЧНАЯ АДЕКВАТНОСТЬ При использовании традиционных статистических критериев предполагается, что есть выборка объектов.
Однако на практике в определенной мере имеет место и психометрическая выборка— анализируемые переменные почти всегда являются выбранными из некоторой совокупности. Возникает вопрос об адекватности рассматриваемой факторной модели по отношению к данному набору переменных. Напомним, что психометрический подход используется в анализе образов и альфа-векторном анализе, но предмет обсуждения относится и к любому другому методу факторного анализа. При прочих равных условиях степень эмпирического подтверждения увеличивается, если: 1) возрастает число переменных; 2) уменьшается число общих факторов; 3) уменьшаются частные коэффициенты корреляции либо 4) увеличивается коэффициент детерминации. Первые два условия гарантируют увеличение эмпирических ограничений, накладываемых факториой моделью иа экспериментальные данные, Третье — относится к измерению близости наблюдаемых и воспроизводимых коэффициентов корреляции.
Четвертое условие состоит в том, чтобы увеличивалась доля общности в дисперсии каждой наблюдаемой переменной. Последнее непосредственно относится к выборочной адекватности, так как коэффициент детерминации возрастает при увеличении числа переменных и при уменьшении среднего значения коэффициентов корреляции. Эмпирический критерий выборочной адекватности был предложен Кайзером (Ка!зег, 1970, 1974). Ои назвал этот критерий «мерой выборочной адекватности» (МВА): ВВ Ол МВА = (38) ХХ ~и+ ХХ л д 1Ф» ~Ф» где гп — наблюдаемые коэффициенты корреляции, а дм — элементы корреляционной матрицы антиобразов, которая задается выражением а=Вы-1В причем 17-' — обратная корреляционная матрица, а 5= (д!ад)7-')'ь.
МВА изменяется от 0 до 1. Данный критерий принимает значение 1 тогда и только тогда, когда все недиагональные элементы матрицы, обратной в корреляционной матрице Я,— нулевые. Это в свою очередь означает, что каждая переменная может быть выражена 46 без ошибок через остальные переменные. Пороговые значения для МВА по Кайзеру (Ка(зег, 1974) следующие: свыше 0,9 — отлично » 0,8 — хорошо » 0,7 — средне » 0,6 — посредственно » 0,5 — плохо ниже 0,5 — неприемлемо Кайзер, экспериментируя с модельными данными, показал, что величина МВА увеличивается при: 1) возрастании числа переменных; 2) уменьшении числа общих факторов; 3) увеличении объема статистики и 4) увеличении среднего значения коэффициентов корреляций (Ка(зег, 1970).
Еще раз отметим, что степень эмпирического подтверждения факторной модели с помощью экспериментальных данных варьируется в зависимости от обстоятельств. Исследователь должен знать условия, при которых информативность факторного анализа повышается, Начинающий пользователь факторных методов при исследовании адекватности может положиться на такую эмпирическую меру, как МВА, Разумеется, окончательное решение должно приниматься на основе теоретически обоснованных выводов. КОНФИРМАТОРИЫИ ФАКТОРНЫИ АНАЛИЗ При использовании конфирматорного факторного анализа всегда должна выдвигаться гипотеза о числе общих факторов.
Она должна быть основана на понимании природы рассматриваемых переменных и на информации о том, какой фактор имеет нагрузку и от каких переменных, если мы не хотим гадать на кофейной гуще. Разнообразие по форме этих факторных гипотез неограничено. Конфирматорный анализ можно разделить на два вида: одно- групповой, который имеет дело с одной генеральной совокупностью, и миогогрупповой, работающий с двумя и более генеральными совокупностями.
Начнем обсуждение с первого случая. Одна группа или генеральная совокупность Применяя конфирматорный факторный анализ для заданной ковариационной матрицы, необходимо иметь гипотезу о соответствующей факторной структуре. Затем проводится оценивание, насколько «значимо» наблюдаемые данные отличаются от гипотетической структуры. В некоторых случаях гипотеза может включать следующую информацию: а) число общих факторов; б) природу зависимости между факторами (ортогональные или косоугольные) и в) величину факторных нагрузок для каждой переменной.
В других случаях гипотеза касается только числа общих факторов. Разумеется, существует множество гипотез, занимающих среднее положение между этими двумя крайностями. Поскольку простейшая форма конфирматорного факторного анализа (когда фиксируется только число общих факторов) мало отличается от разведочного анализа, потребуются лишь небольшие комментарии, Для этого вида гипотез неважно, будет ли использоваться ортогональная или косоугольная факторная модель, и годится ли любой критерий значимости или какой-либо другой критерий типа коэффициента надежности для оценивания адекватности первоначального факторного решения, Единственное отличие, о котором можно упомянуть, заключается в том, что в конфирматорном анализе число факторов выбирается исходя из априорных соображений (в разведочном берется произвольное число факторов) и если первый выбор оказался неудачным, оно изменяется.