Боровиков В.П. - Нейронные сети (778916), страница 56
Текст из файла (страница 56)
Так как в модель еще не введено ни одной переменной, частная лямбда Уилкса равна лямбда Уилкса. Р-включить и Р-значение. Взглянув на таблицу, можно увидеть, что наибольшие значения величины Р-включить дает переменная Рега!!вп (третья строка). Переменная с максимальным значением Р статистики будет включена в модель на первом шаге.
РезупыпаГпы на шаге 2 Нажмем кнопку Далее для перехода к следующему шагу. На шаге 1 в модель включается переменная Рета!!еп. Пропустим зто окно. Рис. 10.17. Результаты аиализа иа шаге 2 309 неаронные севе. ятАт!зт!СА неьзе! несвойе Диалоговое окно Результапгы дискримиласгтпого анализа на шаге 2 приведено на рис. 10. 17. Видно, что на шаге 2 в модель включена переменная Яера1вЫ. Дискриминация между ирисами значима (статистика Уилкса лямбда = =,037; Г= 307 1, р < 0 0001). Посмотрим теперь на вклады каждой переменной в модели в предсказание.
Переменные в модели. При нажатии на кнопку Переменные в модели появится таблица результатов для текущих переменных в модели (рис. 10.18). Как видно, обе переменные высоко значимы. Рис. 10.18 Переменные вие модели. Нажмите на кнопку Переменные вне модели, чтобы получить таблицу со статистиками для переменных вне модели (рис.
10.19). Рис. 10.19 Мы видим, что обе переменные, которые находятся вне модели, имеют значение Г-вклезчить больше, чем значение, указанное в стартовом окне (это значение равно 1, см. рис. 10.14). Следовательно, пошаговая процедура будет продолжаться, и следующая переменная, которая будет вводиться в модель,— переменная РегаЬчЫ.
Резупыпапзы на шаге 4 (поспецнцй шаг) Снова нажмите на кнопкуДалее в диалоговом окне Результаты дискриминантного анализа для перехода к следующему шагу анализа. Шаг 3 не будет рассматриваться, так что нажимаем снова на кнопку Далее, чтобы перейти к заключительному этапу анализа. Нажмем на кнопку Переменные в модели (рис. 10. 20). 310 Гпавв 10.
Кпвсссчвсксв мвпюяы, впыпврнвюсвныв нейронным свювм Рис. 10.20. Результаты заключительного этапа апвпиэа Частичная статистика Уилкса лямбда показывает, что переменная Регайеп дает вклад больше всех, переменная Рета1иуа — вторая по значению, переменная Вера!ита — третья, и переменная Юерайеп вносит в общую дискриминацию наименьший вклад (рис. 10. 21). Рис. 10.21 Можно закпючить, что размеры лепестков явлпотся главными переменными, которые позволяют проводить дискриминацию. Для получения дальнейших результатов следует провести канонический анализ.
Стартовую панель Канонического анализа можно вызвать соответствующей кнопкой во вкладке Дополнительно диалогового окна Результаты дискрилинангпного анализа. Канонический анализ. Чтобы увидеть, как четыре переменные разделяют цветы, вычислим дискриминантную функцию. Для этого нажмем кнопку Канонический анализ и, для выполнения канонического анализа, откроем диалоговое окно Канонический анализ (рис.
10.22). Как обсуждается в разделе Вводный обзор, программа вычислит независимые (ортогональные) дискриминирующие функции. Каждая последующая дискриминантная функция будет вносить все меньший вклад в дискриминацию, чем предыдущая. Максимальное число оцениваемых функций или равно числу переме1шых или числу совокупностей минус один, в зависимости от того, какое число меньше. 311 Нейронные сети. ЗТАТ18Т1СА Непга1 Не1пег1гв Бюгчыг)аеюлнмгвйье) гчп мсюезвиення1 1Й1 1Я ] Ю~ 1 Рис. 10,22. Канопическнв анализ В нашем случае имеется две дискриминирующих функции. Значимость корнеИ. Определим, являются ли обе дискриминантные функции статистически значимыми или нет. Для чего нажмем кнопку Критерий Хи-квадрат последовательных корней.
Появится таблица (рис. 10.23). Рве. 10.23 В данном примере обе дискриминантные функции статистически значимы (см. правый столбец р-уровней). Коэффициенты дискриминанзной функции. Нажать кнопку Коэффициенты для канонических переменных в диалоговом окне Канонический анализ. В результате будуг построены две таблицы: одна для Исходных казффиг4иенпгов и другая для Стандартизованных коэффициентов.
Взглянем на Исходные коэффиг4иенты (рис. 10.24). Рыс. 10.24. Дискрымыпаппгые фупкпыв 312 Гпаеа 10, Кпассенескне метовы, апыпернатсеные нейронным сетям Термин «исходные» означает, что коэффициенты могут быть использованы непосрсдственно для вычисления весов дискриминантной функции по исходным данным. Рас. 10.25.
Стандартизованные коэффициенты Стандартизованные коэффициенты обычно используются для интерпретации, так как они относятся к нормированным переменным (рис. 10.25). В таблице приведены такие собственные значения (корни) для каждой дискриминантной функции и кумулятивная доля объясненной дисперсии. Как видите, первая функция объясняет 99% дисперсии. Коэффициенты факторией структуры. Эти коэффициенты могут быть выведены с помощью кнопки Факторнав структура на вкладке Дополнительно диалогового окна Канонический анализ. Они представляют корреляцию между переменными дискриминирующей функцией и в общем случае используются для интерпретации «значимости» дискриминирующей функции.
В практических исследованиях часто необходимо дать функциям осмысленную интерпретацию. В этих случаях интерпретация факторов должна быть основана на коэффициентах факторной структуры (рис. 10.26). Рас. 10.26 Средние канонических переменных, Теперь мы знаем, какие переменные участвуют в дискриминации типов ирисов. Следующая задача заключается в том, чтобы определить природу дискриминации для каждого канонического корня (рис. 10.27). 313 Нейронные сеген. 8ТАТ!ЗтгСА денга! Не!во!Ко В качестве первого шага взглянем на канонические средние.
Нажмем на кнопку Средггие канонических переменных на вкладке Дополнительно диалогового окна Канонический анализ, после чего на экранс появится рис. 10.27. Рвс. 10.27. Рааяелевяе цветков врцса Посмотрите внимательно на этот график: по осям отложены канонические переменные. Цветки Бе1оюа изображены кружками, 1гегз1со1- квадратами, И'гятгс — ромбами. Первая дискриминангная функция (корень 1) отделяет главным образом сорт ЮеГоаи от других сортов ирисов.
Каноническое среднее сорта Яегоза очень сильно отличается от канонических срсдних других сортов и расположено в правой части графика. Вторая дискриминантная функция (корень 2) предназначена для разделения главным образом сорта 1гегз1со! и других сортов, однако, основываясь на рассмотренных ранее собственных значениях, качество дискриминации теперь намного меньше.
Для подведения итогов заметим, что наиболес значимая и ясная дискриминация возможна для цветов сорта рогоза с использованием первой дискриминантной функции. Эта функция имеет отрицательные коэффициенты для ширины н длины лепестков и положительные — для ширины и длины листьев чашечек. Таким образом, чем шире и длиннее лепестки и короче и уже листья чашечек, становится менее вероятно, что это цветки сорта ириса Юе1оза (на диаграмме рассеяния для канонических функций цветки сорта Юе(ока представлены справа, т.е. они различались по высоким значениям этой функции). 314 Гяава 10.
Кпасссческсе мепюды, апьтернатсвныа яаарснным сетям КПАССИФИКАЫИЯ Посмотрим качество классификации. Взглянем вначале на функции классификации. Функции кпассификации Функции классификации вычисляются для каждой совокупности и могут непосредственно применяться для классификации обьсктов. Наблюдение следует относить к той совокупности, для которой вычислен наибольший классификационный вес. Нажмите кнопку Функции классификации во вкладке Классификация диалогового окна Результаты анализа дискриминантных функций (рис.
10.28). Ряс. 10.28 Можно использовать эти функции для того, чтобы опрсделнть преобразования для трех новых псременных. Когда введено новое наблюдение, программа автоматически вычислит классификационный вес для каждой совокупности. Априорные веронпзноспы Для каждой совокупности можно задать различные априорные вероятности (выбрать команду Заданные пользователем в поле Априорные вероятности классификации на вкладке Классификация диалогового окна Результаты анализа дискриминаптных функций). Это вероятности того, что наблюдение принадлежит соответствующей совокупности без использования какой-либо информации о значениях переменных в модели.
Например, вы можетс знать априори, что в мире имеется болыпс цвстков сорта Регясо!, и поэтому априорные вероятности для цветка будут принадлежать к этой совокупности выше, чем принадлежат к одной из других совокупностей. Априорные вероятности могут существенно повысить точность классификации. 315 Неароиные сепо. ЗТАТШТ!СА Неиге! Неьноже Матрица кпассификации Нажмите теперь на кнопку Матрица классификации, В результирующей таблице результатов (рис. 10.29) вторая линия в заголовке каждой колонки приводит априорные вероятности классификации.
Рас. 10.29 Так как имеется ровно 50 цветков каждого сорта, и вы выбираете эти вероятности пропорционально обьемам выборок, априорные вероятности для каждой совокупности составляют 1/3. В первом столбце таблицы — процент наблюдений, которые были правильно классифицированы для каждой совокупности полученными функциями классификации. Оставшиеся столбцы дают число случаев правильной и неправильной классификации для каждой совокупности.















