Боровиков В.П. - Нейронные сети (778916), страница 2
Текст из файла (страница 2)
4). г сто ы ы ивнннытаиа Рве. 4. Мастер решений — вкладка Быстрый Шаг 5. Выберем тип сетей, предлагаемые программой, с которыми будем работать: линейная сеть, вероятностная сеть, сеть, основанная на радиальных базисных функциях, многослойный персептрон. Можно выбрать любой тип сетей или комбинацию (рис. 5). Рвс. 5. Мастер решений — вкладка Тин сети Шаг 6. Зададим формат представления итоговых результатов (рис.
6). Рвс. б. Мастер решений — вкладка Обрагнннл связь Введение Шаг 7. Запускаем процедуру обучения нейронных сетей, нажав кнопку ОК (рис. 7). 4»нг» ° ффффф «»»»«» ~ 0»«» Рис. 7. Отображевпе пропесса обучешга Шаг 8. В окне результатов можно проанализировать полученные решения.
Программа отберет лучшие сети и покажет качество решения ~рис. 8). е «»«~е ~лаю ~»е«1а»» »»»» «»»«и « «з»,р Рис. 8. Окпо результатов — вкладка Быслгрый Шаг 9. Выбираем определенную сеть (рис. 9), Рис. 9. Диалоговое окко выбора моделеК Неброняые сети ЯТАТВТ!СА Неига! Не!ггогхз Шаг 10. Одним из способов проверки является сравнение наблюдаемых значений и предсказанных результатов. Сравнение наблюдаемыхи предсказанных значенийдля выбранной сети представлено на рис. 10. Рис. 10.
Таблица наблюдаелиях и иредсказанных значений Шаг 11. Сохраняем лучшие сети с целью дальнейшего использования, например, для автоматического построения прогнозов (рис. 11 и 12). Рггс 11. Стартовая панель — выбор и сохранение сетейгаисамблсв 10 Ваеденце Юовамр Рас. 12. Стаааартаое оюю сохранения файла сета Ильенко таков типичный сценнрий исследования в пакете Нейронные сети БТАТБТ1СА. Более систематическое изложение содержится в остальных главах книги. Гпава 1 ОСНОВНЫЕ ПОНЯТИЯ АНАПИЗА САННЫХ Древние греки научили нас анализировать, измерять, вычислять, т.с. развили у нас численный взгляд на окружаюший мир.
Аристотель заметил, что все в мире происходит либо детерминировано, либо случайно. Классическая математика изучает законы детерминированного мира, теория вероятностей— мира случайного. Мы начнем с самых простьи и важных понятий анализа данных. Что такое переменная? Переменная (англнйский термин ~алаЫе происходит от корня ~иг) — это то, что изменяется, варьирует, иными словами, не является постоянным, имеет способность изменяться.
Например, измеряя давление или содержание лейкоцитов в крови, получают различные значения у разных пациентов, измеряя уровень осадюв — различные значения в разные дни недели, а также различныс значения в одни и те же днн в разных точках географичесюй карты. Изменяя температуру и давление в установкс по сушке газа, мы получаем различные характеристики продукта на выходе, измеряя диаметры подшипников или поршневых колец— различные значения в разных партиях, даже если производственный процесс тшательно отлажен и контролируется. Если вы занимаетесь банювским бизнесом и выдаете кредиты клиентам, то замечаете, что сюринг клиента (выставляемый балл) или вероятность возврата кредита изменяется в зависимости от поведения клиентов и экономических факторов.
Аналогично, число покупателей супермаркета, объемы продаж, прибыль фирмы, количество посетителей сайтов все время изменяется. Гпава 1. Основные поннпап анапнза данных Простейшие описательные статисгпики Так как значения переменных не постоянны, а меняются, нужно научиться описывать их устойчивые характеристики и изменчивость. Для этого придуманы описательные или дескриитивные статистики: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, юартили, мода и т.д.
Идея описательных статистик очень проста: вместо того, чтобы рассматривать все значения переменной, а их может быть очень много (сотпи тысяч), стоит просмотреть описательные статистики. По существу, мы хотим выделить постоянную и изменяющуюся часть переменной. Опиешпеяьные енттиетики дают общее представление о значениях, которые принимает перемениня. Минимум и максимум — это минимальное и максимальное значсния переменной.
Среднее — сумма значений переменной, деленная на и (число значений переменной). Дисперсия или вариация (от англ. оапаисе) и стандартное отклонение (от англ. егапеГапГ йелагюи) — наиболее часто используемые меры изменчивости переменной. Дисперсия меняется от нуля до бесконечности. Крайнее значение О означает отсутствие изменчивости — значения переменной постоянны. Стандартное отклонение вычисляется как корень квадратный пз дисперсии. Чем выше дисперсия или стандартное отклонснне, тем сильнее разбросапы значения переменной относительно среднего, Стандартное отклонение— более удобная характеристика, чем вариация, так как измерена в тех же единицах, что исходная величина.
Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина — выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится центр распределения. В некоторых случаях, например, при описании доходов населения, медиана более удобна, чем среднее. Квартили представляют собой значения, которые делят половины выборки, разбитые медианой, еще раз пополам. Итак, медиана и квартили делят диапазон значений переменной на четверти. Различают верхнюю квартиль, которая больше медианы и делит пополам верхнюю часть выборки (значения переменной больше медианы), и нижнюю квартиль, которая меньше медианы и делит пополам нижнюю часть выборки.
Нижнюю квартиль часто обозначают символом 25ь~ч. Это означает, что 25ч/ч значений переменной меньше нижней квартили. 13 Нейронные села. ЗТАТ1ЗТ!СА йеиа1 Ме1аоацв Верхнюю квартиль часто обозначают символом 75% и зто означает, что 75% значений переменной меньше верхней квартили. Зти статистики легко вычислить в БТАТБТ1СА. Представим, что имеется следующий файл данных, который используют при выдаче кредита.
В строках записаны имена людей, взявших кредит, в столбцах — характеристики, взятые из анкет. Фрагмент файла показан на рис. 1.1. В первом столбце записан пол, во втором — образование, в третьем — доход. Выделим, например, переменную доход, щелкнем правой кнопкой мьппи— БТАТ1БТ1СА предложит выбрать описательные статистики. Заметьте, эти результаты подсчитаны для всех заемщиков, если мы проведем группировку по полу, то получим разные значения описательных статистик для мужчин и женшин.
Эти результаты легко визуализировать и построить следующие гистограммы (рис. 1.2 и 1.3). Рнс. 1.1 Сццдцц- Сд дпц Вцдицц сц цц цц Образование Рнс. 1.2 Рнс. 1.3 14 22 Ю пол: н. $16 ИЛ пол: ж. ф 14 й 12 10 о 8 б 6 э. 4 2 о -200 200 600 1000 1400 1800 2200 Доход 40 35 х 30 о 25 цнз 20 о 15 б 1о 5 0 Гпввв 1. Основные понапуоа внвпозв данных На рис. 1.4 показаны ящики-усы: в центре располо!кена медиана, верхний ус соответствует максимальному значению, нижн!п1 — миппууальному. Верхняя и нижняя стороны отвечают квартилупкь Мода представляет собой максиыапьно часто встречающееся значение переменной (иными словами, наиболее «модное» значение), например, популярная передача на телевидении, наиболее модный цвет нли фасон платья (фасон платья, который предпочитает большинство), марка автомобиля и т.д.
2000 !600 и 1200 о сд 800 400 0 Мужской Жеиский Пол Рве. !.4 ! - медиана; 2 — 25 — 75%; 3 — максимум и минимум соответственно Свойства описатепьных статистик Введем формальные определения описательных статистик. Среднее. Пусть имеется переменная Х, тогда оценка среднего или выборочное среднее вычисляется как среднее арифметическое наблюдаемых значений. Выборочное среднее обычно обозначается: Х и читается «Хс чертой». Формачьно имеем: Х =-'~их! н ы! Заметьте, выборочное среднее является той точкой, сумма отклонений набшодений от которой равна О.
Формачьно это записывается следующим образом: ,'Г(Х-Ху)ыО. Упражнение. Используя определение среднего, убедитесь, что данное свойство действительно имеет место, т.е, сумма откпонепнй наблуодаемых значений от среднего ари!1уметичсского действительно равна О, 15 Выборочное срсднес — это единственная точка, которая обладает данным свойством, что вьшеляст се среди всех других. Кроме того, выборочное среднее обладает замечательным свойством: сумма квадратов расстояний между наблюдаемыми значениями и их средш!м арифметическим является минимальным.
Если вместо среднего арифметического взять любую другую величину, то сумма квадратов расстояний между набшодаемыкш значениями и этой величиной будет только больше, но никак не меньше. Неаронеые се»>и. ЗТАТ>ЗТ>СА и»ига> Не>егог>ге Дисперсия. Выборочная дисперсия переменной Х (термин впервые введен Фишером в 1918) вычисляется по формуле 2 ч~'(Х Х)2 п — 1,, Обратите внимание на коэффициент в данной формуле (л — 1), такая оценка дисперсии является ггес веще>гной (математическое ожидание несмещенной оценки равно в точности значеншо оцениваемого параметра).















