Боровиков В.П. - SNN Нейронные сети (778914), страница 2
Текст из файла (страница 2)
Начинаем со стартовой панели (рис. 1).Рис. 1. Стартовая панель нейронных сетейВ данной панели можно выбрать различные виды анализа, которыенеобходимо выполнить: регрессию, классификацию, прогнозирование временныхрядов, кластерный анализ. Выберите, например, временные ряды, если хотитепостроить прогноз.
Далее следует выбрать инструмент решения в разделеИнструмент. Для начинающих пользователей рекомендуется выбрать Мастеррешений, для опытного пользователя использовать Конструктор сетей. Мывыберем Мастер решений.Шаг 2. Нажав кнопку Данные, откройте файл данных. Если файл уже открыт,эту кнопку нажимать не следует.При нажатии кнопки Дополнительно появляется окно, где доступныдополнительные инструменты, в частности процедуры понижения размерности,генератор кода и др.
(рис. 2).Рис. 2. Стартовая панель Нейронные сети STATISTICAШаг 3. Из открытого файла выберем переменные для анализа. Переменныемогут быть непрерывными и категориальными; кроме того, наблюдения могутпринадлежать разным выборкам (рис. 3).Рис. 3. Окно выбора переменныхШаг 4. Зададим длительность анализа, указав число испытываемых сетей иливремя решения (рис. 4).Рис. 4.
Мастер решений – вкладка БыстрыйШаг 5. Выберем тип сетей, предлагаемые программой, с которыми будемработать: линейная сеть, вероятностная сеть, сеть, основанная на радиальныхбазисных функциях, многослойный персептрон. Можно выбрать любой тип сетейили комбинацию (рис. 5).Рис. 5. Мастер решений – вкладка Тип сетиШаг 6. Зададим формат представления итоговых результатов (рис. 6).Рис. 6. Мастер решений – вкладка Обратная связьШаг 7.
Запускаем процедуру обучения нейронных сетей, нажав кнопку ОК(рис. 7).Рис. 7. Отображение процесса обученияШаг 8. В окне результатов можно проанализировать полученные решения.Программа отберет лучшие сети и покажет качество решения (рис.8).Рис. 8.
Окно результатов – вкладка БыстрыйШаг 9. Выбираем определенную сеть (рис. 9).Рис. 9. Диалоговое окно выбора моделейШаг 10. Одним из способов проверки является сравнение наблюдаемыхзначений и предсказанных результатов.Сравнение наблюдаемых и предсказанных значений для выбранной сетипредставлено на рис.
10.Pиc. 10. Таблица наблюдаемых и предсказанных значенийШаг 11. Сохраняем лучшие сети с целью дальнейшего использования,например, для автоматического построения прогнозов (рис. 11 и 12).Рис. 11. Стартовая панель – выбор и сохранение сетей/ансамблейРис. 12. Стандартное окно сохранения файла сетиИменно такое типичный сценарий исследования в пакете Нейронныесети STATISTICA.Более систематическое изложение содержится в остальных главах книги.Глава 9КРАТКОЕ РУКОВОДСТВОВ этой главе вы найдете краткое руководство по работе в системе STATISTICANeural Networks (Нейронные сети STATISTICA).В пакете Нейронные сети STATISTICA реализованы все типы нейронныхсетей, которые используются в настоящее время для решения практических задач, атакже самые современные алгоритмы быстрого обучения, автоматическогоконструирования и отбора значимых предикторов.ДАННЫЕВведениеНапомним еще раз, что нейронные сети учатся на примерах и строят модельпо обучающим данным.
Обучающие данные представляют собой определенноеколичество наблюдений (образцов), для каждого из которых указаны значениянескольких переменных. Большинство из этих переменных будут заданы каквходные, и сеть будет учиться находить соответствие между значениями входных ивыходных переменных (чаще всего выходная переменная бывает одна), используядля этого информацию, содержащуюся в обучающих данных.После того как сеть обучится, она может быть использована для предсказаниянеизвестных выходных значений по предъявленным входным значениям.
Такимобразом, первый этап работы с нейронной сетью связан с формированием набораданных.Создать таблицу данных в пакете STATISTICA (Neural Networks) можно спомощью команды Создать меню Файл (или соответствующей кнопки на панелиинструментов), указав число переменных и наблюдений. Созданный в результатеновый файл данных будет поначалу содержать только пустые ячейки, а значениявсех переменных в нем будут установлены как пропущенные (рис. 9.1).Рис. 9.1Выбор входных/выходных переменных, а также множеств, на которыеразделяются переменные, производится внутри модуля Нейронные сети (но ужепосле того, как таблица с данными подготовлена).
Однако обычно поступают не так:файл данных импортируется из какого–то другого пакета с помощью командыОткрыть (при этом потребуется указать формат данных) или команды Внешниеданные меню Файл, которая позволяет создавать сложные запросы к различнымбазам данных (рис. 9.2 и 9.3).Рис. 9.2Рис. 9.3В модуле Нейронные сети имеется возможность непосредственно считыватьфайлы данных системы STATISTICA, при этом автоматически определяютсяноминальные переменные (т.е.
переменные, которые могут принимать одно изнескольких заданных текстовых значений, например, Пол = {Муж, Жен}), а такиетипы данных, как даты и время, переводятся в числовое представление (на входнейронной сети могут подаваться только числовые данные).Если вы получаете данные в какой–то другой программе (например,электронных таблицах), то, прежде всего, нужно будет осуществить импорт данныхсредствами системы STATISTICA. Помимо функции импорта в системе STATISTICAреализованы и другие возможности доступа к внешним источникам информации:• использование буфера обмена Windows (STATISTICA понимает форматыданных в буфере обмена, применяемые в таких приложениях, как Excel и Lotus);• доступ к различным базам данных с помощью инструмента построениязапросов STATISTICA Query.Текстовые файлы с разделителями – знаками табуляции или запятыми можноимпортировать непосредственно в пакет STATISTICA.
При этом по желанию, первуюстроку файла можно оставлять для имен переменных, а первый столбец – для именнаблюдений (рис. 9.4).Рис. 9.4После того, как файл данных открыт или вновь создан, его содержимое можноредактировать как обычную таблицу среды STATISTICA.В STATISTICA реализованы основные операции с данными, характерные длятабличных процессоров, в том числе: редактирование, выделение блока ячеек,пересылка в буфер обмена и т.д. Кроме этого, здесь имеются специальные операциидля задания типа и имен переменных и наблюдений, их добавления, удаления,перемещения и копирования.Типы переменных и наблюденийВ программе STATISTICA Нейронные сети все наблюдения из файла данныхделятся на четыре группы (множества): обучающие, контрольные, тестовые инеучитываемые.
Обучающее множество служит для обучения нейронной сети,контрольное – для независимой оценки хода обучения, тестовое – дляокончательной оценки после завершения серии экспериментов. Неучитываемоемножество не используется вовсе (оно может понадобиться, если часть данныхиспорчена, ненадежна или их просто слишком много).Аналогичновсепеременныеделятсянавходные,выходные,входные/выходные (например, при анализе временных рядов) и неучитываемые(последние обычно являются «кандидатами на роль входных переменных», чьяполезность для построения прогноза заранее неясна, и потому в процессеэкспериментирования некоторые из них отключают).Тип переменных и наблюдений задается в модуле Нейронные сети.Число входных и выходных переменных, а также обучающих, контрольных итестовых наблюдений выводится в соответствующих полях в верхней частистартового окна STATISTICA Нейронные сети.
Пропорции между типами можноизменить, редактируя установки в этих полях. Это не приведет к добавлению новыхили удалению имеющихся наблюдений или переменных: будет меняться только типуже существующих наблюдений или переменных.Подобная операция используется для формирования несмещенногоконтрольного множества.
Сначала нужно указать размер этого множества (обычнона него отводится половина всего набора данных, а другая половина – наобучающее; если же необходимо еще и тестовое множество, то файл надо разбить натри части). Затем, с помощью опции Случайный выбор все имеющиеся наблюденияслучайным образом распределяются по различным типам.При первом чтении файла данных в программе STATISTICA Нейронные сетинеобходимо определить, какие из переменных будут входными, а какие выходными;точно также и для наблюдений необходимо задать параметры выборок дляобучения, проверки, тестирования. Установки, относящиеся к переменным,необходимо производить на стартовом окне модуля Нейронные сети, а установки,касающиеся наблюдений, нужно производить с помощью инструмента Выборки вдиалоговом окне задания параметров анализа (на него вы переходите послестартового окна).
Заметим, однако, что если задана переменная идентификациивыборок, то ее необходимо задавать на стартовом окне при заданиивходных/выходных переменных.Имена переменных и наблюденийИмеется возможность присваивать имена отдельным переменным и/илинаблюдениям. Это делается с помощью команды Спецификации переменных,команды Все спецификации переменных, Диспетчер имен наблюдений меню Данные.Можно и просто дважды щелкнуть на имени в поле заголовка строки или столбца, иимя можно будет ввести непосредственно в таблицу.В программе STATISTICA Нейронные сети не требуется в обязательномпорядке присваивать имена наблюдениям или переменным. Если имя не былозадано, то в таблице выводится условное имя, принимаемое по умолчанию.Определение переменной(номинальные значения)В программе STATISTICA Нейронные сети имеются специальныевозможности для работы с категориальными (номинальными) переменными.














