1626434812-e667f6b6e7e69d3a0798830a58e9075b (844135), страница 36
Текст из файла (страница 36)
В большей степени это качество зависит от того, насколько правильно поставлена задача, насколько точно определен набор данных, требуемый на различных этапах решения задачи. Существуют специализированные аппаратные платформы [451 для реализации нейросетевых вычислений, существенно ускоряющие их выполнение по сравнению с программной интерпретацией нейросети на универсальных компьютерах. 7.4. Прогнозирование с использованием нейросетей Методологические основы прогнозирования менялись с развитием мировоззрения. В древнем мире и в средние века огромную роль играли пророчества, прорицания, "откровения", различные способы гадания. В то время важные управленческие решения часто принимались именно на основе такого рода "прогнозов".
Наука о прогнозировании — "прогностика" стала формироваться лишь в середине нашего столетия. Большое внимание она уделяет статистическим методам прогнозирования: регрессионному анализу, методам экстраполяции временных рядов. Однако большинство из них сложно эффективно применять, не имея глубоких знаний в области математической статистики. В последние годы отчетливо отмечается тенденция проникновения в прогностику технологий искусственного интеллекта, прежде всего технологий„ основанных на нейронных сетях.
Хотя в методологии их применения много белых пятен, эти системы показывают очень хорошие результаты при решении целого ряда задач прогнозирования, особенно из плохо формализуемых предметных областей, Как уже отмечалось выше, суть методов прогнозирования — выявление и последующее использование закономерностей развития прогнозируемого процесса.
Обнаружение закономерностей производится на основе анализа ретроспективных данных — данных об истории развития процесса. Эти данные хранятся в виде временных рядов. Временным рядом называется совокупность наблюдений и~~,~, и~~ ~, ..., и~~ ~ исследуемой случайной величины и, произведенных в последовательные моменты времени ~,, ~„..., ~ . Отдельное значение Базы данных, Интеллектуальная обрабо~пка информации иф, относящееся к определенному моменту времени г,, принято называть уровнем ряда.
Вот, например, результаты финальных забегов на дистанции 400 метров среди мужчин на всех Олимпийских играх, представленные в виде временного ряда (Таблица 7.4.1, данные взяты из 1491): Таблица 7.4,1 Данные для прогнозирования должны быль достоверными, кроме того, важно, чтобы они собирались по единой методике.
Период их сбора должен быть постоянным. Определяется он природой наблюдаемого процесса, влиянием на него сезонных колебаний. Например, для прогнозирования курса акций длительность периода выбирают равной одному дню, а солнечной активности— одному году. Продемонстрируем возможности использования нейросетевых пакетов для прогнозирования. Нами будет использован пакет Вга1пМа1сег 3.1 РгоКеяя1опа1, упоминавшийся ранее. Оставим прогнозы финансовых индексов и индикаторов рынков экономистам, тем более что почти в любой работе по прогнозированию приводятся примеры именно из этой области.
Займемся... предсказанием погоды! Пример, который мы рассмотрим, — иллюстративный. Он не претендует на серьезную проработку проблематики прогнозирования природных явлений, хотя и использует реальные данные. Пример показывает, как решаются задачи анализа временных рядов с использованием нейросетевого пакета Вга1пМаЕег. Итак, пусть необходимо разработать прогноз среднегодовой температуры в городе Мюнхене. Допустим, у нас имеются значения этой температуры за период с 192б по 1985 год, и на основе этих данных требуется узнать, какой она будет в 1986 году. Поставив так задачу, мы сможем проверить точность полученного нами прогноза, сравнив его с реальным, известным нам значением за 198б год.
Глава 7. Нейросетевые системы Таблица 7.4.2. Год МАТ, 'С %И В ААТ, 'С Год МАТ, 'С %Х ДААТ„'С 1956 6.61 141.7 -0.19 1926 7,76 44,3 -0.10 1957 8.18 190.2 0.09 1927 8.38 63.9 0.13 1928 7.88 69.0 -О.О! 1929 8.38 77.8 0.06 1958 8.08 184.8 0.11 1959 8,58 159.0 0.06 1930 6.93 64.9 -0.17 1960 8.20 112.3 0.01 1931 8.26 35,7 -0.01 1932 6.78 21.2 0.09 1961 8.94 53,9 0.08 1962 7.22 37.5 0.02 1963 7.11 27.9 0.02 1933 7.63 11.1 0.05 Разработать прогноз можно, не используя никаких данных, кроме временного ряда значений температуры, В таком случае достаточно провести его экстраполяцию.
Однако потенциально более точный результат может быть получен, если прогноз строится с учетом величин, связанных с прогнозируемым параметром. Например, если существует устойчивая зависимость между среднегодовой температурой Мюнхена и солнечной активностью, то совместное использование данных о температуре и солнечной активности при обучении нейросети позволит улучшить прогноз. Предположим, что среднегодовая температура Мюнхена (МАТ) связана с числом Вольфа (%Х) и приведенной среднегодовой температурой поверхностного слоя атмосферы Земли (ДААТ). Число Вольфа — одна из характеристик солнечной активности, которая применяется при ее сопоставлении с геофизическими явлениями. Числа Вольфа публикуются Цюрихской обсерваторией, начиная с 1849 года.
Приведенная среднегодовая температура поверхностного слоя атмосферы Земли — это разность между средним значением температуры окружающего нашу планету воздуха и некоторым "нулевым уровнем". Временной ряд этих значений обычно используют для иллюстрации процесса глобального потепления атмосферы. Впоследствии мы сможем проверить гипотезы о связи чисел Вольфа и приведенной среднегодовой температуры поверхностного слоя атмосферы с прогнозируемой температурой в Мюнхене.
Данные, которые мы будем использовать, приведены в таблице 7.4.2. Значения МАТ и %М взяты из 1491, ДААТ из 150]. Заметим, что данные не были искусственно подготовлены для того, чтобы облегчить работу нейронной сети и получить заведомо хороший результат. Вазы данных Интеллектуальная обработка информации 192 Год МАТ, 'С %И ИААТ, 'С Год МАТ, 'С %Х ДААТ, 'С 1934 6.72 5.7 -0.16 1964 8.04 10.2 -0.27 1965 7.26 ! 5. 1 -0.18 1935 8.75 8.7 0.05 1966 8.51 47.0 -0.09 1935 7.93 36.1 -0.02 1967 8,66 93.8 -0.02 1936 7.92 79.7 0.04 1937 8.50 114.4 0.17 1968 7.93 105.9 -0.13 1969 7.57 105.5 0.02 ! 938 8.00 109,6 0.19 1970 7.52 104.5 0.03 1971 7.67 66.6 -0.12 1939 7.71 88.8 0.05 1940 6.61 67.8 0.15 1972 7.24 68.9 -0.08 194 ! 6.98 47.5 0.13 1973 7 55 38.0 0.17 1942 7.35 30.6 0.09 1943 8.89 16.3 0.04 1974 8.54 34.5 -0.09 1944 7.73 9.6 О.
11 1975 8.16 15.5 -0.04 1945 8,18 33.2 -0.03 1976 7.84 12.6 -0.24 1946 8.10 92.6 0.03 1977 8.48 27.5 -0.16 1978 7.30 92.5 -0.09 1947 8.66 151.6 0.15 1979 7.93 155.4 0.12 1948 8,60 136.3 0.04 1949 8.7! 134.7 -0,02 1980 7.29 154.7 0.27 1981 8.05 140.5 0.42 1950 8.81 83.9 -0.13 1982 8.32 115.9 0.02 1983 8.50 66.6 0.30 1951 8.47 69.4 0.02 1952 8.10 31.5 0.07 1984 7,28 45.9 0.09 1985 7.15 17.9 0.05 1953 8,35 13.9 0.20 1954 7,41 4.4 -0.03 1955 7.36 38.0 -0.07 Процесс прогнозирования с использованием нейросети можно представить в виде 6 этапов: 1) постановка задачи — необходимо четко определить, что нам надо предсказывать и какие данные использовать; 2) сбор и подготовка исходных данных — получение информации из доступных источников, определение формата представления информации, создание базы примеров для обучения и тестирования нейросети; 3) создание нейросети — определение ее топологии, входов, выходов, числа нейронов в скрытом слое; Глава 7.
Нейросетевые системы 4) обучение сети — последовательная подача примеров на входы нейросети, сравнение выхода сети с эталонными значениями, коррекция весов межнейронных связей и топологии сети. В случае если сеть пе может обучиться, требуется повторить этапы 2 и 3; 5) тестирование ости — проверка точности сети на тестовых примерах, если сеть не проходит тестирование, повторяются этапы 2, 3 и 4: б) получение прогнозных значений. В процессе разработки нашего прогноза мы будем придерживаться описанной последовательности действий. Итак, задача поставлена довольно четко, ясно также, какие данные использовать. Поэтому перейдем сразу ко второму этапу- подготовке исходных данных. Сначала нам потребуется создать файл, содержащий исходные временные ряды. ВгаЫМайег работает с различными форматами данных: ЙВазе, 1 о1цз 1-2-3 версий 2 и 3, Ехсе! версий 2 и 3, Ме1айос1с, с данными в двоичных и текстовых файлах.