Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 81
Текст из файла (страница 81)
К сожалению, в этой книге мы не можем рассмотреть большуючасть из этих возможностей. Мы лишь опишем, как обсуждавшиесявыше задачи можно решить с помощью пакета Эвриста.Интерфейс пакета. Сделаем предварительно несколько общихзамечаний об интерфейсе Windows"версии этого пакета. Общий видинтерфейса пакета приведен на рис.
13.18. Он включает в себя строкуменю, строку пиктограмм для выполнения наиболее часто используе"мых команд и одно или несколько рабочих окон, в которые помещают"ся данные и результаты. Интерфейс пакета полностью соответствуетстандарту интерфейсов прикладных программ в среде Windows, так что408работа с программой по форме практически не отличается от работы сдругими Windows"программами.На рис. 13.18 справа в рабочем окне приведена электронная таблицас загруженными данными примера 13.1к, а слева — график этих данных.Рис. 13.19. Диалоговое окно импорта данныхРис.
13.18. Общий вид интерфейса Windows"версии пакета ЭвристаО дальнейшем изложении. Задачи, которые будут рассмотреныниже, в пакете Эвриста можно решить различными способами. Так,вычисление линейной и полиномиальной регрессии в пакете реализуютпроцедуры Анализ тренда, Прогнозирование, Регрессионные модели.
У каждойиз них есть свои особенности. Рассказывая о том или ином способерешения задачи, будем стремиться к тому, чтобы показать различныевозможности пакета, а не только к выбору кратчайшего пути к цели.13.3.2. … …ƒ…Пример 13.1к. Для данных урожайности зерновых культур в СССРподобрать модель тренда с помощью процедур регрессионного анализа,провести анализ остатков и построить на базе подобранной моделипрогноз на несколько лет вперед.Ввод исходных данных. Пусть данные таблицы 1.2 находятсяв текстовом (ASCII) файле zerno.dat в виде двух столбцов, первый изкоторых содержит значение года, а второй — значение урожайности.Для загрузки этих данных в пакет Эвриста выберем в пункте менюДанные (рис. 13.18) подпункт Импорт. На экране появится диалоговоеокно импорта данных (рис.
13.19).409В нем необходимо указать имя импортируемого файла и каталог, вкотором он находится. Файлы данных пакета Эвриста должны иметьрасширение gnt, поэтому в качестве имени нового файла указан файлzerno.gnt. Пакет предусматривает импорт из формата ASCII, dBase"III,Эвриста (DOS). Тип формата импортируемого файла указывается в полеТип данных. Поле Тип даты позволяет загружать в пакет данные, записанныев различных календарных форматах (например, пятнадцатое февраля1997 г. может быть записано в виде 15.02.1997 или 15/02/97). В случаенаших данных настройка этого поля несущественна.
После заполнениянеобходимых полей щелкните мышью по кнопке OK для выполненияимпорта. Результатом работы этой процедуры будет появление файлаzerno.gnt, содержащего две переменные: var0 и var1, которые соответствуютпервому и второму столбцу исходного файла.Замечание. Если исходные данные уже находятся в какой"нибудь Windows"программе, например в Excel, Quattro Pro, Lotus и т.п., то загрузка их в Эвристуможет быть осуществлена стандартным образом через буфер обмена (Clipboard).Задание рабочих переменных.
Для редактирования и обработкиданных в пакете Эвриста надо предварительно указать рабочие пере"менные. Для этого в пункте меню Данные выберем подпункт Открыть. Наэкране появится диалоговое окно этой процедуры (рис. 13.20). В немследует указать имя файла zerno.gnt. Все переменные указанного файлапоявятся в окне Переменные. Из них с помощью мыши выбираются Рабочиепеременные. После этого надо нажать в окне 13.20 кнопку OK.410Заполнение диалогового окна включает задание переменных по осямX и Y и элементов оформления графика. Результаты этой процедурыприведены слева на рис.
13.18. Пакет также включает многочисленныесредства для редактирования графика: выбор типа линий и точек,шрифтов и их размеров и т.п.Выбор процедуры. Для оценки и удаления тренда из временногоряда в пакете следует в пункте меню Метод выбрать процедуру Анализтренда, а в выведенном подменю — пункт Полиномиальная Регрессия. Наэкран выводится диалоговое окно, показанное на рис. 13.22. Оно пред"полагает задание степени подбираемого полинома, уровня доверия длядоверительных интервалов, а также задание форм выдачи результатов.Рис. 13.20. Диалоговое окно открытия данныхРис. 13.22. Диалоговое окно процедуры полиномиальной регрессииПосле заполнения полей диалогового окна для выполнения расчетовследует в пункте меню Счет выбрать опцию Выполнить метод или простощелкнуть мышкой по пиктограммена панели управления пакета.Рис.
13.21. Диалоговое окно создания нового X–Y графикаВывод на экран данных и графика. Задав рабочие переменные,их можно посмотреть, отредактировать в электронной таблице и выве"сти на график. Для этого в пункте меню Таблица необходимо выбратьпункт Открыть. На экране появится электронная таблица с выбраннымирабочими переменными (см. рис. 13.18). Одновременно можно открытьи графическое окно с рабочими данными.
Для этого в пункте менюГраф следует выбрать пункт Создать график, в нем подпункт Создать новыйи выбрать тип графика. (В данном случае это график зависимости уро"жайности от времени или, кратко, X–Y график.) Диалоговое окно этойпроцедуры приведено на рис. 13.21.411Результаты.
Текстовая форма выдачи результатов процедуры поли"номиальной регрессии содержит оценки параметров регрессионной мо"дели, их статистические характеристики (включая уровни значимости)и таблицу дисперсионного анализа (таблицу разложения вариации).Эти результаты приведены на рис. 13.23.Выбранная графическая форма представления результатов процеду"ры (тренд и доверительные интервалы) приведена на рис. 13.24.Анализ остатков.
Для получения остатков временного ряда необ"ходимо после подбора модели тренда еще раз запустить на выполнениепроцедуру полиномиальной регрессии. Это можно сделать с помощьюменю, как было описано выше, или просто нажать клавиши «Alt»«F9»для повторения последней процедуры. При этом в поле Вывести диалого"412Рис. 13.23. Расчеты, выдавемые процедурой регрессионного анализаРис. 13.26. Диалоговое окно сохранения остатковРис.
13.24. Графические результаты процедуры полиномиальной регрессииРис. 13.27. График автокорреляционнойфункции для остатков ряда урожайности зерновыхпроцедуры приведено на рис. 13.26. В нем необходимо указать имяфайла (zerno.gnt) и имя переменной, например resids, и нажать OK.Рис. 13.25. График остатков в процедуре полиномиальной регрессиивого окна (рис. 13.22) надо указать режим Вывести остатки.
Полученныйграфик остатков приведен на рис. 13.25.Для дальнейшего анализа остатков их следует сохранить в видеотдельной переменной (при этом они будут одновременно добавленыв электронную таблицу). Для этого в пункте меню Результат следуетвыбрать подпункт Сохранить и добавить в таблицу. Диалоговое окно этой413Проверка коррелированности остатков.
В пакете существуетнесколько различных способов выяснения коррелированности остатков.Мы построим для этого лишь выборочную автокорреляционную функ"цию. Для этого пункте меню Метод можно выбрать подпункт Предвари'тельный анализ и в нем процедуру Автокорреляционная функция. В диалоговомокне этой процедуры надо указать максимальное число задержек (лагов)автокорреляционной функции и запустить процедуру на счет, как этобыло указано выше. Результат этой процедуры приведен на рис. 13.27.414Обратим внимание, что график автокорреляционной функции вклю"чает нулевую задержку, в которой она по определению равна единице.Это сделано для улучшения визуального восприятия графика. На гра"фике отсутствуют традиционные доверительные интервалы для нулевойгипотезы о некоррелированности значений ряда для всех задержек.
По"этому вывод о значимом отличии полученных оценок автокорреляций√от нуля следует делать на основании формулы −1/n ± 2/ n для при"мерных 95% границ доверительного интервала нулевой автокорреляци"онной функции, где n — объем временного ряда (см. п. 11.10). Дляряда урожайности зерновых n = 45 и размах доверительного интерваласоставляет примерно ±0.3. Полученные оценки выборочной автокорре"ляционной функции в целом укладываются в эти пределы.Замечание.
Следует помнить, что при таких объемах анализируемых дан"ных статистические методы могут выявить только явные нарушения исходныхпредположений. Если же эти нарушения слабые, то формальные критерии чащевсего выявить их не в состоянии, в силу нехватки информации. Об этом всегданадо помнить при анализе относительно коротких временных рядов. Поэтомув случае анализа остатков ряда зерновых мы вынуждены заключить, что необнаружено явных нарушений предположения о некоррелированности. А дляболее точных выводов у нас нет информации.Для дальнейшего анализа остатков в пакете может быть использо"вана процедура Тесты на случайность из раздела Предварительный анализ. Мыне будем останавливаться на этом вопросе.Прогнозирование.
Для осуществления прогноза на базе линейной(или полиномиальной) модели линейной регрессии следует в меню Методвыбрать пункт Прогнозирование и в нем выбрать подпункт Прогноз полиноми'ального тренда. В открывшемся диалоговом окне процедуры Прогнозированиепо Полиномиальной регрессии (рис. 13.28) следует указать степень полино"ма, уровень доверия для линии прогноза и количество шагов прогноза.Результат работы этой процедуры приведен рис. 13.29.Рис. 13.29. Прогноз поведения ряда урожайности зерновыхсожалению, в пакете отсутствует построение доверительных интерваловдля самих будущих значений временного ряда.13.2.3.
0…… ƒ…… ……Пример 13.2к. Для ряда производства молока в России оценимсезонные индексы и проведем сезонное выравнивание ряда.Подготовка данных. Пусть данные о производстве молока в России(таблица 12.1) находятся в текстовом (ASCII) файле в виде одногостолбца. Способ загрузки подобных данных в пакет и выбор их вкачестве рабочей переменной подробно описан в предыдущем примере.Будем считать, что загруженные данные находятся в файле milk.gnt впеременной milk.Рис. 13.28.