Отчёт 1 (1027177), страница 3
Текст из файла (страница 3)
Программа вычисляет также поправки Гринхауса-Гейсера и Хюнха-Фельдта для факторов повторных измерений; для таких факторов автоматически вычисляются одно- и многомерные результаты. Пользователь может исследовать SS-матрицы (сумм квадратов) гипотез и ошибок, и там, где это возможно, программа выполняет полный канонический анализ с вычислением канонических корней, собственных значений, долю дисперсии, приходящуюся на каждый корень, а также стандартизованную и нестандартизованную дискриминантную функцию.
Для визуализации результатов при исследовании гипотез и предположений в моделях дисперсионного анализа имеется большое число различных типов графиков: графики распределений, графики "ствол и листья", категоризованные и составные графики корреляций и подгоночных функций, позволяющие сравнивать соотношения между зависимыми измерениями (и/или) ковариатами по ячейкам высших порядков, графики средних против стандартных отклонений или дисперсий, обычные и категоризованные нормальные, полунормальные вероятностные графики и графики с исключенным трендом, графики корреляций внутри ячеек и т.д.
Там, где это может потребоваться, можно одним щелчком мыши получать каскады графиков, которые затем просматривать. Кроме того, имеется большой набор статистических процедур для проверки предположений: C Кохрена, критерий Хартли, критерий Бартлета, критерий Левена, M Бокса, непараметрический критерий Сена и Пури, критерий Колмогорова-Смирнова, критерий сферичности Моучли и т.д. При этом подгонку моделей структурированных средних (с константами), построенных по матрицам моментов для одной и нескольких выборок, можно осуществлять также средствами модуля SEPATH (Моделирование структурными уравнениями) системыSTATISTICA, в котором можно оценивать модели MANOVA с явной неоднородностью дисперсий/ковариаций в разных группах и/или с явными структурными моделями для зависимой переменной, различными для каждой группы.
Вариант этого модуля, входящий в пакет STATISTICA Base, имеет следующие ограничения: в нем можно анализировать одномерные планы с числом межгрупповых факторов не более четырех, одним фактором повторных измерений и одной ковариатой (полная версия реализована в продукте STATISTICA Advanced).
Подгонка распределений
О пции модуля Подгонка распределений позволяют сравнивать имеющееся распределение переменной с различными теоретическими распределениями. К данным можно попытаться подогнать нормальное, прямоугольное, экспоненциальное, гамма, логнормальное, хи-квадрат распределение, распределения Вейбулла, Гомпертца, биномиальное, Пуассона, геометрическое и Бернулли.
Точность подгонки может быть оценена с помощью критерия хи-квадрат или одновыборочного критерия Колмогорова-Смирнова (при этом можно контролировать параметры подгонки); кроме того, реализованы также критерии Лиллиефорса и Шапиро-Уилкса (см. выше). Подгонку гипотетического распределения определенного типа к эмпирическому распределению можно осуществлять при помощи настраиваемых гистограмм (обычных и кумулятивных) с наложенными на них подгоночными функциями; прямо из таблиц результатов можно строить графики и гистограммы для ожидаемых и наблюдаемых частот, отклонений и других показателей.
Ряд других методов подгонки распределения реализован в модуле Анализ процессов STATISTICA – здесь можно получить оценку значений параметров по принципу максимума правдоподобия для распределений: бета, экспоненциального, экстремальных значений (типа I, Гумбеля), гамма, логнормального, Релея и Вейбулла. В этом модуле имеется возможность автоматически выбрать и подогнать распределение, в наибольшей степени согласующееся с данными, а также средства подгонки распределений через моменты (с помощью кривых Джонсона и Пирсона).
На диаграммы могут быть наложены (в виде кривых и поверхностей) графики заданных пользователем функций. Эти функции могут изображать самые разные типы распределений: бета, биномиальное, Коши, хи-квадрат, экспоненциальное, экстремальных значений, F, гамма, геометрическое, Лапласа, логистическое, нормальное, логнормальное, Парето, Пуассона, Рэлея, t (Стьюдента) и Вейбулла, а также их интегралы и обратные распределения. О возможностях подгонять к данным сколь угодно сложные функции встроенных или заданных пользователем типов см. в разделе Нелинейное оценивание.
Понятие тренда, практическое значение, основные процедуры анализа и моделирования тренда, в частности процедуры цифровой фильтрации, модель простой скользящей средней. Уравнение свертки, парамтеры СМА, возмождные варианты формирования СМА.
Практическая часть.
Ознакомление с основными элементами электронных таблиц
На скриншоте представлено окно программы STATISTICA:
Ниже представлена шапка окна программы (Меню + быстрый доступ)
Главное меню представлено 11 разделами, названия которых говорит о споём содержании:
-
File – стандартный раздел с командами создать новую таблицу, открыть, закрыть, сохранить, печать, экспорт и т.п.
-
Edit – стандартный раздел с командами копировать, вставить, вырезать, удалить, найти, отменить, повторить и т.п.
-
View – стандартный раздел настройки представления данных в различных окнах. Позволяет показывать/скрывать и настраивать вид различных элементов представления таких как заголовки столбцов и строк, маркировки ячеек, статус бар и т.п.
-
Insert – добавление и копирование столбцов и строк в таблице.
-
Statistics – основой раздел в котором содержится широкий сектор статистических методов анализа данных.
Тут представлены:
-
Basic Statistics/Tables – базовые статистики;
-
Multiple Regression – многомерная регрессия;
-
ANOVA – подгонка распределений;
-
Nonparametrics – непараметрическое оценивание;
-
Advanced Linear/Nonlinear Models – линейные и не линейные модели;
-
Multivariate Exploratory Techniques – многомерный разведочные анализ данных;
-
Data-Mining – обнаружение закономерностей в данных;
-
И многое другое (а в 10 версии их ещё больше) …
Мы остановимся на линейных и не линейных моделях.
-
Graphs – раздел с инструментами для построения различных графиков, гистограмм, матриц и т.д.
-
Tools – настройка различных инструментов, макросы и главные настройки программы STATISTICA.
-
Data – множество различных инструментов для работы с данными от сортировки до заполнения ячеек случайными значениями или редактирования формата текста. А так же там дублируются некоторые команды из предыдущих пунктов меню (например, добавление столбцов/строк в таблицу)
-
Help – тут всё стандартно: справка, о программе, регистрация.
Так же под главным меню много стандартных элементов управления таких как открыть, открыть, сохранить… в общем ничего интересного. Просто дублируются часто используемые команды из главного меню. Так же туда вынесены команды Vars и Cases для добавления столбцов и строк в таблицу соответственно.
Сами таблицы не представляют из себя ничего не обычного:
Здесь:
Variables – столбцы таблицы (переменные), уникальные временные ряды. Сколько столбиков, столько рядов.
Cases – строки таблицы.
На следующей картинке представлено окно открытия таблицы:
Из него видно, что стандартный способ обмена информации через электронную таблицу *.sta – формат данных электронной таблицы. Можно сохранять через File-Save As в разных форматах.
Для работы открыли один из временных рядов (Series_D.sta).
Выполним подготовку таблицы к исследованию. Для начало добавим столбец (переменную) – месяцы, например, через Vars -> Add…
Вот так выглядит окно добавления:
Создание новой переменной (Имя Month, тип Double, 0 знаков после запятой)
Аналогично в конец добавляем 12 строк через Cases -> Add…
И на бедующее ещё 8 столбиков.
Итак, наша таблица подготовлена:
Зайдём в раздел Statistics -> Advanced Linear/Nonlinear Models (линейные и нелинейные модели). Здесь нас интересует пункт Time Series/Forecasting (временные ряды и прогнозирование).
Нажимаем на этот раздел и появляется рабочая панель:
Основная рабочая панель и панели последующего уровня выполнены в едином стиле, что облегчает их освоение. Панели содержат как минимум 2 части. Одна из них это закладки. В данном случае тут 2 закладки:
-
Quick – содержит набор кнопок отвечающих за соответствующие методы и модели обработки данных. Например: ARIMA – авторегрессия проинтегрированной скользящей средней; Exponential smoothing & forecasting – экспоненциальное сглаживание и прогнозирование; Spectral (Fourier) analysis – спектральный (Фурье) анализ; Seasonal decomposition – выделение сезонных компонент…
-
Missing data – посвящена обработке пропущенных данных. Если в таблице есть пустые строчки можно воспользоваться различными методами интерполяции. Стандартный метод (выбран на рисунке) – интерполяция по соседним отсчётам. Или ниже интерполяция по N отсчётам только справа или только слева.
Верхняя часть рабочей панели содержит 2 кнопки и окно редактирования.
Д анная кнопка позволяет загрузить те временные ряды которые вас интересуют.
Нажав на неё появится диалоговое окно, в котором перечислены наши переменные. Нам нужна вторая.
Формат данных электронной таблицы – очень медленный формат. И обрабатывать все свойства, события, атрибуты и прочее очень сложно из-за больших вычислительных затрат. Потому тут предусмотрено преобразование в быстрый формат (формируется бинарный файл), например, в случае временного ряда, это как правило двухсвязный список. После нажатия на «OK» появляется дубликат ВР в виде бинарного файла, который в дальнейшем будет обрабатываться системой
по умолчанию тут 3. Очень важное поле, означающее – количество быстрых форматов, за исключением основного по превышении которого, система будет удалять ту запись, которая следует сразу после основных. На практике 3 – это очень мало, рекомендуется 10.
Преобразование, автокорреляция, взаимная корреляция, графики.
Нажав на не мы перейдём на уровень выше. Появится панель 2 уровня выполненная в том же стиле.