4_Дисперс (Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ), страница 2
Описание файла
Файл "4_Дисперс" внутри архива находится в папке "Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ". Документ из архива "Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ", который расположен в категории "". Всё это находится в предмете "математический анализ" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "высшая математика" в общих файлах.
Онлайн просмотр документа "4_Дисперс"
Текст 2 страницы из документа "4_Дисперс"
Полагая
получим равенство математических ожиданий
M(s2) = M(s12) = M(s22) = 2.
Дисперсионное соотношение можно записать в виде
Нулевая гипотеза является сложной гипотезой, связанной с параметрами m1, m2, ... , mn, о которых не делается никаких предположений. Каковы бы ни были значения m и 2, вероятность отвергнуть нулевую гипотезу, в случае, когда эта гипотеза в действительности верна, равняется P(|z|>zp)=. Таким образом критическое множество, соответствующее критерию z, подобно пространству выборок, и z-критерий есть критерий уровня . Результаты программных расчетов простой группировки сводятся в таблицу 1. дисперсионного анализа.
Таблица | 4.1. |
Таблица дисперсионного анализа
Изменчивость | Число степеней свободы | Сумма квадратов | Средние квадраты |
Между группами | r-1 | ||
Внутри групп | n-r | ||
Сумма | n-1 |
Каждое из трех чисел в столбце "средних квадратов" при нулевой гипотезе дает несмещенную оценку для дисперсии совокупности 2 и z-критерий можно считать критерием совместности независимых оценок s12 и s22.
Для любого заданного ij величина имеет нормальное распределение с параметрами .
В результате величина имеет распределение Стьюдента с n-r степенями свободы. Работая с -процентным уровнем значимости, получаем доверительные пределы для разности между двумя неизвестными групповыми средними значениями: .
Statistica. Используя модуль ANOVA-MANOVA проведем анализ значимости различия между фактическими и плановыми объемами перевозок для всех колонн автокомбината. На рис.1. приведены результирующие формы регрессионного и дисперсионного анализа.
В регрессионном анализе (рис.1.а) основной задачей было построение регрессионной прямой, отклонение точек от которой трактовалось бы как ошибка прогноза плановых объемов. В дисперсионном анализе цель другая. Группируются все значения показателей (рис.1.б). В квадрат диаграммы включается 50% всех значений. В результате видно, что для 50% точек плановые показатели превышают фактические.
Регрессия и изменчивость
а) | б) | |||
Рис. | 4.1. |
В таблице 2. приведены суммы квадратов и F-отношение для оценки влияния фактора времени.
Таблица | 4.2. |
Сравнение плановых и фактических объемов
Sum of Squares | df | Mean Square | F | p-level | |
Effect | 847,59 | 1 | 847,5864 | 12,51885 | 0,000417 |
Error | 90047,43 | 1330 | 67,7048 |
Анализ таблицы показывает, что с уровнем ошибки p<0,0004 принимается гипотеза о существенном различии плановых и фактических объемов, что может потребовать пересмотра стратегии прогноза объемов и разработки планов.
4.5 Однофакторный дисперсионный анализ
Простейшим случаем дисперсионного анализа является однофакторный анализ. Нулевая гипотеза H равносильна утверждению, что все параметрические функции некоторого класса имеют нулевые значения. Каждый раз, когда по F-критерию H отвергается, можно одним из методов множественного сравнения решить, какая параметрическая функция рассматриваемого класса отличается от нуля и как велико это отличие.
Термин однофакторный анализ (или классификация по одному признаку) относится к сравнению средних нескольких одномерных групп показателей. Обозначим средние значения характеристик через 1, 2, ... , n. Допустим, что группы нормально распределены и имеют равные дисперсии 2.
Имеется независимые выборки объемов J1, J2, ..., Jm. Тогда основные предположения заключаются в следующем:
yij=i+ij, i=1..I; j=1..Ji; ij ~ N(0,2)
Нулевая гипотеза состоит в проверке равенства:
H0: 1=2=…=m.
По F-критерию гипотеза H0 отвергается с заданным уровнем значимости тогда и только тогда, когда F*>F(,I-1,N-I). При выполнении основных предположений F-статистика имеет центральное F-распределение.
Однофакторный анализ выполняется на основе тех же таблиц, которые были рассмотрены при простой группировке величин.
Statistica. Рассмотрим динамику изменчивости показателя технической готовности автоколонн. В данном случае группирующим фактором будет анализируемый год. На рис.2. приведена диаграмма коэффициента технической готовности в зависимости от года.
Изменчивость коэффициента технической готовности
Рис. | 4.2. |
Из диаграммы видно, что существует явное снижение коэффициента технической готовности. Так если в 1995 году в 50% случае он был очень близок к 0.88, то в 1997 году его уровень понизился до 0.8.
Таблица 3. представляет таблицу дисперсионного анализа оценки существенности влияния фактора времени на коэффициент технической готовности.
Таблица | 4.3. |
Таблица дисперсионного анализа
Sum of Squares | df | Mean Square | F | p-level | |
Effect | ,6007109 | 2 | ,3003554 | 77,12 | 0,01 |
Error | 2,6520180 | 681 | ,0038943 |
В результате расчетов также получен о значение F-отношения, которое равно 77,12, что соответствует уровню значимости 0.01. Таким образом следует сделать заключение о существенном падении коэффициента технической готовности всех автоколонн.
4.6 Двухфакторный дисперсионный анализ
Предположим, что в ходе эксперимента меняются два фактора A и B. Рассмотрим случай, когда имеется K измерений для каждой комбинации уровней первого и второго фактора (i,j). В результате модель дисперсионного анализа примет вид:
yijk=ij+ijk, i=1..I; j=1..J; k=1..K; ijk ~ N(0,2).
Коэффициенты ij могут быть преобразованы к виду:
ij=**+(i*-**)+(*j-**)+(ij-i*-*j+**),
где ** - полностью усредненный отклик;
(i* - **) - средний эффект первого фактора на уровне i;
(*j - **) - средний эффект второго фактора на уровне j;
(ij - i*-*j + **) - взаимодействие между первым и вторым факторами на уровнях i и j.
Модель, в которой по предположению нет взаимодействия, называется аддитивным планом с двумя признаками. В результате, получим модель:
yijk=+i+j+ijk, i=1..I; j=1..J; k=1..K; ijk ~ N(0,2)
в которой вводится новая параметризация:
=**; i=i*-**; j= *j- **;
Параметры i и j удовлетворяют условию . При таком описании модели необходимо решить две задачи: вычисление размерности к пространства (число степеней свободы); вычисление оценки параметров.
Поскольку линейные ограничения введены только для того, чтобы параметризация стала идентифицирующей, подсчет степеней свободы эквивалентен вычислению ранга r матрицы F из соотношения
Утверждение. Число степеней свободы модели двухфакторного анализа равно r=I+J-1.
Задача вычисления оценок параметров дисперсионной модели сводится к задаче минимизации функционала:
Решение задачи оптимизации является решением системы уравнений:
Непосредственное дифференцирование введенного функционала дает следующие результаты:
Решая полученную систему уравнений приходим к результатам:
Уравнение (1) и условие дает .
Уравнение (2) и условие дает .
Уравнение (3) и условие дает .
В результате для оценки отклика справедливо соотношение:
F-статистика для проверки гипотезы H0:1=2=...=I имеет такой же вид, как и для плана с одним признаком для I генеральных совокупностей и JK наблюдений на ячейку:
и определяется выражением, представленным в табл.4.
Таблица | 4.4. |
Таблица дисперсионного анализа
Сумма квадратов | Степени свободы | |
Первый фактор | I-1 | |
Второй фактор | J-1 | |
Остаток | N-I-J+1 | |
Полная сумма | N-1 | |
Средние квадраты | F-отношение | |
Первый фактор | ||
Второй фактор | ||
Остаток |
Если гипотеза H верна, то статистика имеет F-распределение с J-1 и N-I-J+1 степенями свободы.