3_Регрес (Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ), страница 7
Описание файла
Файл "3_Регрес" внутри архива находится в папке "Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ". Документ из архива "Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ", который расположен в категории "". Всё это находится в предмете "математический анализ" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "высшая математика" в общих файлах.
Онлайн просмотр документа "3_Регрес"
Текст 7 страницы из документа "3_Регрес"
Для проверки гипотезы H0: yx x1x2=0; x=1..p; xx1; xx2
Если все значения F-включения меньше установленного минимума, то переход к шагу S. В противном случае переход к шагу 3.
Шаг 3.
1) Пусть L обозначает набор из l независимых переменах, которые включены в уравнение регрессии. Если какое-либо из значений F-исключения для переменных из L меньше, чем соответствующий минимум, то переменная, которой соответствует наименьшее значение F-исключения, удаляется из набора и выполняется шаг 3.
Если для всех перемененных, не входящих в L, значение F-включения меньше установленного минимума, то выполняется шаг S. В противном случае в набор L добавляется переменная, которой соответствует максимальное значение F-включения, и l заменяется на l+1.
2) Вычисляется множественный коэффициент корреляции r между Y и переменными из L, а также значения F-исключения между Y и переменной X из L при заданных остальных l-1 переменных из L.
Каждая из этих величин имеет 1 и n-l-1 степеней свободы и используется для проверки гипотезы Р: к =0. Определяется величина частного коэффициента корреляции и значение F-включения между Y и каждой переменной X не входящей в L*, при заданных переменных из L. Переход к шагу 4.
Шаг 4. Переход к шагу S, если:
-
F-включения для всех переменных, не входящих в L, меньше установленного минимума;
-
для всех переменных из L значение F-исключения больше установленного минимума;
-
число включенных переменных равно p.
Иначе переход к шагу 3.
Вариации количеством включенных и исключенных приводят к различным алгоритмам пошаговой регрессии.
Метод множественной корреляции (К-метод). В этой процедуре для включения переменных используется правило, основанное на величине F-включения, но правило удаления существенно изменено. Удаление переменной выполняется на основании правила R2 , т.е. если в результате удаления происходит увеличение (не обязательно значимое) множественного коэффициента корреляции. Рост множественного коэффициента корреляции возможен, в силу того, что является функцией величин: s - остаточного среднего квадрата; p - числа используемых переменных и др. Следовательно, вполне возможно, что совместное изменение двух указанных величин приведен к увеличения R2 . Итак, рассматриваемая процедура предполагает: - удаление переменных на основе правила R2 ;
Добавления переменных выполняется на основе правила F-включения.
Метод множественной корреляции с заменой переменных. Эта процедура аналогична R2-методу, за исключением того, что дополнительно допускается замена переменных. Последовательность имеет вид:
-
удаление переменной с использованием правила R2;
-
замена переменных по критерию возрастания R2 ;
-
добавление новой переменной с использованием правила F-включения.
Стандартное правило остановки осуществляет контроль числа переменных с помощью величины, называемой допустимый минимум F-включения, значение которой задается программно. Величине F-включения соответствует величина максимума уровня значимости .
Statistica. Проведем анализ модели прогноза объемов перевозок на основе пошаговой регрессии, для выделения наиболее значимых показателей, указав для значений статистик включения и исключения значения 2.0 и 1.0 соответственно. На рис.16. приведен экран формирования результатов пошаговой регрессии, содержащий основные статистики.
Формирование результатов пошаговой регрессии
Рис. | 3.16. |
Так, получено, что коэффициент корреляции равен 0.93, что незначительно ниже модели прогноза по всем показателям (0.94). В данном случае в модель включено всего 6 факторов (табл.9.) вместо 14, которые использовались в множественной регрессии.
Таблица | 3.9. |
Оценки параметров регрессии
B | St. Err. of B | t(20) | p-level | ||
Intercpt | -88,1909 | 32,06905 | -2,75003 | ,010322 | |
1 | KACS | 1,4886 | ,26318 | 5,65636 | ,000005 |
2 | KPFC | 234,9749 | 57,39774 | 4,09380 | ,000327 |
3 | PGTI | 27,1232 | 11,03138 | 2,45873 | ,020387 |
4 | PRZN | ,1771 | ,07603 | 2,32876 | ,027315 |
5 | GRSR | -5,8782 | 1,64785 | -3,56721 | ,001323 |
6 | KAZN | 1,5632 | ,56875 | 2,74851 | ,010359 |
В последней таблице показатели для модели прогноза приведены в порядке значимости. Так, наиболее значимым оказался параметр KACS (количество автомобилей, работающих по временному тарифу). График модели прогноза по выделенным показателям приведен на рис. 17.
Прогноз пошаговой регрессии
Рис. | 3.17. |
Сравнивая последний график с графиком прогноза по всем показателям, видим, что качество оценки изменилось незначительно, хотя вместо 14 показателей в модели использовалось всего 6. Этот факт подчеркивает таблица 10. дисперсионного анализа
Таблица | 3.10. |
Дисперсионный анализ пошаговой регрессии
Sums of Squares | df | Mean Squares | F | p-level | |
Regress. | 2071,278 | 6 | 345,2130 | 30,86278 | ,000000 |
Residual | 313,192 | 28 | 11,1854 | ||
Total | 2384,470 |
Сравнивая последнюю таблицу с таблицей дисперсионного анализа множественной регрессии видим, что значение F-отношения (30,86) в данном случае даже превышает соответствующий показатель множественной регрессии, равный 11,66 в таблице 6. Это объясняется существенным снижением размерности модели при незначительном снижении точности прогноза.
3. 1
3.1. Модели регрессионного анализа 1
3.2.Простая регрессия 4
3.2.1. МНК-оценки параметров 5
3.2.2. Анализ качества модели 7
3.2.3. Преобразование линейной модели 10
3.3. Множественная регрессия 12
3.3.1. МНК-оценки параметров регрессии 13
3.3.2. Анализ качества модели 16
3.3.3. Линейные оценки 20
3.3.4. Гребневая регрессия 23
3.3.5. Анализ выбросов 25
3.4. Нелинейный регрессионный анализ 26
3.5. Пошаговая регрессия 29
Рис. | 3.18. | |||
Таблица | 3.11. |
(3.1) |
Регрессионный анализ