SASSTATHW4GENMOD (SAS-7task)
Описание файла
Файл "SASSTATHW4GENMOD" внутри архива находится в папке "STATHW4_Kazachuk". Документ из архива "SAS-7task", который расположен в категории "". Всё это находится в предмете "(ппп соиад) (sas) пакеты прикладных программ для статистической обработки и анализа данных" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Онлайн просмотр документа "SASSTATHW4GENMOD"
Текст из документа "SASSTATHW4GENMOD"
2
SAS/STAT. HOME WORK 4. GENMOD
ФИО | Казачук Мария Андреевна |
DATA
Data_for_hw.sas – содержит код для генерации необходимых наборов, кроме roots – он генерируется в roots_sample.sas
ОТВЕТ
Архив: файл с кодом – полная программа – ответ на все пункты (ХОРОШО КОММЕНТИРОВАННАЯ), в этот файл пишем только ответ по п. 3.
TASKS
-
Повторить картинки со слайдов — ppts_examples.sas.
-
Подробнейшим образом изучить roots.pdf (код оттуда - roots_sample.sas).
-
Исследовать разницу между proc reg и proc genmod – comparison.sas, Обратить внимание на:
[P1] Рассмотреть графики Y vs X, о чем они говорят?
Ответ:
На данном графике мы видим, что каждому показанию Х соответствуют по два-три показания У. Связь между Х и У нелинейная, скорее квадратичная.
[P2] Рассмотреть такой же график но в логарифмической шкале для Y. Что можно сказать?
Ответ:
При использовании log y мы наблюдаем более линейную связь между X и log y.
Вообще, логарифм используется для предсказания значения переменной, равной количеству каких-то наступлений событий.
[P3] Построить регрессию для LogY используя Proc reg. Исследовать residual plot и fit plot. Это хорошая модель?
Ответ:
Получили, что значение PR > F < 0.001. Следовательно, данная модель является точной.
На диаграмме Distribution of Residuals for Log Y мы видим, что данное распределение не подходит ни под Normal, ни под Kernel (хвосты имеют разный вес).
На диаграмме Fit Plot for Log Y мы видим, что достаточно большое количество показаний попадают в необходимую зону, R-Square = 0.9502.
Следовательно, данная модель является точной.
[P4] Построить регрессию для Y используя PROC GENMOD (опции DIST=NORMAL, LINK=LOG, OBSTATS, plots=stdreschi(xbeta)). Это хорошая модель? Сравните с предыдущим результатов ([P3]).
Ответ:
Значение Scaled Deviance = 1.1176. Значение Scaled Pearson X2 = 1.1176. Чем ближе эти значения к единице, тем точнее модель. Следовательно, наша модель является достаточно точной.
Данные две модели являются приблизительно одинаковыми по точности.