Главная » Просмотр файлов » Лекция 5. Программирование на языке SAS. шаг PROC_ ODS

Лекция 5. Программирование на языке SAS. шаг PROC_ ODS (1185378)

Файл №1185378 Лекция 5. Программирование на языке SAS. шаг PROC_ ODS (Лекции 2015)Лекция 5. Программирование на языке SAS. шаг PROC_ ODS (1185378)2020-08-25СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла

Программирование на языке SASЛекция 7 (шаг PROC для построения отчетови описательных статистик, ODS)Авторы материалов:Звежинский Дмитрий (SAS Russia/CIS), dmitry.zvezhinsky@sas.comПетровский Михаил (ВМК МГУ, SAS Russia/CIS), michael@cs.msu.su1Расчет описательных статистик и построениеотчетов• Функции:– можно использовать в любых выражениях• Процедуры шага PROC:– PRINT – вывод содержимого набора данных– MEANS – расчет базовых статистик– TABULATE и REPORT – построение гибких табличныхотчетов– UNIVARIATE, FREQ, CORR– отчеты в виде таблиц частот свозможностью проверки гипотез и анализазависимостей2Базовые функции для расчета описательныхстатистик• Скалярные функции от множества значений F(x1,…,xN)– Игнорируют пропуски (в том числе при подсчете числа наблюдений):n(1,.,3.4,55,1,.,34,2.1,.); вернет 6– Можно применять по шаблону имен переменных или целиком к массиву: std(of x1x1000) иди array ar {5} (1,4,6,7,2); a=max(of ar{*});– Можно использовать во всех выражениях– Считаются многоми процедурами для построения отчетов (будет дальше)•Основные функции:– N (число непустых наблюдений), MEAN, MAX, MIN, NMISS (число пропусков), MEDIAN– KURTOSIS (коэф.

эксцесса),– SKEWNESS (коэф. ассиметрии),– SUM (сумма), USS (нескорректированная сумма квадратов), CSS (скорректированнаясумма квадратов) = CSS – MEAN*SUM;– VAR (дисперсия) = CSS/(N-1), STD (стандартное отклонение) =SQRT(VAR), STDERR(стандартная ошибка) = SQRT(VAR/N)3– RANGE (разброс) = MAX-MINПроцедура для вывода содержимого набораданных PROC PRINT•Распечатка набора данных (листинг) в виде отчета.PROC PRINT <option(s)>;BY <DESCENDING> variable-1 <…<DESCENDING>variable-n>;….VAR variable(s) <option>;•••••В заголовке PROC Print указывается название набора данных и некоторыенастройки отчета.Оператор By (не обязательный) задает разбивку отчета по указаннымпеременным (требуется предварительная сортировка набора данных)Оператор ID (не обязательный) задает новые имена колонокОператор Var (не обязательный) задает структуру отчета, в немперечисляются переменные, которые мы хотим вывести в отчет и их формат.Если этого оператора нет – выводятся все столбцы из набора данных.Пример:1 proc print data= ecprg1.customer noobs;2 var customer_id country gender;3 run;* Base SAS® 9.3 Procedures Guide -> PRINT Procedure4Группировка и ограничения на шаге процедур• Группировка BY (есть в большинстве статистических, графических и«отчетных» процедур SAS)– Обработка набора не целиком, а отдельно по группам– Весь вывод процедуры дублируется для каждой группы (таблицы, графики,заголовки, комментарии), но свои для каждой группы– Можно кастомизировать вывод (см.

системную опцию BYLINE )– Набор должен быть предварительно отсортирован по BY переменным!!!!• Группировка Class (во многих статистических процедурах MEANS, REG,SUMMARY, TABULATE и друих)– Группировка по категориальным переменным и зависит от логики процедуры, невсегда подразумевает отдельную обработку набора по частям– Вывод также зависит от процедуры, не всегда просто дублируется– Не нужна предварительная сортировка!!!• Опция WHERE:– Многие процедуры поддерживают WHERE опцию с функцианалом аналогичнымфункционалу в наборах данных– например:5Процедура для расчета статистики набораданных PROC MEANS• Отчет с описательной статистикой для набора данных (в том числе сразбивкой по классифицирующей переменной)proc means data=ecprg1.monthly_prices n mean max min;var unit_cost_price;class month;run;Процедура умеет рассчитывать ~ 30 разных статистик для выборки, в том числе:•••Описательные статистики, такие как CLM, NMISS, RANGE, SKEWNESS, KURTOSIS, STDERR,VAR, STD, SUM и другиеСтатистики по квантилям, такие как MEDIAN(P50), Q3(P75), P1, P99, P5, P95, Q1(P25),QRANGE и другиеМожно задавать имя пееременной с весами (weights) и переменной с частотами (freq)6Расчет статистик по многомерным комбинациямкатегориальных переменных в в PROC MEANS• Настройки группировки категориальных переменных– По умолчанию перебираются все варианты группировки– В операторе ways можно задавать число вариантов группировкикатегориальных переменных, заданных в class– В операторе types можно задавать варанты группировки в явном виде,например, types var1*(var2 var3), где список равноправных (негруппируемых вместе) переменных разделен пробелами и взят в скобки,а звездочка между переменнымиили списком означает полный переборвариантов, разделенных звездочкой,например:7Вывод результата в набор данных в PROC MEANS• В операторе OUTPUT можно задавать:– имя выходного набора данных– перечень статистик для вывода, отличный от указанных в обращении кпроцедуры!– Формируется выходной набор со служебными переменными _type_ и_freq_, которые указывают уровень группировки и число наблюдений вуровне8Процедура построения отчетов PROC REPORT• Предназначена для построения гибких отчетов.

Общийсинтаксис:PROC REPORT data=<input dataset> out=<output dataset> options;WHERE <optional>;Ограничивает выборкуCOLUMN list of variables;Задает структуру колонокDEFINE variable 1 / column attributes;отчета, включаяDEFINE variable 2 / column attributes;вложенные и….вычисляемые колонкиDEFINE last variable / column attributes;COMPUTE block <optional>;Описывает свойстваBREAK statement <optional>;каждой колонки отчетаRBREAK statement <optional>;В этом блоке создается новыеRUN;вычисляемые переменныеСоздает строку сфинальным итогом отчетаСоздает строку с промежуточнымитогом до или после группирующейпеременной9Определение структуры колонок в PROC REPORT••Структура колонок в разделе COLUMN – список колонок, возможно свложениями: COLUMN Var1 Var2 (Var3 Var4 Var5) Var6 Var7В разделе DEFINE описывается как будет использоваться переменная:– GROUP для группировки наблюдений; ORDER для сортировки; ANALYSIS для расчетавыбранной статистики (по умолчанию сумма), COMPUTED указывает что колонкавычисляемая.••В разделе COMPUTE задаются правила для вычисления колонокВ разделе BREAK и RBREAK задаются правила для расчета итогов10Процедура построения отчетов PROC TABULATE• Также предназначена для построения отчетов с учетом:– Иерархий переменных– Возможности форматирования и задания текстовых описаний дляэлементов таблицы– Расчета ряда статистик, в том числе квантильных– By группировки– Весов и частот, которые можно задавать через переменные входногонабора– А также комбинаций категориальных переменных, которые можноподгружать из внешнего набора данных• Общий синтаксис (основные разделы):PROC TABULATE data=<input dataset> out=<output dataset> options;CLASS class-variables;Категориальные переменныеVAR analysis-variables;группировкиTABLE row-expression,Числовые переменные дляcolumn-expression</options>;расчета статистикRUN;Описание структуры таблицыОписание структуры таблицы в PROC TABULATE•Структура таблицы:– Состоит из двух (колонки на столбцы) или трех (колонки на столбцы на страницы)измерений, их описания разделены запятыми– Последнее измерение – колонки, предпоследнее – строки, первое (если есть) –страницы– Каждое измерение задается списком (возможно вложенным) элементов.

Если ониразделены пробелом, то элементы идут в таблице последовательно, еслизвездочкой, то формируется их комбинация в ячейке– В разделах Label и KeyLabel задаются текста для названий колонок и ячеек•Пример:Расчет одномерных статистик PROCUNIVARIATE• Для чего используется процедура:– Расчет базовых описательных статистик (включая эксцесс иасиметричность), квантилей, процентилей, таблиц частот,выбросов (по k экстримальных наблюдений из левого и правогохвоста распределения)– Построение гистограмм распределений переменных, сприближением распределений ядерными функциями– Построение графика функции вероятности– Сравнение наблюдаемого распределения с одним изтеоретических распределений (нормальное, бета, гамма,логнормальное и другие) с помощью графиков плотностираспределений, квантиль-квантиль графиков (Q-Q plots),процентиль-процентиль графиков (P-P plots), а также формальныхоценок– Создание выходного набора данных с расчитаннымистатистиками, интервалами гистограммы и параметрамитеоретических распределений13Синтаксис PROC UNIVARIATEPROC UNIVARIATE < options > ;CLASS variable(s) < / KEYLEVEL= value >;VAR variable(s) ;BY variable(s) ;HISTOGRAM < variables > < / options > ;FREQ variable ;ID variable(s) ;INSET keyword-list < / options > ;OUTPUT < OUT=SAS-data-set > .

. . < percentile-options >;PROBPLOT < variable(s) > < / options > ;QQPLOT < variable(s) > < / options > ;WEIGHT variable ;RUN;• Параметры CLASS (с точки зрения вывода результата работает как BY), VAR, BY, FREQ,WEIGHT, ID, OUTPUT – как и в других статистических процедурах (например, в MEANS)• HISTOGRAM – настройки процедуры построения гистограмм• QQPLOT, PROBPLOT – настройки графиков для сравнения распределений14Описание переменной с помощью PROC UNIVARIATE15Анализ распределения переменной• Проверка гипотезы о заданном параметре положения (мат.

ожидании)• Проверка соответсвия квантилей и процентилей распределений16Таблицы частот PROC FREQ• Позволяет задавать структуру одномерных и многомерных таблицчастот через найстройку :– Можно задавать список таблиц– Все переменные в описании таблицсчитаются категориальными– По умолачиню считает частоту, процент,процент по строке, процент по колонке– Можно отключать через опции таблицы / NOROW, / NOCOL, / NOPERCENT,/ NOCUM– Можно использовать для проверки гипотез– Можно перенаправить вывод таблицы сразу в набор данных– Можно строить графики17Синтаксис PROC FREQPROC FREQ <options> ;BY variables ;EXACT statistic-options </ computation-options> ;OUTPUT <OUT=SAS-data-set> options ;TABLES requests </ options> ;TEST options ;WEIGHT variable </ option> ;RUN;•••BY, WEIGHT, OUTPUT, WEIGHT – как в других процедурах (class группировки нет,т.к.

она определяется структурой таблиц)EXACT, TEST – настройки для проверки гипотезTABLES – основная настройка, задающая структуру таблиц: описание таблицчерез пробел или в отдельных разделах TABLES, структкра таблицы – списокпеременных через звездочку, число переменных – «размерность» таблицычастот. N>2 мерные таблицы визуализируются как набор двухмерных.18Проверка простых гипотез с помощью PROCFREQ• Хи2 для одномерной таблицы:• Хи2 для таблицы 2x2– Проверка гипотезы онезависимости переменных19Графики и вывод результатов во внешнийнабор данных в PROC FREQ• В опции out в разделе tables можно указать целевой набор данных иперечень выводимых результатов• В опции plots можно указать тип графика, который зависит от типатаблицы и выбранной процедуры проверки гипотезы– Самый общий график (можно построить всегда) – столбчатая диаграмма (freqplot)– Deviationplot – График отклонения ожидаемых частот от наблюдаемых– Всего около 10 разных типов графиков20Анализ корреляции с PROC CORR• Расчитывает:– коэф.

Характеристики

Тип файла PDF

PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.

Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.

Список файлов лекций

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6353
Авторов
на СтудИзбе
311
Средний доход
с одного платного файла
Обучение Подробнее