lr2 (Лабник), страница 3
Описание файла
Файл "lr2" внутри архива находится в папке "Лабник". Документ из архива "Лабник", который расположен в категории "". Всё это находится в предмете "вычислительные машины, системы и сети (вмсис)" из 7 семестр, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "вмсс" в общих файлах.
Онлайн просмотр документа "lr2"
Текст 3 страницы из документа "lr2"
Функция эмпирического распределения
Первый способ:
Graphs - Stats 2D Graphs - Histogram - в появившемся окне установим: Graph Type : Regular, Cumulative Counts (накопленные частоты), Fit Type (подбираемый тип) : Exponential (для нашего примера) или off (без подбора), Variablles: x, Categories (число интервалов группирования) : 250 - OK.
Наблюдаем график функции эмпирического распределения (рис. 3). График можно отредактировать: изменить линии, точки, фон, шкалы, надписи; для этого необходимо подвести стрелку в нужное иесто и дважды щелкнуть левой клавишей мыши. Выведем его на печать или сохраним.
Рис.3. Функция эмпирического распределения
Второй способ:
упорядочим по возрастанию нашу выборку (см. Построение вариационного ряда);
образуем новую переменную F для значений функции:
клавиша Var - Add - ... ( см. Генерация выборки) - выделим новую переменную NEWVAR - правая клавиша мыши - Variable Specs ... - Name: F - Long name:
= V0/50
(оператор V0 создает массив целых чисел) ; построим график:
Graphs - Custom Graphs - 2D Graph - в новом окне установим: в поле X: x, в поле Y: F, Step Plot (ступеньки, но не Line Plot - линии) - OK.
Наблюдаем функцию эмпирического распределения (с точностью до мелкого группирования с 250 интервалами).
Группирование данных
Analysis Frequency Tables - в окне Frequency Tables зададим No of exact intervals: 10 (10 интервалов группирования; или Step size: 2, starting at: 0), в поле Display options отметим Cumulative frequences ( накопленные частоты ), Percentages (проценты - относительные частоты), Cumulative Percentages (накопленные частоты ) - OK.
Наблюдаем таблицу группированных данных. Выведем ее на печать или сохраним.
Построение гистограммы частот
Graphs - Stats 2D Graphs - Histograms - в появившемся окне устанавливаем: имя переменной, Graph Type: Regular, Fit Type; off ( без подбора ) или нужный тип, число интервалов группирования Categories: или Auto (автоматический выбор числа интервалов) - OK.
Наблюдаем гистограмму (рис. 4). Отредактируем график, если необходимо. Выведем на печать или сохраним.
Рис. 4. Гистограмма.
Выборочные характеристики
первый способ: на заголовке столбца с выборкой щелкнем правой клавишей мыши - Quick Basic Stats... - Descriptives of var - получаем таблицу с характеристиками: mean (среднее), Confid 95% ( доверительные границы нижняя и верхняя с уровнем доверия 0.95 ), Sum ( сумма ), Minimum, Maximum, Range ( размах ), Variance ( дисперсия ), Std. Dev. ( стандартное отклонение ) и др. Сравним выборочное среднее, медиану и стандартное отклонение с соответствующими теоретическими значениями. Это же можно сделать через меню: Anflisis - Quick Basic Stats ...
Второй способ: на заголовке столбца с выборкой щелкнем правой клавишей мыши - Block Stats / Columns (блок статистик по колонкам ) - выделим необходимое или All.
Описание двумерных выборок
Ввод данных: зададим новую таблицу 232, назовем столбцы X и Y. Заполним таблицу вручную заданными в табл.2 значениями.
Диаграмма рассеяния:
Graphs - Stats 2D Graphs... - Scatterplots... - вводим значения по осям X и Y (нажав на кнопку Variables и выбрав переменные ) - OK.
Распечатаем диаграмму (рис. 5) или сохраним.
Рис. 5. Диаграмма рассеяния
Выборочные характеристики.
Выделим те переменные, по которым требуются выборочные характеристики - щелкнем правой клавишей мыши - Quick Basic Stats - Descriptivs of VARS... Наблюдаем таблицу выборочных характеристик (тех же, что иыше). Отпечатаем таблицу или сохраним.
Выборочные характеристики можно внести в таблицу данных, в конец соответствующих столбцов. Выделим нужные столбцы, далее см. вторую часть п. Выборочные характеристики..
Определим корреляционную матрицу:
Analysis - Correlation matrices - Two lists - First list: All - Second list: All - OK - Cancel (отмена предложения на новую матрицу).
Матрицу отпечатаем или сохраним.
двумерная гистограмма (рис. 6).
Graphs - Stat 3D Sequential Graphs - Bivariate Gistogram - установим по осям X и Y требуемые переменные ( кнопкой Variables ), зададим число интервалов по каждой оси - OK.
Распечатаем гистограмму.
Рис. 6. Двумерная гистограмма.
4.Выполнение в пакете SPSS
Предварительно отметим:
1) диалоги заканчиваются нажатием кнопок ОК, Define или Continue для исполнения или Cancel для отмены;
-
кнопка со стрелкой (треугольником) означает перемещение выбранного элемента из одного списка в другой в направлении стрелки.
Генерация выборки
Сгенерируем 2 выборки с заданными законами распределения, например, выборки объема n = 50 c нормальным законом распределения со средним 5 и стандартным отклонением 1 и показательным (экспоненциальным) законом со средним 5.
Заготовим таблицу с 2 столбцами и n = 50 строками:
на экране таблица с пустыми клетками; прокрутим ее до 50-й строки и выделим клетку во 2-м столбце - введем любой символ, например, точку - Enter. Таблица 50 2 образована.
Создадим соответствующий файл на диске в D:\TMP:
File - New - Data - на вопрос save ...? отвечаем Yes - в окне Save As Data File : Name : D:\TMP WORK. SAV (например) - ОК.
Присвоим переменным удобные имена х1 и х2:
выделим первый столбец, кликнув мышью по заголовку - Data - Define Variable...(определение переменной) - Variable Name: x1 - OK.
Аналогично - второй столбец.
Сгенерируем выборку с нормальным распределением:
Transform (преобразование) - Compute (вычислить) - в поле Target Variable (выходная переменная - столбец) введем имя переменной, в которую будет занесен результат: х1; в списке Functions выделим NORMAL (stddev) (standart deviation - стандартное отклонение), перенесем в поле Numeric Expression (вычисляющее выражение): NORMAL (1) + 5 - OK - Change...? - OK.
Сгенерируем в х2 выборку с показательным распределением со средним 5: действия аналогичны предыдущим, однако, Numeric Expression:
- 5 LN (UNIFORM (1)),
поскольку случайная величина - a ln,, где R [0, 1], имеет показательное распределение со средним а; оператор UNIFORM (x) генерирует равномерно на [0, x] распределенные случайные числа.
Посмотрим выборку графически:
Graphs - Line - выберем Simple (простой), в поле Data in Chart Are (данные для графика) выберем Values of individual cases (значения отдельных наблюдений) - Define - â появившемся окне Define Simple из левого списка переместим кнопкой - стрелкой х1 в поле Line Represent - OK.
Наблюдаем график; его можно отредактировать (кнопка Edit); сохраним его:
File - Save As - Name: Fig1.cht. (например) - ОК
или распечатаем: File -Print...
Посмотрим выборку х2: действия аналогичны.
Сохраненные графики можно посмотреть еще раз:
File - Open - Chart ... - в поле Files: выделим Fig1 - OK.
Построение вариационного ряда
Data - Sort Cases... - в поле Sort by: x1 (переносом из левого списка), в поле Sort Orden: Ascending (возрастание, в отличие от Descending - сортировка по убыванию) - ОК. Сортировка проводится по указанной переменной - столбцу х1, но сразу для всех столбцов.
Построение графика функции эмпирического распределения
Сначала построим график для выборки х1:
Statistics - Summarize - Frequencies...- в поле Variable(s): x1, отметим Display frequency tables (показ таблицы частот) - ОК. В окне Output (выход - окно результатов и протокола работы) появляется таблица, первый столбец которой Value (значение) - вариационный ряд, пятый - Cum. Percent (накопленные частоты в процентах) - соответствующие значения функции эмпирического распределения в процентах. Переносим столбец Value в таблицу WORK:
выделяем столбец Value (если в столбце Value имеются пустые клетки, следует выделить соответствующие строки и их удалить) - Edit - Copy (копирование в буфер) - выделяем в таблице WORK первый справа свободный столбец: Var - Edit - Past (вставить) - получаем новый столбец с вариационным рядом. Для удобства присвоим ему имя х1v (например) (выполнение см. выше).
Аналогично переносим столбец Cum. Percent и назовем его F (например). Строим график: Graphs - Scatter...- Simple - Define - Yaxis: F, X Axis: x1v - OK - Edit - кнопка * в окне Markers (метки) выберем точку , Apply All - закроем окно Markers - кнопка и линии (в виде зигзага) - выберем Left step (левые ступеньки), Apply All - Close.
Наблюдаем функцию эмпирического распределения; сохраняем график или распечатываем.
Аналогично строим функцию эмпирического распределения для выборки х2. Сравниваем эти две функции.
Построение гистограммы частот
Построим гистограмму для выборки х1: Graphs - Histogram...- Variable: x1 - OK. Наблюдаем гистограмму; сохраним ее или распечатаем.
Аналогично - для х2.
Определение выборочных характеристик
Statistics - Summarize - Descriptives...- Variable(s): x1, x2, убираем выделения внизу - Options - отмечаем нужное: Mean, Sum, Std. Deviation (стандартное отклонение), Range (размах), Minimum, Maximum - Continue - OK.
Наблюдаем таблицу, в которой показаны отмеченные характеристики для обеих выборок. Выделяем таблицу и сохраняем ее:
File - Save As - Name: Descr. Lst (например) - ОК. Сравниваем выборочные средние и стандартные отклонения с теоретическими.
Проверка гипотезы о типе распределения
Проверим обе наши выборки с помощью критерия Колмогорова - Смирнова на нормальность распределения и равномерность:
Statistics - Nonparametric Tests - 1 Sample K - S - в поле Test Variable List: x1, x2 (переносом из списка слева), в поле Test Destribution отметим Normal, Uniform - OK.
В окне Output даются результаты тестирования двух выборок по двум гипотезам: итого 4 сообщения. Например, результат тестирования х1 на нормальность (Test distribution - Normal): приводятся параметры гипотетического распределения (оценки) Mean è Standart Deviation; статистика Dn Колмогорова (Most estreme differences Absolute), z = Dn (K – S Z) и уровень значимости 2 – Tailed P; если последний порядка сотых долей или меньше, гипотезу следует отклонить.
Выписываем упомянутые значения и делаем выводы.
Заметим, что такой способ проверки при отклонении гипотезы можно считать корректным, а при принятии - это не совсем так (см. более подробные руководства по статистике).
Описание двумерных выборок