lr3 (542534), страница 3
Текст из файла (страница 3)
Транспонируем нашу матрицу, которая теперь имеет размер 20v13с в матрицу 13v 20c (чтобы совершать действия со столбцами):
Edit - Transponse - Data File.
Добавим в матрицу 3 столбца (с 14 по 16 для значений оценок)
Vars - Add - Number of vars: 3 - after: 13
и определим значения оценки â1:
выделим 1-й новый столбец Newvar1 - кн. Vars - Current Specs... (спецификация) - Name: A1 - Long name, согласно (1):
= Z/10 SUM
Аналогично определим значения оценок â2 и â3 ; различными будут операторы; для â2 по (2):
= 11/10 MAX
для â3 по (3):
= 2 MEDIAN
Полученные результаты (столбцы a1, a2, a3) испытаний 3 оценок на 20 выборках сохраним, чтобы в дальнейшем распечатать:
выделим a1, a2, a3 - File - Export Data - формат Text - укажем, куда поместить и с каким именем (например, a1a2a3). Можно также сохранить или распечатать первые 2 - 3 выборки-строки.
характеристики разброса для оценок:
выделим столбцы a1, a2, a3 - Edit - Block Stats/Column - SD’s (стандартное отклонение),
затем аналогично: Min’s, Max’s. Выписываем результаты в табл.1, размах вычисляем.
Сравнение размахов w и стандартных отклонений Sа для 3 оценок показывает, что оценка â2(х1, ... , хn) наиболее точна, а оценка â3(х1, ... , хn) - наименее.
Сравнение оценок â2 и â3 графически:
Graphs - Stats 2D Graphs - Line Plots (Variables) - в окне 2D Line Plots: Variables: A2 - A3, Graphs Type : Multyple, F : t (подбор распределения) : off (выключить) - ОК.
Из графика (рис.1) видно, что значения оценок находятся в окрестности 10, и что оценка â2 имеет разброс меньше, чем â3 . Распечатаем этот график:
File - Print Graphs
Рис.1 Сравнение оценок â2 и â3.
Оценивание по выборкам объема n=40 и n=160
Повторим п. 3.1 для n = 40 и n = 160.
Итоговое сравнение
Сравнение Sa(n) трех оценок графически для значений n =10, 40, 160:
образуем 4 новых переменных длины 3:
n : со значениями 10, 40, 160 ,
Sa1, Sa2, Sa3: со значениями стандартного отклонения для трех оценок.
построим графики Sa(n):
âыделим переменные Sa1, Sa2, Sa3 - Graphs - Custom Graphs - 2D Graphs - введем для Plot1 X : N, Y : Sa1, для Plot2 X : N, Y : Sa2, для Plot3 X : N, Y : Sa3 - OK.
Наблюдаем три кривые Sa(n), как функции n (рис. 2); ясно, что оценка â2 наиболее точна, â3 - наименее. График выводим на печать:
File - Print Graphs.
Рис.2. Сравнение трех оценок по стандартному отклонению.
4. Выполнение в пакете SPSS
Оценивание по выборкам объема n = 10
Сформируем k = 20 выборок объема n = 10 и определим значения оценок â1 , â2 и â3 на каждой выборке.
Подготовка требуемого числа строк:
на экране таблица с пустыми клетками; прокрутим ее до 10 строки и выделим клетку в 1 столбце; введем любой символ, например, точку - Enter. Число строк задано. Первому столбцу присвоим имя х01:
Data - Define Variable... - Variable Name: x01 - OK.
Генерация выборок:
Transform - Compute...- в окне Compute Variable Target Variable (выходная переменная): x01, Numeric Expression:
UNIFORM (10) (9)
(равномерное распределение на отрезке [0, 10] ; эту запись берем из списка Function). Если теперь ОК, то последует выполнение команды.
Можно это повторить, начиная с Transform, 19 раз (изменяя только номер переменной). Однако, в пакете можно выполнять команды не только в диалоге, но и в окне Syntax на специальном языке. В каждом диалоге есть кнопка Paste, с помощью которой получают соответствующую команду в окне Syntax.Итак, после (9)
Paste - OK.
В окне Syntax имеем текст команды
COMPUTE x01 = UNIFORM (10).
EXECUTE.
Скопируем 1-ю строку 19 раз, затем изменим имена переменных (столбцов) на х02 ÷ х20. Выделим весь текст и затем кнопка Run (EXECUTE, запускает на выполнение выделенные команды). Сохраним таблицу в файле Estim. sav на диске D:
File - Save Data - ...
Распечатаем первые 3 выборки (столбца) :
выделим их - File - Print - Selection - OK.
Определим значения оценок.
Оценка â1
Определим суммы во всех 20 выборках (20 столбцах х02 ÷ х20):
Statistics (статистики) - Summarize (простейшие) - Descriptives (описательные) - все имена переменных переносим в правый список Variables - Options...- отметим только Sum и в поле Display Order (порядок показа): Name (по порядку номеров) - Continue - OK.
В окне результатов Output - столбец сумм длины 20. Выделяем его, и с помощью Copy и Paste переносим в первый справа свободный в таблице столбец, который получает имя Var 00002. Проверим, что его длина 20, если нет, то повторим запись.
Образуем новую переменную (столбец) a1 для значений оценки â1:
-
Transform - Compute - Target Var: a1, Numeric Expression: 2 Var 00002/10 - OK.
-
Распечатаем а1.
-
Оценка â2
-
Согласно (2), определим максимум в выборках: Statistics - Summarise - Descriptives...- в правом окне х01 ÷ х20; в окне Options... отмечаем Maximum - Continue - OK. Из окна Output столбец результатов переносим в таблицу Estim; новый столбец получает имя Var 00003. Определяем значения оценки â2 аналогично â1 , но Numeric Expression:
-
Var 00002 11/10.
-
Оценка â3
-
В версии 5.0 ее вычислять неудобно из-за отсутствия операции определения медианы по нескольким переменным. Наблюдения в каждой выборке (столбце) упорядочим по возрастанию (т.е. в каждом столбце построим вариационный ряд):
-
Statistics - Summarize - Frequencies...- все столбцы х01 – х20 перенесем в правый список Variables - OK. В окне Output для каждой переменной в столбце Value находятся упорядоченные значения. Выделим столбец Value для х01 и с помощью Copy и Paste перенесем его в столбец x01; аналогично поступим с остальными.
-
Столбцы а1 и а2 выделим и скопируем в буфер.
-
Транспонируем матрицу наблюдений (операции в пакете выполняются со столбцами, но не со строками):
-
Data - Transpose - в правый список Variables переносим имена переменных х01 – х20 - ОК.
-
При транспонировании невыделенные переменные теряются.
-
Выделим 2 новых столбца и операцией Edit - Paste внесем туда содержание а1 и а2 из буфера. Присвоим этим столбцам имена а1 и а2.
-
По каждой выборке-строке определим, согласно (3), удвоенную выборочную медиану:
-
Transform - Compute...- Target Variable: a3, Numeric Expression: var 005 + var 006 -OK.
-
В столбце а3 получаем значения оценки â3 по всем выборкам.
-
Сравнение оценок графически
-
Для сравнения создадим переменную-столбец а с истинным значением параметра, равным 10. Далее:
-
Graphs - Line - Multiple, Values of individual cases - Define - в поле Lines Represent (показать линии): а, a1, a2, a3, Category Labels: Case number - OK.
-
Из наблюдаемого графика видно, что оценка â2 наиболее точна, а â3 – наименее. Распечатаем график или сохраним его.
-
Можно иначе графически наблюдать различное качество оценок: создадим три новые переменные, например, est1, est2 est3 (оценки 1, 2 и 3) , в которых запишем три различные константы, например, 1, 2 и 3. Затем
-
Graphs - Seatter... - Overlay - Define - перенесем в поле Y - X Pairs: a1, est1; затем a2, est2; затем a3, est3.
-
Наблюдаем по 20 значений трех различных оценок.
-
Сравнение оценок по стандартному отклонению и размаху
-
Statistics - Summarize - Descriptives...- в поле Variables: a1, a2, a3 (старые имена из списка убрать налево) - в Options отметить Std. Daviation, Range (размах), Minimum, Maximum - Continue - OK.
-
Сравниваем стандартные отклонения и размахи; убеждаемся, что оценка â2 точнее других, â3 – наименее точна.
-
Оценивание по выборкам объемов n = 40 и n = 160
-
Все действия повторяются.
-
Итоговое сравнение
-
Сравним графически характеристики точности Sa1, Sa2, Sa3 оценок â1, â2 и â3 при различных n. Для этого образуем переменные:
-
n, введя 10 40 160;
-
Sa1, введя 1.51 0.84 0.50 (из таблицы 1);
-
Sa2, введя 0.53 0.14 0.05;
-
Sa3, введя 2.35 1.56 0.94
-
и построим графики:
-
Graphs - Scatter...- Overlay - Define - в поле Y - X Pairs: сначала sa1, n, затем sa2, n, затем sa3, n; если в обратном порядке, то Suap Pair - OK.
-
Наблюдаем диаграмму, входим в редактор и включаем линии, имеем график зависимости S от n для трех оценок.