lr1 (543706), страница 6
Текст из файла (страница 6)
1) Выполнение в пакете STATGRAPHICS
а) График плотности слагаемых:
H.2.Distribution Plotting - Distribution number: 7 (Beta) - F6 - ввод значений Alpha(a) и Beta(b) - Density function - ввод параметров графика, если это необходимо - F6.
б) генерация m = 6 выборок объемом N=2000 с beta-распределением (a=b=0.5):
H.5.Random Number Generation - Distr. number:7(Beta) - F6 - ввод параметров а и b, объема выборки Number of samples: 500, контроль состояния Seed генератора случайных чисел: оно не должно превышать 21 на первых двух позициях (точнее, это число не должно превышать 2147483646) - F6 - присвоение имен: File: оставить WORKAREA (с этим именем файлы на диск не записываются), Variable: x1- F6.
Повторим генерацию еще 5 раз; получим x2 x6.
б) Образуем сумму S из 2, 4 и 6 слагаемых:
A.2. File Operation - вводим file name WORKAREA (с помощью F7, выбор необходимого слова, ENTER), operation: J(Update) - F6 - N (образоание новой переменной) - new Variable: S2 - Enter - assignment: x1+x2 - Enter (или F6).
Повторим предыдущее, начиная с N = new, для образования суммы из 4 слагаемых: S4=S2+x3+x4 и шести: S6=S4+x5+x6.
в) Убедимся в том, что все шесть слагаемых с x1 x6 распределены далеко не нормально - построим для них гистограммы:
H.1.Distribution Fitting (подбор распределения; можно было бы F.3. Frequency Histogram, однако, первый вариант удобнее, поскольку одновременно с гистограммой пакет показывает наилучшим образом подобранную нормальную плотность) - Data vector: x1- F6 - соглашаемся с параметрами подобранного нормального распределения - F6 - Histogram -поправляем предлагаемые пределы: Lower limit: 0, Upper limit: 1 - F6 - наблюдаем график - esc - esc -... до появления экрана, где задается Data - vector.
Повторяем график для x2 x6. Один из них распечатываем (F4).
г) Убедимся в том, что с ростом числа слагаемых m = 2, 4, 6 распределение (гистограммы и функции эмпирического распределения) для суммы (S2, S4, S6) приближается к нормальному.
Выполняется так же, как и предыдущий пункт, распечатываем гистограммы для S2, S4, S6; дополнительно наблюдаем гистограмму накопленных частот (режим Cumulative: Yes) в относительных единицах (режим Relative: Yes) и определяем максимальное отклонение DN НАБЛ. между эмпирическим и подобранным нормальным функциями для каждой из сумм S2, S4, S6..
2) Выполнение в пакете STATISTICA
Подготовим таблицу 9v 500c для размещения шести выборок, а в последних трех - сумм (для числа слагаемых m = 2, 4, 6).
Специфицируем переменные (столбцы):
Vars - All Specs - в окне Variables в столбце Name введем имена слагаемых x1, x2, ... x6 и имена сумм S2, S4, S6, в 4 столбце в первой строке – определяющее выражение
= VBeta (rnd (1); 0.5; 0.5),
эту запись перенесем в строки 26 с помощью операций Copy (кнопка или меню Edit - Copy) и Paste (вставить, кнопка или меню Edit - Copy); запишем выражение
для S2: = x 1 + x2,
для S4: = S2 + x3 + x4,
для S6: = S4 + x5 + x6,
закроем окно.
Выполним вычисления:
Recalculate Variable(s) (кнопка х = ? или меню Edit - Variables - Recalculate) - All Variables - OK.
Сравним гистограммы для m = 1, 2, 4, 6 слагаемых. Получим гистограмму для одного слагаемого:
выделим слагаемое, например, x1 – Quick Stats Graphs (кнопка на левой линейке или меню Graphs- Quick Stats Graphs...) - Histogram of x1 - Normal Fit. Наблюдаем гистограмму и плотность нормального распределения с параметрами, равными выборочным (рис.10). Убеждаемся в существенном отличии распределения слагаемого от нормального. Можно было также действовать через меню Graphs - Stats 2D Graphs - Histogram...
Аналогично получим гистограмму для суммы S2 двух слагаемых, для S4, для S6 (рис.11рис.13). Все 4 графика разместим на одном экране.
Убеждаемся, что уже при шести, даже четырех (!) слагаемых распределение близко к нормальному; подтверждением тому являются значения статистики Колмогорова - Смирнова К - Sd и уровень значимости p, которые указываются на графиках. Выпишем эти значения для всех 4 вариантов, а графики выведем на печать.
Рис.10. Гистограмма одного слагаеммого.
Рис.11. Гистограмма суммы двух слагаеммых
Рис.12. Гистограмма суммы четырех слагаеммых
Рис.13. Гистограмма суммы шести слагаеммых
3) Выполнение в пакете SPSS.
Образуем столбец х1 длины n = 500 и сгенерируем в него выборку, имеющую beta-распределение с параметрами a = b = 0.5. Соответствующее Numeric Expression:
(cos (UNIFORM (3,141592)) + 1) / 2.
Сгенерируем еще 5 выборок в столбцы х2 х6. Вычислим суммы S2 , S4, S6 в столбцы S2, S4, S6; соответствующие: Numeric Expression:
для S2: x1 + x2 ,
для S4: S2 + x3 + x4 ,
для S6: S4 + x5 + x6 .
Сравним гистограммы для m = 1, 2, 4, 6 слагаемых:
Graphs - Histogram - Variable: x1 (или x2 x5) - OK.
Убеждаемся в существенном отличии распределения слагаемых от нормального.
Аналогично получим гистограмму для S2 , S4, S6. Убеждаемся, что уже при шести слагаемых распределение близко к нормальному; подтверждением тому являются значения статистики Dn Колмогорова - Смирнова:
Statistics - Nonparametric Tests - 1 - Sample K - S - Test Variable List: S2 (затем S4 и S6) - Test Distribution: Normal - OK.
В окне Output находим значение статистики Dn Most extreme differences Absolute: 0.025 (например, для S4), нормированная статистика Dn ( K - S Z): 0.572 и уровень значимости 2 - Tailed: 0.85, большая величина которого свидетельствует в пользу нормального распределения.
Выпишем эти значения для всех 4 вариантов, графики сохраним или выведем на печать.
5.3. Различно распределенные слагаемые
Распределение суммы сходится к нормальному и в том случае, когда слагаемые распределены по различным законaм.
Задание 1. Оценить экспериментально распределение для суммы шести слагаемых, распределенных по различным законам; выберем их из семейства beta-распределений (13), задав следующие параметры:
1 | 2 | 3 | 4 | 5 | 6 | |
a | 1 | 0.5 | 1 | 1 | 2 | 2 |
b | 0.5 | 1 | 1 | 2 | 1 | 2 |
Сгенерируем выборку для суммы и построим гистограмму для нее. Убедимся в том, что распределение близко к нормальному. Распечатаем гистограммы для слагаемых и для суммы.
Если же в сумме (12) имеется слагаемое, дисперсия которой существенно превышает все остальные, то приближенная нормальность места не имеет.
Задание 2. Проверить это (получить гистограмму), добавив в (12) 7-е слагаемое, имеющее beta-распределение с параметрами a=b=0.5 и умноженное на 1000.
1) Выполнение в пакете STATGRAPHICS
Убедимся в том, что все 6 плотностей далеки от нормальной: построим графики:
H.2.Distribution Plotting - Distribution number: 7 (Beta) - F6 - ввод значений Alpha(a) и Beta(b), не более пяти (a=1, b=1 не вводим: это равномерное на [0,1] распределение)-Density function - ввод параметров графика - F6.
Полученное изображение плотностей распечатаем (F4).
Выполним до конца задание 1.
Выполним задание 2.
2) Выполнение в пакете STATISTICA
Убедимся в том, что все 6 плотностей далеки от нормальной: построим графики плотностей beta - распределения с параметрами, указанными в таблице:
Analysis - Probability calculator - в появившемся окне в поле Distribution выбираем Beta, в поле shape 1: и shape 2: вводим значения параметров - Compute.
Наблюдаем графики плотности и функции распределения. В этом же окне можно по заданному аргументу вычислить функцию распределения и наоборот: по заданной вероятности p вычислить p-квантиль.
Выполним до конца задание 1.
Выполним задание 2.
3) Выполнение в пакете SPSS
Сгенерируем слагаемые с заданными в таблице параметрами в соответствии со следующими формулами (в порядке нумерации):
последнее, 6-е слагаемое, с параметрами a = b = 2 :
(1+ln(12) / ln(34))-1,
где 1, ..., 4 - независимые R[0,1] случайные величины. Проверкой можно убедиться в справедливости формул.
Убедимся по гистограммам в том, что все 6 слагаемых явно не нормальны. Убедимся в том, что сумма 6 слагаемых близка к нормальной случайной величине. Графики сохраним.
Выполним до конца задание 1.
Выполним задание 2.