lr1 (543706), страница 2
Текст из файла (страница 2)
Рассмотрим случайную величину, распределенную по закону Коши с плотностью
Заметим, что плотность симметрична относительно нуля, однако, 0 не является математическим ожиданием; это распределение не имеет математического ожидания. Напомним, что математическим ожиданием называется , если
; последнее, очевидно, для распределения Коши не выполняется. Для последовательности независимых случайных величин, распределенных по закону Коши (3), закон больших чисел не выполняется. Если бы среднеарифметическое
сходилось с ростом n к какой-либо константе, то, в силу симметрии распределения, такой константой мог быть только 0. Однако, 0 не является точкой сходимости. Действительно, можно показать, что при любом >0 и при любом сколь угодно большом n
с вероятностью arctg . (Поясним сказанное: с помощью характеристических функций легко показать, что
распределена по (3), а функция распределения для (3) есть arctg x). Эта вероятность, как видно, не стремится к 0 с ростом n. Например, если = 0.03, то вероятность выполнения (4) равна приближенно P 0.98, т.е. событие (4) практически достоверно, и можно уверенно ожидать его выполнения с одного раза. Если =1, то вероятность (4) равна 0.5, и выполнение его хотя бы раз можно уверенно ожидать, проделав 7 экспериментов (т.к. вероятность невыполнения ни разу равна (0.5)7 = 1/128). И это при любом фиксированном n, например, n = 1000. Проверим это экспериментально.
При выполнении в пакетах, где нет закона Коши, учтем, что, если случайная величина X распределена равномерно на отрезке длины , то случайная величина
Y = tg X (5)
имеет плотность (3). Сгенерируем 7 выборок объемом n=1000 и проверим (4) при =1.
1) Выполнение в пакете STATGRAPHICS
а) Сгенерируем 7 выборок (переменные x1,...,x7) объемом n с распределением R [-1, 1 ], разместив их в файл с именем LIMIT (как и выше).
б) Для экономичного использования рабочей области WORKAREA оперативной памяти часть операторов, в том числе TAN (тангенс), необходимо загружать процедурой V.1.Load Operators and Functions (загрузка операторов и функций); выполним ее, выбрав внутри нее опции Mathematical functions и Read (после использования ненужных операторов рекомендуется выгрузить их опцией Erase).
в) Получим 7 выборок, распределенных по закону Коши:
выберем процедуру A.2.File Operations (операции с файлами), введем имя файла LIMIT в окне file name; в окне Desired operation клавишей "пробел" установим операцию J, что означает, в соответствии с приводимым на экране списком, операцию Update (изменение);
в нижней части экрана указаны операции; выберем операцию A (ASSIGNMENT - назначение), нажав на клавишу A; в ответ на запрос пакета Enter assignment (ввести значение), введем по (5) определяющее выражение
TAN (1.570796*x1)
после его выполнения на месте переменной x1 будет располагаться выборка, распределенная по закону Коши; повторим это для x2, ..., x7.
г) Вычислим среднеарифметические для семи выборок (аналогично fn в п.1); убедимся в том, что хотя бы раз из семи событие (4) выполняется. (Если же это не так, значит, нам крупно не повезло: произошло событие с вероятностью, меньшей 0.01)
д) В заключение этого примера посмотрим гистограмму выборки (в различных диапазонах по оси абсцисс); обратим внимание на то, что имеются редкие наблюдения, отстоящие очень далеко от центра (точки 0).
Выполняется процедурой F.3.Frequency Histogram (гистограмма частот). Использовать по оси абсцисс диапазоны: полный (предлагаемый пакетом), 400, 200, 100, 50, 20, 10, 6.
2) Выполнение в пакете STATISTICA
Сгенерируем 7 выборок объема n = 1000 с распределением Коши и определим по каждой среднее значение.
а) Заготовим таблицу 7v 1000c, изменив имеющуюся.
б) Сгенерируем выборки.
Vars - All Specs - выделяем любую клетку в 4 столбце и вводим определяющее выражение, соответствующее плотности (3),
= VCauchy (rnd (1); 0; 1)
здесь а = 0 – параметр сдвига, b = 1 – параметр масштаба в плотности
переносим выражение в остальные 6 клеток:
Edit - Copy (переносим запись в буфер), выделяем другую клетку и
Edit - Paste (вставляем запись); это же можно сделать короче с помощью кнопок Copy и Paste; закрываем окно и исполняем
кнопка Х = ? (Recalculate) - All variables - OK.
в) Определим среднее значение на всех 7 выборках:
выделим всю матрицу (щелчок на пересечении заголовков строк и столбцов) - Edit - Block Sats/Columns - Means.
Убеждаемся, что хотя бы в одной выборке модуль среднего превосходит 1. Если же это не так, то нам крупно не повезло: произошло событие с вероятностью менее 0,01.
г) Посмотрим график выборки из распределения Коши (рис.1):
Graphs - Stats 2D Graphs - Line Plots (Variables)... - в поле Line Plots вводим Variables: x1 (например), Graph Tipe: Regular, Fit: off.
обратим внимание на то, что имеются редкие наблюдения, отстоящие очень далеко от центра распределения – точки 0.
Рис. 1.Выборка наблюдений, распределенных по закону Коши (N = 200).
3) Выполнение в пакете SPSS
Сгенерируем 7 выборок объема n = 1000 с распределением Коши и определим по каждой среднее значение.
а) Образуем вектор - столбец длины n = 1000 удвоением (см. выше), начав, например, с 125. присвоим ему имя:
Data - Define Variable... - Name: x1 - OK.
б) Сгенерируем выборки:
Transform - Compute - Target Variable: x1, Numeric Expression:
UNIFORM (3,14159265).
Повторим это для х2 х7.
Затем:
Transform - Compute - Target Variable: x1; ïîñêîëüêó â ïàêåòå íåò òàíãåíñà, Numeric Expression:
SIN (x1) / cos (x1)
Повторим для х2 х7.
в) Определим средние:
Statistics - Summarise - Descriptives - перенесем все 7 переменных в правый список - Options - отметим Mean, Display Order: Name (показывать в порядке нумерации) - Continue - OK..
Получаем таблицу средних. Убеждаемся в том, что хотя бы одно из 7 средних по модулю превышает 1.
г) Посмотрим график выборки из распределения Коши:
Graphs - Line... - Simple, Values of individual cases - Define - Line Represents: x1 - OK..
Видим, что основная масса наблюдений имеет значения, близкие к 0, однако, имеются редкие наблюдения с большими по модулю значениями. График сохраним или распечатаем.
2.3. Сжатие распределения с ростом числа слагаемых
Закон больших чисел в форме Чебышева означает, что распределение случайной величины
сжимается с ростом n. Если математические ожидания одинаковы, т.е. Mi=a, то сжатие происходит в окрестности точки a.
Аналитически иллюстрировать сжатие можно, если распределение для легко выписывается. Например, если i распределены нормально N(a, 2), то случайная величина
распределена по N(a, 2/n). Построим графики плотностей для n =1, 4, 25, 100 и =1, a =1 (сделаем это в целях освоения пакета).
Статистически убедиться в сжатии можно, наблюдая гистограммы при различных значениях n (например, для n =10, 40, 160, 640). Сгенерируем k раз (например, хотя бы k =20) случайную величину
:
и построим для этой выборки средних гистограмму Hn. Сравнивая гистограммы для различных n, мы заметим сжатие (сделать самостоятельно). сжатие можно увидеть определением для каждого n по
минимального
min, максимального
max значений и размаха w =
max -
min .
1) Выполнение в пакете STATGRAPHICS
a) графики плотностей:
H.2.Distribution Plotting - Distribution number: 14 (Normal) - F6 - ввод параметров mean (среднего) и std.deviation (стандартного отклонения = 1, 0.5, 0.2, 0.1) - F6 - Density function - ввод параметров графика, если необходимо - F6.
б)Разброс средних.
1. Получим достаточно большой массив случайных чисел, распределенных равномерно на [0,1] ( из этого массива в дальнейшем будем формировать последовательности различной длины): процедура Random Number Generation, Distribution number: 17 - Uniform, отрезок [0,1], Number of samples 6000 (если больше, пакет может отказаться выполнять). Хранить этот массив будем, например, в переменной LIMIT.z.
2. Сформируем k=20 последовательностей длиной n =10, т.е. таблицу с n =10 строками и k =20 столбцами:
A.2.File Operation, file nameLIMIT, Desired operation: J(Update), N=New (образование новой переменной), name of new variable: x (например), assignment:
10 20 RESHAPE z
(операторы писать прописными буквами), Enter. Результатом выполненияэтого оператора будет матрица X 1020, полученная из первых 1020 =400 значений переменной z; 20 столбцов этой матрицы являются 20 последовательностями длины n =10; полученную матрицу можно посмотреть, поставив курсор на X и нажав D=Display.
3. По каждой из k =20 последовательностей x1, ..., xn определим среднее арифметическое (обозначив его в пакете xs); это сделаем так: образуем новую переменную (клавиша N), назвав ее xs10, наберем в окне Enter assignment:
SUM X /10
Этот оператор (в пакете операторы выполняются справа налево) все значения переменной X разделит на 10, затем в каждом столбце вычислит сумму; результат - вектор xs10 длиной k =20. посмотрим полученные среднеарифметические по k =20 последовательностям: клавиша D. Выведем на печать массив xs10 (клавиша F4).
Заметим, что число операций можно сократить (что и следует сделать), определив xs10 выражением:
SUM (10 20 RESHAPE z) /10