lr1 (543706), страница 3
Текст из файла (страница 3)
4. Для оценки разброса случайной величины , определим максимальное
max =
и минимальное
min=
значения, а также размах w=
max -
min:
Ctrl+F5 (переход в исполнительное окно) (или F8 - EXEC), оператор
MIN xs10
после Enter появляется результат; оператор
MAX xs10
запишем результаты в таблицу и вычислим размах.
Таблица1. разброс средних.
n | |
| w |
10 | 0.371 | 0.687 | 0.32 |
40 | 0.418 | 0.606 | 0.19 |
160 | 0.472 | 0.550 | 0.08 |
320 | 0.523 | 0.469 | 0.05 |
5.Построим гистограмму для : процедура F.3.Frequency Histogram, Data: LIMIT .xs10, поправим предлагаемые Lower limit: 0.25 и Upper limit: 0.75; после F6 получим гистограмму. При следующих значениях n = 40, 160, 320 нижний Lower limit и верхний Upper limit пределы следует оставлять прежними, чтобы эффект сжатия гистограммы при увеличении n был заметен.
6. Повторим пункты 2, 3, 4, 5 для n = 40, затем для n =160 и 320; в результате будут созданы массивы xs40, xs160, xs320.
Из таблицы видно, что разброс среднеарифметического с ростом n уменьшается, т.е. распределение
сжимается.
Сжатие распределения для с ростом n можно показать графически процедурой E.1.X-Y Line and Scatterplots. В строку X через запятую введем
xs10, xs40, xs160, xs320
что означает создание нового массива длиной 4k=80 объединением перечисленных (см. действие операторов); в строку Y введем
20 REP 10 40 160 320
что означает создание массива длиной 80, состоящего из чисел 10, 40, 160, 320, повторенные (repeat) 20 раз каждое. Масштаб по Y зададим логарифмический. После F6 на экране появятся совокупности значений при различных n. Изображение можно отредактировать: сменить надписи, диапазоны значений по осям, логарифмический масштаб по X и т.д.:
F5-Plot options - задание режимов - F6-Replot -вывести на печать (F4).
2) Выполнение в пакете STATISTICA
a) графики плотностей:
Graphs - Stats 2D Graphs - Custom Function Plots - Custom Function: - введем в поле Enter function:
normal (x; 1; 1)
, здесь a = 1, = 1; введем диапазон по х: X Min: –2, X Max: 2.
Построим аналогичные графики для n = 4, 25, 100, т.е. для = 0,5, 0,2, 0,1.
б) Разброс средних
1. Получим к = 20 выборок объемом n = 10 ( в таблице 20v 10c) из распределения R [0, 1] (выполнение см. выше).
2. По всем выборкам определим среднее:
Edit - Block Stats/Columns - Means.
3. Выделим полученную строку средних и определим для нее стандартное отклонение:
Edit - Block Stats/Rows - SD’s (standart daviation - стандартное отклонение). Затем определим минимум (Min’s) и максимум (Max’s). Результаты получаем в трех вновь образованных столбцах; результаты выписываем.
4. Действия повторяем для n = 40, 160, 640. Результаты заносим в табл.1, вычисляем размах и убеждаемся, что с ростом n разброс средних уменьшается (распределение сжимается).
5. Работу можно сократить, образовав с самого начала таблицу 20v 640c с наблюдениями, и для различных n определять средние, выделяя из таблицы первые n строк. Для полученных 4 строк средних применить 3 раза:
Edit - Block Stats/Rows - ...
6. Сжатие распределения для с ростом n можно показать графически. Из предыдущего имеем 4 строки средних для различных n. Поскольку в пакете удобнее работать со столбцами, а не со строками, 4 строки средних сделаем столбцами транспонированием:
Edit - Transpose - Data File .
Для удобства введем для них новые имена, например, xs1, ..., xs4 (Vars - Current Specs ...) и образуем 4 новых столбца, например, n1, ..., n4 с одинаковыми значениями в каждом столбце соответственно 10, 40, 160, 640 (или условные значения 1, 2, 3, 4). Построим график:
Graphs - Custom Graphs - 2D Graphs - в поле Plot 1 устанавливаем: X: n1, Y: xs1, аналогично - в другие поля; установку можно делать с клавиатуры или из списков, дважды кликнув на соответствующем поле. После ОК получаем совокупности значений средних при различных n (рис.2). Убеждаемся, что с ростом n разброс уменьшается. График выведем на печать: File - Print Graph ...
Рис. 2. Разброс средних при разных n.
Заметим, что можно было бы обойтись без транспонирования: в дополнительные 4 строки n1, ..., n4 значения следовало бы ввести с клавиатуры или копированием. Построение графика осталось бы аналогичным.
3) Выполнение в пакете SPSS
Îïðåäåëèì разброс средних.
1.Получим k = 20 выборок (столбцы х01, ..., х20) объемом n = 10 из распределения R [0, 1] (выполнение см. выше).
2. По всем выборкам определим средние:
Statistics - Summarize - Descriptives - все имена переменных переносим в правый список - Options - отмечаем Mean - Continue - OK.
В окне Output получаем столбец с 20 значениями. Перенесем его в таблицу данных:
выделяем столбец - Edit - Copy -выделяем свободный столбец таблицы данных - Edit - Paste.
Даем имя новому столбцу:
выделяем столбец - Data - Define - Name: xs10 - OK.
3. Определим для столбца xs10 характеристики разброса:
Statistics - Summarize - Descriptives... - переносим xs10 в правый список - Options - отмечаем Std.daviation, Minimum, Maximum, Range - Continue - OK. Выписываем результаты.
4. Действия повторяем для n = 40, 160 и 640. Результаты заносим в таблицу, аналогичную табл.1. Из таблицы результатов видно, что разброс среднеарифметического c ростом n уменьшается.
5. Сжатие распределения для с ростом n можно показать графически.
Из предыдущего имеем 4 столбца средних xs10, xs40, xs160, xs640. Образуем 4 новых столбца, например, n10, n40, n160 и n640 с одинаковыми значениями в каждом столбце соответственно 10, 40, 160, 640 (или условные значения 1, 2, 3, 4). Построим график:
Graphs - Scatter...- Overlay - Define - в список Y - X Pairs введем попарно n10, xs10, затем n40, xs40 и т.д. - ОК.
Получаем совокупности значений средних при различных n; убеждаемся, что с ростом n разброс уменьшается. График сохраним или выведем на печать: File - Save As (или Print).
3.Усиленный закон больших чисел.
Теорема Бореля (1909 г.) ( первая теорема на эту тему) утверждает, что относительная частота fn появления случайного события с ростом числа n независимых испытаний стремится к истинной вероятности p
с вероятностью 1. Другими словами, при любом эксперименте с бесконечным числом испытаний имеет место сходимость последовательности fn к p.
Будем говорить, что последовательность случайных величин подчиняется усиленному закону больших чисел, если
с вероятностью 1.
В частном случае, при равных математических ожиданиях, Mi=a, это означает
с вероятностью 1.
Достaточное условие выполнения (7) дает
Теорема Колмогорова. Если последовательность взаимно независимых случайных величин удовлетворяет условию
то она подчиняется усиленному закону больших чисел.
Для независимых и одинаково распределенных случайных величин справедлив окончательный результат:
Теорема. Необходимым и достаточным условием для применимости усиленного закона больших чисел к последовательности независимых величин является существование математического ожидания.
Проиллюстрируем (6) на примере бросания симметричной монеты, а (8) - на примере равномерно R[0,1] распределенных случайных величин.
1) Выполнение в пакете STATGRAPHICS
Для наших целей необходимо из последовательности наблюдений x1,...,xN сформировать последовательность частичных сумм S1,...,SN,, где Sk= , что сделать возможностями пакета нелегко, и потому они (5 последовательностей по 500 бросаний монеты и 5 последовательностей длиной 500 для равномерно на 0, 1 распределенных случайных чисел) должны быть подготовлены заранее и импортированы в пакет процедурой A.3.Import Files. Первую разместим в файле с именем, например MONEYSUM. ASF, вторую - в файле UNIFSUM. ASF. Если эти эти файлы подготовлены заранее и находятсся в произвольном месте, их необходимо переписать, выйдя в DOS, в директорию, где размещаются данные пакета; после этого войти в пакет.
Проверим содержимое этих файлов: выберем процедуру A.1.Display Data Directory; на экране дается список переменных. Чтобы посмотреть требуемую, переведем на нее курсор +ENTER.
Эксперименты с монетой
Представим данные графически процедурой E.2.Multiple X-Y Plots(по-строение нескольких x-y графиков).
Выведем на экран первые, например, 50 значений переменных var1, var4
и var 5 файла MONEYSUM, как функции номера испытания; для этого в ак-
тивное окно введем:
в строку X: COUNT 50
в строку Y: 50 TAKE var1
50 TAKE var4
50 TAKE var5
оператор в строке X создает массив чисел от 1 до 50, которые становятся значениями аргумента; операторы в строках Y отбирают 50 первых значений переменных; после нажатия F6 на экране три реализации числа успехов как функции числа испытаний. (Вообще говоря, нужно указывать полные имена переменных, иначе могут быть взяты переменные с этими именами из другого файла).
Построим график последовательности среднеарифметических (относительных частот ) f1,...,fn, где