отчет1 (Лабораторные работы), страница 2
Описание файла
Файл "отчет1" внутри архива находится в следующих папках: Лабораторные работы, Статистика_Оля. Документ из архива "Лабораторные работы", который расположен в категории "". Всё это находится в предмете "вычислительные машины, системы и сети (вмсис)" из 7 семестр, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. Архив можно найти в разделе "лабораторные работы", в предмете "вмсс" в общих файлах.
Онлайн просмотр документа "отчет1"
Текст 2 страницы из документа "отчет1"
Для удобства введем для них новые имена xs1, ..., xs4 и образуем 4 новых столбца n1, ..., n4 с одинаковыми значениями в каждом столбце соответственно 10, 40, 160, 640.
Построим график:
Получили совокупности значений средних при различных n. Убеждаемся, что с ростом n разброс уменьшается.
3.Усиленный закон больших чисел.
Теорема Бореля (1909 г.) ( первая теорема на эту тему) утверждает, что относительная частота fn появления случайного события с ростом числа n независимых испытаний стремится к истинной вероятности p
с вероятностью 1. Другими словами, при любом эксперименте с бесконечным числом испытаний имеет место сходимость последовательности fn к p.
Будем говорить, что последовательность случайных величин подчиняется усиленному закону больших чисел, если
с вероятностью 1.
В частном случае, при равных математических ожиданиях, Mi=a, это означает
с вероятностью 1.
Достaточное условие выполнения (7) дает
Теорема Колмогорова. Если последовательность взаимно независимых случайных величин удовлетворяет условию
то она подчиняется усиленному закону больших чисел.
Для независимых и одинаково распределенных случайных величин справедлив окончательный результат:
Теорема. Необходимым и достаточным условием для применимости усиленного закона больших чисел к последовательности независимых величин является существование математического ожидания.
Проиллюстрируем (6) на примере бросания симметричной монеты, а (8) - на примере равномерно R[0,1] распределенных случайных величин.
Из последовательности x1 ,..., xN независимых наблюдений построим последовательность f1, ..., fN среднеарифметических, где
и убедимся графически в том, что fn c ростом n приближается к математическому ожиданию.
Эксперименты с монетой.
Сгенерируем 3 последовательности по 500 бросаний монеты в первые 3 столбца таблицы 6v 500c. Образуем последовательность среднеарифметических, исходя из соотношений:
f1 = x1, fn = ((n – 1) fn1 + xn ) n, n = 2, ..., N,
Посмотрим графически зависимость fn от n в различных диапазонах: от 1 до 25:
n=100
n=500
Убеждаемся, что частота выпадения герба fn c ростом n приближается к вероятности герба р = 0,5.
Эксперименты со случайными числами, распределенными равномерно на отрезке [0, 1].
Наши действия аналогичны предыдущему. Убеждаемся, что последовательность среднеарифметических приближается к 0,5 – математическому ожиданию.
N=25:
n=50:
n=100:
n=500:
Пример невыполнения закона
посмотрим на последовательностях случайных чисел, распределенных по закону Коши.
N=25:
n=50:
N=100:
n=500:
Анализируя результирующие графики, видим, что кривые среднеарифметических иногда испытывают скачки, которые отбрасывают их значения далеко от 0 – центра распределения.
4.Теорема Гливенко основная теорема статистики
Пусть x1, x2,...,xn - выборка из n независимых наблюдений над случайной величиной X с функцией распределения F(x). Расположим наблюдения в порядке возрастания; получим
-вариационный ряд. Определим функцию эмпирического распределения
где - число тех наблюдений, для которых xi
- ступенчатая функция; это функция распределения, которое получается, если значениям x1,...,xn присвоить вероятности, равные 1/n. Ясно, что
-функция случайная , так.как зависит от наблюдений x1,...,xn.
Теорема Гливенко:
с вероятностью 1.
Проиллюстрируем эту теорему на примерах наблюдений над случайной величиной, распределенной по равномерному на [0,1] закону.
Сравним графически функцию эмпирического распределения для выборки объема n = 10 и функцию теоретического распределения.
А) Подготовка функции эмпирического распределения. Заготовим таблицу размером 3v 10c. В первом столбце (назовем его х) сгенерируем выборку объема 10 с равномерным на отрезке [0, 1] распределением. Построим вариационный ряд, т.е. сделаем сортировку по возрастанию. Во втором столбце вычислим значения функции эмпирического распределения. Б) Подготовка функции теоретического распределения. Поскольку функция равномерного на [a, b] распределения определяется на [a, b] отрезком прямой, ее можно задать двумя точками (а, 0) и (b, 1), в данном случае (0, 0) и (1, 1). В третьем столбце, назовем его FT, введем два значения 0 и 1.
Покажем на одном графике две функции распределения:
Наблюдаем функции теоретического и эмпирического распределений.
Если бы у нас была выборка с некоторой произвольной теоретической функцией распределения, в столбец FT нужно было бы записать ее значения в точках вариационного ряда - столбца Х. Например, если бы выборка была из совокупности с экспоненциальным распределением с параметром = 2, то для FT long name :
= IExpon (X; 2)
(I - интегральная функция). Настройка графика в процедуре 2D Graphs была бы такова : в PLOT 1 X : X, Y : FE, Step Plot, в Plot 2 X : X, Y : FT. Выполним это, не изменяя выборки:
Теперь повторим а) в) для n = 40, 160, 640. Убедимся в том, что при увеличении n функция эмпирического распределения приближается к теоретической.
n=40:
n = 160:
n = 640:
5.Центральная предельная теорема
5.1. Содержание теоремы
Закон больших чисел утверждает , что при n
где а = Mi. Центральная предельная теорема утверждает нечто большее, а, именно, что при этом стремлении происходит нормализация:
где , т.е среднеарифметическое при больших n распределено приближенно по нормальному закону с дисперсией 2/n; этот факт записывают иначе, нормируя сумму:
Приведем формулировку одной из теорем.
Теорема Линдеберга. Если последовательность взаимно нeзависимых случайных величин 1, 2,..., n,... при любом постоянном >0 удовлетворяет условию Линдеберга
где
,
, то при n равномерно относительно x
Следствие. Если независимые случайные величины 1, 2,..., n,... одинаково распределены и имеют конечную отличную от нуля дисперсию, то выполняется (11).Условие Линдеберга в этом случае, т.е. Mk=a, Dk=2, Fk(x)=F(x), принимает вид: при любом > 0 и при n
оно, очевидно, выполняется, поскольку интеграл по всей оси, т.е. дисперсия, существует.
Убедимся статистически в том, что сумма нескольких случайных величин распределена приближенно по нормальному закону.
5.2. Одинаково распределенные слагаемые .
Сделаем это на примере суммы
шести (m = 6) независимых случайных величин, имеющих beta-распределение с параметрами a=b=0.5, плотность которого
где - beta-функция. Плотность при выбранных значениях параметров имеет U-образный вид, весьма далекий от нормального; убедимся в этом, построив график плотности .
чтобы статистически оценить закон распределения для суммы S, cследует многократно, N раз (например, N=500), промоделировать суммирование: получим S1, S2,...,SN - выборку для суммы; для этой выборки построим гистограмму и сравним ее визуально с нормальной плотностью.
Подготовим таблицу 9v 500c для размещения шести выборок, а в последних трех - сумм (для числа слагаемых m = 2, 4, 6):
Сравним гистограммы для m = 1, 2, 4, 6 слагаемых. Получим гистограмму для одного слагаемого:
Наблюдаем гистограмму и плотность нормального распределения с параметрами, равными выборочным. Убеждаемся в существенном отличии распределения слагаемого от нормального.
Аналогично получим гистограмму для суммы S2 двух слагаемых:
для S4:
для S6:
Убеждаемся, что уже при шести, даже четырех (!) слагаемых распределение близко к нормальному.
5.3.Различно распределенные слагаемые
Распределение суммы сходится к нормальному и в том случае, когда слагаемые распределены по различным законaм.
Задание 1. Оценить экспериментально распределение для суммы шести слагаемых, распределенных по различным законам; выберем их из семейства beta-распределений (13), задав следующие параметры:
1 | 2 | 3 | 4 | 5 | 6 | |
a | 1 | 0.5 | 1 | 1 | 2 | 2 |
b | 0.5 | 1 | 1 | 2 | 1 | 2 |
Сгенерируем выборку для суммы и построим гистограмму для нее. Убедимся в том, что распределение близко к нормальному. Распечатаем гистограммы для слагаемых и для суммы.
Если же в сумме (12) имеется слагаемое, дисперсия которой существенно превышает все остальные, то приближенная нормальность места не имеет.
Задание 2. Проверить это (получить гистограмму), добавив в (12) 7-е слагаемое, имеющее beta-распределение с параметрами a=b=0.5 и умноженное на 1000.
Гистограммы для слагаемых и для суммы: