lab1 (542556)
Текст из файла
1.Теорема Бернулли
Если проводится n независимых испытаний случайного события A, вероятность которого P(A) = p, то относительная частота /n появления события A ( число появлений A) при большом n приближенно равна вероятности p:
уточнение: будем писать
если для любого >0 и для достаточно больших n соотношение
выполняется с вероятностью, стремящейся к 1 с ростом n; запишем это так:
В этом состоит теорема Бернулли. Заметим, что теорема не утверждает, что соотношение (1) достоверно, однако, если n достаточно велико, то вероятность его выполнения близка к 1 (например, 0.98 или 0.999), что практически достоверно. Если собираемся провести эксперимент, состоящий из этого достаточно большого числа n испытаний, то можем быть уверены, что соотношение (1) будет выполнено. Проверим это не абсолютно достоверное утверждение.
Пример. Бросание симметричной монеты.
Вероятность появления герба p=0.5. можно показать (с помощью центральной предельной теоремы), что, например, если n (1.5/)2, то соотношение (1) выполняется с вероятностью 0.997, а если n (1.3/)2, то с вероятностью 0.99; последняя в данном случае нас вполне устраивает как практическая достоверность. Положим = 0.1; тогда соотношение
| / n - 0.5 | < 0.1 (a)
выполняется с вероятностью 0.99 при n 170. если =0.03, то соотношение
| / n - 0.5 | < 0.03 (б)
выполняется с вероятностью 0.99 при n 1850. Мы уверены, что, проведя 170 бросаний монеты, получим (а), а, проведя 1850 бросаний, получим (б).
Бросание монеты моделируем генерацией случайной величины , принимающей значения 1 ("герб") и 0 ("цифра") с вероятностями 1/2. Число появлений "герба" в n испытаниях , где k- результат k-го испытания.
Выполнение в пакете Statistica
В главном меню пакета, в окне STATISTICA Module Switcher выбираем Data Management (управление данными) или Basic Statistics/Tables (основные статистики и таблицы). При появлении предложений отвечаем согласием.
а) Образование вектора длины n = 1850.
File - New Data - File Name: Limit (например) на диске D в директории ТМP -OK. Появляется таблица 10v 10c (10 переменных-строк и 10 столбцов-“случаев”, т.е. наблюдений), преобразуем ее в 1v 1850c: кнопка Vars - Delete...- From variable: var 2, to variable: var 10 - OK. Кнопка Cases - Add - Number of Cases to Add: 1840 - OK.
Можно убедиться прокруткой, что заготовлена матрица 1v 1850c; это же видно в заголовке таблицы.
б) генерация n = 1850 значений .
Analisis - Modifi Variables...- Current Specs - назовем переменную Name: alpha, введем определяющее выражение Long name:
= trunc (rnd (1) + 0,5)
что означает взять целую часть от случайной величины, распределенной равномерно на отрезке [0,5, 1,5] (оператор rnd(1) генерирует случайные числа, распределенные равномерно на отрезке [0, 1]) - OK. Вводить можно с клавиатуры или с помощью кнопки Function. Отметим, что генерацию можно было бы осуществлять не во все клетки столбца, а в заранее выделенные.
в) Определение числа появлений “герба” и относительной частоты fn в серии из n = 170 испытаний.
Выделим первые 170 наблюдений: выделим 1-ю клетку, нажмем и держим Shift, прокрутим таблицу до 170-й клетки и кликнем по ней. Далее:
Edit - Block Stats/Columns - Sum’s (во 2-й раз - Means).
Результат получаем во вновь образованных двух последних строках. Результат записываем и убеждаемся, что fn – 0.5 < 0.1.
Получим fn = 88/170 = 0.02 => fn – 0.5 < 0.1
г) Определение числа появлений “герба” и относительной частоты fn в серии из n = 1850 испытаний.
Выделяем все наблюдения, кликнув по заголовку столбца. Далее так же. Убеждаемся, что fn – 0.5 < 0.03.
Получим fn = 924/1850 => fn – 0.5 < 0.03.
2.Закон больших чисел в форме Чебышева
2.1.Основное утверждение
Одно из основных утверждений закона больших чисел состоит в том, что значение среднеарифметического случайных величин с равными математическими ожиданиями
при большом n (при некоторых широких условиях) оказывается приближенно равным a:
уточним: будем писать
если для любого >0 и достаточно больших n соотношение
выполняется с вероятностью, стремящейся к 1 с ростом n; запишем это так:
это одно из утверждений закона больших чисел. Заметим, что, как и теорема Бернулли, оно не означает, что соотношение (2) достоверно; однако, если n достаточно велико, то вероятность его выполнения близка к 1, например, 0.98 или 0.999, что означает практически достоверно. Приведем полную формулировку одной из теорем закона больших чисел в форме Чебышева,
Теоремы Чебышева. Если - последовательность попарно независимых случайных величин, имеющих конечные дисперсии, ограниченные одной и той же постоянной:
то для любого >0
2.2. Испытание практически достоверного события
Убедимся в выполнении (2) статистически на примере1.
Пример1. Случайные величины распределены равномерно на отрезке [0,1]. Если значение задавать произвольно, а число испытаний выбирать из условия n (9D/2), то (как нетрудно показать) соотношение (2) выполняется с вероятностью P=0.997, а если n (5.4D/2) - то с P=0.98. Последняя нас устраивает, как практическая достоверность.
Положим 1 =0.1 и 2 =0.02, определим два соответствующих значения n1 =45 и n2 =1125, и проверим (2) экспериментально (в нашем случае a=0.5). Выполнение аналогично п.1. При генерации случайных чисел нужно задать полное имя новой переменной, например, LIMIT.unif.
Задание. Проверить (2) экспериментально для экспоненциально распределенных слагаемых с M=1. Принять 1 =0.2 и 2 =0.05. При выполнении в пакете SPSS учесть, что - ln , где ~ R[0, 1], имеет требуемое распределение.
Пример 2. Невыполнение закона больших чисел
Рассмотрим случайную величину, распределенную по закону Коши с плотностью
Заметим, что плотность симметрична относительно нуля, однако, 0 не является математическим ожиданием; это распределение не имеет математического ожидания. Напомним, что математическим ожиданием называется , если
; последнее, очевидно, для распределения Коши не выполняется. Для последовательности независимых случайных величин, распределенных по закону Коши (3), закон больших чисел не выполняется. Если бы среднеарифметическое
сходилось с ростом n к какой-либо константе, то, в силу симметрии распределения, такой константой мог быть только 0. Однако, 0 не является точкой сходимости. Действительно, можно показать, что при любом >0 и при любом сколь угодно большом n
с вероятностью arctg . (Поясним сказанное: с помощью характеристических функций легко показать, что
распределена по (3), а функция распределения для (3) есть arctg x). Эта вероятность, как видно, не стремится к 0 с ростом n. Например, если = 0.03, то вероятность выполнения (4) равна приближенно P 0.98, т.е. событие (4) практически достоверно, и можно уверенно ожидать его выполнения с одного раза. Если =1, то вероятность (4) равна 0.5, и выполнение его хотя бы раз можно уверенно ожидать, проделав 7 экспериментов (т.к. вероятность невыполнения ни разу равна (0.5)7 = 1/128). И это при любом фиксированном n, например, n = 1000. Проверим это экспериментально.
При выполнении в пакетах, где нет закона Коши, учтем, что, если случайная величина X распределена равномерно на отрезке длины , то случайная величина
Y = tg X (5)
имеет плотность (3). Сгенерируем 7 выборок объемом n=1000 и проверим (4) при =1.
Выполнение в пакете STATISTICA
Сгенерируем 7 выборок объема n = 1000 с распределением Коши и определим по каждой среднее значение.
а) Заготовим таблицу 7v 1000c, изменив имеющуюся.
б) Сгенерируем выборки.
Vars - All Specs - выделяем любую клетку в 4 столбце и вводим определяющее выражение, соответствующее плотности (3),
= VCauchy (rnd (1); 0; 1)
здесь а = 0 – параметр сдвига, b = 1 – параметр масштаба в плотности
переносим выражение в остальные 6 клеток:
Edit - Copy (переносим запись в буфер), выделяем другую клетку и
Edit - Paste (вставляем запись); это же можно сделать короче с помощью кнопок Copy и Paste; закрываем окно и исполняем
кнопка Х = ? (Recalculate) - All variables - OK.
в) Определим среднее значение на всех 7 выборках:
выделим всю матрицу (щелчок на пересечении заголовков строк и столбцов) - Edit - Block Sats/Columns - Means.
Убеждаемся, что хотя бы в одной выборке модуль среднего превосходит 1. Если же это не так, то нам крупно не повезло: произошло событие с вероятностью менее 0,01.
г) Посмотрим график выборки из распределения Коши (рис.1):
Graphs - Stats 2D Graphs - Line Plots (Variables)... - в поле Line Plots вводим Variables: x1 (например), Graph Tipe: Regular, Fit: off.
обратим внимание на то, что имеются редкие наблюдения, отстоящие очень далеко от центра распределения – точки 0.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.