Краткий курс лекций (1077551), страница 7
Текст из файла (страница 7)
Отсюда по второму неравенствуM ( X k − M ( X k )) = 2 ∑ Dk ≤ 2 = n→∞2 ∑nnnnЧебышева следует утверждение теоремы (доказательство сходимости по вероятностипроводится как в предыдущей теореме).()Теорема Маркова.Пусть X1,Xn – зависимые случайные величины с математическими ожиданиями nD ∑ X k → 0 . Тогда среднее арифметическоеm1,…mn и дисперсиями D1…, Dn.
Пусть k =12 n→∞nнаблюденных значений случайных величин сходится по вероятности к среднемуарифметическому их математических ожиданий.Доказательство. Доказательство сходимости по вероятности проводится как в теоремеЧебышева.Теорема Бернулли.При неограниченном увеличении числа опытов – независимых испытаний частотасобытия сходится по вероятности к вероятности события.Доказательство проводится аналогично теореме Чебышева.Предельные теоремы.Центральная предельная теорема – это любая теорема, ставящая условия, при которыхфункция распределения суммы индивидуально малых случайных величин с ростом числаслагаемых сходится к нормальной функции распределения.Центральная предельная теорема подтверждает следующее: если исход случайногоэксперимента определяется большим числом случайных факторов, влияние каждого из которыхпренебрежимо мало, тотакой эксперимент хорошо аппроксимируется нормальнымраспределением с параметрами m, D.
, подобранными соответствующим образом.стр. 2902.11.2005Основы теор. вер. и матем. статистикиДоцент кафедры «Прикладная математика» Галкин С.В.Теорема Ляпунова.Пусть Xk – независимые случайные величины, имеющие математические ожидания M(Xk)n= mk и дисперсии D(Xk) = Dk. Обозначим I =∑(Xk =1k− mk )n∑Dk =1nчто∑M Xk =1k− mkDk ∑k =1n. Если можно подобрать такое δ > 0 ,k2 +δ2 +δn→ 0 , то при n → ∞ FI ( x) → Φ ( x) =→∞1− t22x12π∫edt равномерно по x.−∞Теорема Леви – Линдеберга.Пусть Xk – независимые одинаково распределенные случайные величины, имеющиеnматематические ожидания M(Xk) = m и дисперсии D(Xk) = σ . Обозначим I =2Тогда при n → ∞ FI ( x) → Φ ( x) =12πx∫e1− t22∑ (Xk =1k− m)σ n.dt равномерно по x.−∞Замечание.
В теореме Леви – Линдеберга (ее чаще всего и называют центральнойnпредельной теоремой)n∑Dk =1оно превращается в1δk= nσ 2 = σ n , условиеn→ 0→∞∑M Xk =1k− mkn∑Dk =1k2 +δ2 +δn→ 0 выполнено,→∞(проверьте сами) из-за требования «одинаковостиn2распределений», т.е. равенства вкладов случайных величин в случайную величину I .Если рассматривать схему Бернулли, то из теоремы Леви – Линдеберга следуетинтегральная теорема Муавра – Лапласа.Интегральная теорема Муавра – Лапласа.Пусть производится n независимых испытаний, в каждом из которых с вероятностью pможет появиться событие А. Обозначим X k - число появлений события в k –ом испытанииn( M ( X k ) = p, D( X k ) = pq ).
Обозначим X = ∑ X k- общее число появлений события в nk =1испытаниях( M ( X ) = np, D( X ) = npq ).1xОбозначимI=X − npnpq.Тогдаприn→∞1− t22∫ e dt равномерно по x.2π −∞Отсюда следует практическое правило вычисленияFI ( x) → Φ ( x) =стр. 3002.11.2005Основы теор. вер. и матем.
статистикиP a <n∑Xk =1Φ 0 ( x) =n∑Xk =1kk− npnpq12πx∫eДоцент кафедры «Прикладная математика» Галкин С.В.< b ≈ Φ (b) − Φ (a ) = Φ 0 (b) − Φ 0 (a) , где ∀a, b,1− t22dt .Таккак ∀a, b, тозаменим0aнаk1 − npnpq,b наk 2 − npnpq,= m. Получим формулу для вероятности нахождения числа успехов в заданноминтервале:n k − np m − np k 2 − np ≈ Φ 0 k 2 − np - Φ 0 k1 − np .<<P k1 < ∑ X k < k 2 = P 1 npq npq npqnpqnpq k =1Заменим a на ann, b на b.pqpqn n n nm − np − Φ0 a.<<b≈ Φ 0 bТогда P apqpqpqpqnpqn m − np pqnm − npm<<b= P a << b = P a < − p < b .Но P apq pqnpqnnpqnПоэтому справедлива формула для вычисления отклонения частоты от вероятностиn n m, − Φ0 aP a < − p < b ≈ Φ 0 bnpqpqЕсли интервал симметричный, т.е.
a = −ε , b = ε , то по нечетности функции Лапласаполучимmn .P − p < ε ≈ 2Φ 0 εpq nПример. Вероятность появления события p = 0,8. Сделано n = 100 независимыхиспытаний. Найти вероятность того, что событие произойдет не менее 75 и не более 90 раз. 90 − 100 0,8 − Φ 0 75 − 100 0,8 = Φ 0 (2,5) − Φ 0 (−1,25)P(75 < X < 90) = Φ 0 100 0,8 0,2 100 0,8 0,2 = 0,4938 + 0,3944 = 0,9882Пример. Бюффон бросил монету 4040 раз и получил герб 2048 раз.
Найти вероятностьотклонения частоты появления герба от вероятности.m2048 14040 = 2Φ 0 (0,89) = 0,626−p =− ≈ 0,007 = ε P ≈ 2Φ 0 0,007n4040 20,25стр. 3102.11.2005Основы теор. вер. и матем. статистикиДоцент кафедры «Прикладная математика» Галкин С.В.Лекция 8Элементы математической статистики.Пусть исследуется случайная величина с заранее неизвестной функцией распределенияF(x).Множество всех значений этой случайной величины называется генеральнойсовокупностью (Г С).Единичное значение случайной величины называется выборкой объема 1.Совокупность n значений случайной величины образуют выборку объема n.Выборка имеет то же распределение, что и генеральная совокупность.Выборочные значения называются вариантами.Изучая выборку, делают заключение о вероятностных свойствах Г С.Основные задачи статистики.1.
Оценка неизвестных параметров распределения:- точечные оценки параметров распределения, например оценка математическогоожидания, дисперсии, моментов распределения,- интервальные оценки – доверительные интервалы – интервалы, в которыхнаходятся параметры распределения с доверительной вероятностью.2. Проверка статистических гипотез – предположений о законе распределения ГСили параметрах распределения.3.
Установление формы и степени связи между несколькими случайными переменными.Эмпирические законы распределения.Вариационным рядом называются варианты, расположенные в порядке их возрастания(не убывания, если варианты повторяются).Будем обозначать xk – различные варианты вариационного ряда (k = 1, 2, …), nk – ихnчастоты (число повторений варианты), ω k = k - относительные частоты.nСуществуют различные формы закона распределения: ряд распределения, полигончастот, полигон относительных частот, эмпирическая функция распределения,гистограмма (дискретный аналог плотности распределения).Рассмотрим, например, вариационный ряд 0,0,0,0.0.1,1,3,5,5.
Объем выборки n = 10.Ряд распределенияxk0135nk52121/21/51/101/5ωkПолигон частотПолигон относительных частот имеет тот же вид, но по осиординат откладываются не частоты nk, а относительные частотыω k (на рисунке черточками отмечены единицы по осям значенийи частот).Xk1 2345Эмпирическая функция распределения - аналог функции распределения для дискретныхслучайных величин, она тоже кусочно постоянна и имеет тот же график, только скачкистр.
3202.11.2005Основы теор. вер. и матем. статистикиДоцент кафедры «Прикладная математика» Галкин С.В.функции в точках – вариантах происходят на относительные частоты вариант (в примерескачки от 0 на 0,5, затем на 0,2 до 0,7, затем на 0,1 до 0,8 и, наконец на 0,2 до единицы).Fn(x)Эмпирическаяфункцияраспределенияформально определяется как1n( x ), где n(x) - числоnxk < xчленов выборки, меньших x.Fn ( x) =0,4∑ωk=12345xДля построения гистограммы приходится приписывать значение частоты варианты некоторомуинтервалу стандартной ширины (в нашем случае, например, 0,5), лежащему справа от вариантытак, чтобы площадь ступени над интервалом равнялась относительной частоте варианты.10,40,20 0,5 1 1,53 3,55 5,5Точечные оценки параметров распределения.Пусть неизвестен параметр распределения β , любая функция β ( x1 , ...x n ) ≈ β на выборкеx1 , ...x n называется точечной оценкой β . Оценки тоже являются случайными величинами.Требования к оценкам.1.Несмещенность( )M β =βPСостоятельность β n→∞ →βЭффективность (по сравнению с другими оценками) – если дисперсия оценкименьше дисперсий других оценок.Можно показать, что несмещенная оценка состоятельна, если ее выборочная дисперсиястремится к нулю при n → ∞ .Оценки ищут различными методами: методом моментов, методом максимальногоправдоподобия, методом наименьших квадратов и др.Оценка среднего значения ГС (математического ожидания) – выборочное среднее.1 nx = ∑ xk .n k =1nm1 n= m.Оценка несмещенная, т.к.
M ( x ) = ∑ M ( x k ) =n k =1n2.3.стр. 3302.11.2005Основы теор. вер. и матем. статистикиДоцент кафедры «Прикладная математика» Галкин С.В.Оценка состоятельная, т.к. x n→∞ → m по закону больших чисел.PОценки дисперсии ГС:1 n∑ (xk − x )n k =1Это – смещенная, состоятельная оценка.1.2Выборочная дисперсия Dв =2.
Несмещенная, состоятельная оценка дисперсии s 2 =nDвn −1n−3 4 σ .Можно показать, что M s 2 = σ 2 , D s 2 = µ 4 −n −1 Пример. Вычислим оценки для приведенного выше ряда распределения( )( )051/2xknkωk121/5311/10521/51 3 5+ + = 1,5 ,5 10 512222s 2 = 5(1,5) + 2(0,5) + (1,5) + 2(3,5) ≈ 4,2 .9Интервальные оценки.x=[]Доверительный интервал – это интервал (β 1 , β 2 ) , такой, что P(β 1 < β < β 2 ) = γ ,где γ - доверительная вероятность.Общее правило построения доверительного интервала для любого параметра основано нацентральной предельной теореме, по которой при больших n (n>50) оценка β имеет нормальное( ) ( )распределение с M β , D β , если β - несмещенная оценка, а функция распределенияслучайной величины J =β −βсходится по вероятности при n → ∞ к функции стандартногоDβнормального распределения.Квантиль h p (уровня p ) случайной величины X с функцией распределения F(x) – этотакое значение( )h p случайной величины X, что p = F (h p ) .Обозначимp(x)z1−αквантиль2нормального распределенияуровня 1 −γγ = 1−αα /21−α2z1−αx22-, где α = 1 − γ ,доверительная αвероятность, т.е.