Раздаточные материалы (1134074), страница 3
Текст из файла (страница 3)
P, F(x),M(x), D(x).ЗБЧ доказывает, что средние выборочные значения при n→∞ стремятся к соответствующимзначениям генеральной совокупности: hn(A)→P, Xср→M(X), σср2→D(X), F*(X)→F(X).Лемма Маркова. Если Y – СВ, принимающая не отрицательные значения, то для любогоположительного ε:P(Y≥ε)≤M(x)/ε, P(Y<ε)≥1-M(x)/ε.⎧0, Y < ε: Yε≤Y, M(Yε)≤M(Y)Доказательство. Рассмотрим Y и Yε = ⎨⎩ε, Y ≥ εM(Yε)=0⋅P(Y<ε)+ε⋅P(Y≥ε)=ε⋅P(Y≥ε)M(Y)≥M(Yε)=ε⋅P(Y≥ε).Лемма позволяет сделать оценку вероятности наступления события по математическомуожиданию этой СВ.Неравенство Чебышева. Для любой СВ с ограниченными первыми двумя моментами (естьМО и D) и для любого ε>0:D ( x)D ( x)P(| X − m |≥ ε) ≤ 2 ;P (| X − m |< ε) ≥ 1 − 2εεДоказательство.
По лемме Маркова: рассмотрим не отрицательную СВ YY=(X-m)2M(Y)=M(X-m)2=D(x)2 2P(|X-m|≥ε)=P((X-m) ≥ε )=P(Y≥ε2)≤M(Y)/ε2=D(x)/ε2.Требуется только знание дисперсии СВ при любом законе распределения.ЗБЧ в форме Чебышева. X1, X2, …, Xn – последовательность независимых СВ. Для любогоε>0 и n→∞:14⎛ X + X 2 + ... + X n M ( X 1 ) + M ( X 2 ) + ...
+ M ( X n )⎞−P⎜⎜ 1> ε ⎟⎟ < δnn⎝⎠⎛ X + X 2 + ... + X n⎞⎛ X + X 2 + ... + X n⎞P⎜⎜ 1− m > ε ⎟⎟ < δP⎜⎜ 1− m < ε ⎟⎟ < 1 − δnn⎝⎠⎝⎠ЗБЧ в форме Бернулли. m – число успехов в серии из n последовательных испытанийБернулли. P – вероятность успеха в каждом отдельном испытании. ε>0:⎛m⎞lim P⎜⎜ − p < ε ⎟⎟ = 1n →∞ ⎝ n⎠ЗБЧ носит чисто качественный характер. В тех же условиях неравенство Чебышева позволяетполучить количественную характеристику оценки вероятности.Пример. Для определения вероятности события проведено 40000 опытов. Событиянаблюдалось в m=16042 случаях.
За вероятность события принимается относительная частотанаступления события: m/n≈0,4. Применяя неравенство Чебышева, оценить, с какой вероятностьюможно гарантировать, что число 0,4, принятое за вероятность, отличается от истиннойвероятности не больше, чем на 0,05.⎛m⎞pqP⎜⎜ − p ≤ 0,05 ⎟⎟ ≥ 1 − 2 = 0,9975nε⎝ n⎠Неизвестные p и q находим из системы уравнений:21⎪⎧( p + q) = 1=> pq ≤⎨4⎪⎩( p − q) 2 ≥ 0Центральная предельная теорема Ляпунова.Предмет внимания этой теоремы – распределение суммы большого числа СВ.X=(x1+x2+…+xn)/nРаспределение суммы n независимых СВ в независимости от их законов распределенияасимптотически сходятся к нормальному закону при неограниченном числе слагаемых иограниченных двух первых моментах (МО и D).b⎛ ( x − m) 2 ⎞1⎟ ⋅ dxP ( x < b) =exp⎜⎜2⎟σ22πσ 2x −∞x⎝⎠σ.Если σi2=σ2, то σх2=σ2/n, σ x =nD(x)=σх2=(σ12+σ22+…σn2)/n2ЦПТ универсальны и справедливы как для НСВ, так и для ДСВ.P(a<X<b)=Ф(t2)-Ф(t1).t2=(b-mx)/σxt2=(a-mx)/σxSn=(X1+X2+…+Xn)/nP(|Sn-m|<zσ)=2Ф(z)M(xk)=mD(xk)=σ2D( x ) = σ 2 / n σ x = σ / n∫⎛P⎜⎜ x − m < z⎝⎛ x−m≤P⎜⎜σ/n⎝ЦПТ в интегральной форме Муавра-Лапласа.σ ⎞⎟⎟ = 2Ф( z )n⎠⎞z ⎟⎟ = 2Ф( z )⎠15⎛⎞x − npP⎜ a ≤≤ b ⎟ = Ф(b) − Ф(a)⎜⎟npq⎝⎠⎛ k − np ⎞⎛⎞⎟ − Ф⎜ k1 − np ⎟P(k1 ≤ k ≤ k 2 ) = Ф⎜ 2⎜ npq ⎟⎜ npq ⎟⎝⎠⎝⎠Статистическое оценивание параметров распределенияМы анализируем только выборки из генеральной совокупности.
По средне выборочнымпараметрам находим параметры самой генеральной совокупности.Задачи такого рода решаются методами проверки статистических гипотез и статистическойоценки параметров распределения.Прежде нужно получить и провести первичную обработку исходных экспериментальныхданных.Статистические ряды часто изображают графически в0,16виде полигона, гистограммы, кумулятивной кривой F*(x).0,120,11Полигон – ломаная линия, соединяющая в декартовой0,06системе координат точки (xi,ni), (xi,mxi).0,04Кумулятивная кривая строится по точкам (xi,F*(xi)).12345Гистограмма – на оси абсцисс – отрезки интервалов t, наэтих интервалах строятся прямоугольники с высотой, равной относительной частоте признака. Погистограмме легко строится полигон.И полигон, и гистограмма характеризуют функцию f*(x) – плотность вероятности.НСВ – проблема выбора интервала варьирования h.h выбирается, исходя из необходимости выявления характерных черт рассматриваемогораспределения.x− x minПравило Старджесса: h = max1 + 3,322 ⋅ lg nКак только характерные особенности распределения проявились, ставится вопрос обусловиях, при которых сформировалось данное распределение – вопрос об однородностистатистических данных.Если функция f*(x) – бимодальная (имеет два максимума), то статистическое данныенеоднородные.Методы математической статистики должны позволить сделать обоснованные выводы очисловых параметрах и законе распределения генеральной совокупности по ограниченному числувыборок из этой совокупности.Состав выборок случаен и выводы могут быть ложными.
С увеличением объема выборкивероятность правильных выводов растет. Всякому решению, принимаемому при статистическойоценке параметров, ставится в соответствие некоторая вероятность, характеризующая степеньдостоверности принимаемого решения.Задачи оценки параметров распределения ставятся следующим образом:Есть СВ Х, характеризуемая функцией F(X, θ).θ – параметр, подлежащий оценке.Делаем m независимых выборок объемом n элементов xij (i – номер выборки, j – номерэлемента в выборке).1 x11, x12, …, x1nX12 x21, x22, …, x2nX2…m xm1, xm2, …, xmnXmСлучайные величины X1, X2,…Xm мы рассматриваем как m независимых СВ, каждая изкоторых распределена по закону F(X, θ).16Всякую однозначную функцию наблюдений над СВ х, с помощью которой судят о значении~параметра θ, называют Θ n – оценкой параметра θ.~Θ n = ϕ( x1 , x 2 ,..., x m )Выбор оценки, позволяющей получить хорошее приближение к оцениваемому параметру –задача исследования.Основные свойства оценокНесмещенность, эффективность и состоятельность.~~Оценка Θ n параметра θ называется несмещенной, если M( Θ n )=θ.~⎧⎪M (Θ n ) > ΘЕсли ⎨ ~– в оценке параметра θ имеется систематическая ошибка.⎪⎩M (Θ n ) < ΘНесмещенность оценки гарантирует отсутствие систематической ошибки в оценке параметра.Несмещенных оценок может быть несколько.~Tn – несмещенная оценка θ.Разброс параметров или рассеяние величины относительно математического ожидания θ~~характеризует дисперсия D( Θ n ), D( Tn ).Из двух или более несмещенных оценок предпочтение отдается оценке, обладающей меньшимрассеянием относительно оцениваемого параметра.~Оценка Θ n называется состоятельной, если она подчиняется закону больших чисел:~lim P (| Θ n − Θ |< ε) = 1n →∞На практике не всегда удается удовлетворить одновременно всем трем требованиям.Оценка математического ожидания по выборкеТеорема 1.
Среднее арифметическое X по n независимым наблюдениям над СВ x с МО mявляется несмещенной оценкой этого параметра.Доказательство: x1,x2,…,xnM(x)=mM(x1)=M(x2)=…=M(xn)=mnM (X ) = mX =xi / n~M (Θ n ) = Θi =1∑Теорема 2. Среднее арифметическое X по n независимым наблюдениям над СВ x с МО m идисперсией D(x)=σ2 является состоятельной оценкой МО.Доказательство: D(x)=σ2D(x1)=D(x2)=…=D(xn)=σ2D( X ) = σ 2 / nD( X ) σ 2= 2ε2nεlim P(| X − m |> ε) = 0P (| X − m |≥ ε) ≤n →∞lim P(| X − m |≤ ε) = 1n →∞Теорема 3. Если СВ Х распределена по нормальному закону с параметрами (m,σ2), тонесмещенная и состоятельная оценка X МО m имеет минимальную дисперсию σ2/n => Xявляется и эффективной.Оценки дисперсии по выборкеЕсли случайная выборка состоит из n независимых наблюдений над СВ Х с M(X)=m иD(X)=σ2, то выборочная дисперсия не является несмещенной оценкой дисперсии генеральнойсовокупности.171S =n2n( xi − x ) 2∑i =1σ2 n −1 2=σnnM (σ 2 ) = σ 2 −1 n~Несмещенной оценкой D(x) является S =( xi − x ) 2 , M ( S 2 ) = σ 2 .n − 1 i =1~Легко доказать по формуле Чебышева, что оценки S2 и S 2 являются состоятельнымиоценками дисперсии.Несмещенная, состоятельная и эффективная оценка дисперсии:1 n2S* =( xi − m) 2n i =1~Если МО генеральной совокупности неизвестно, то используют S 2 .Существуют регулярные методы получения оценок параметров генеральной совокупности поданным выборок.Методы оценки параметров генеральной совокупностиМетод наибольшего (максимального) правдоподобия (МНП)(ММП) обладает следующимидостоинствами:1.
Всегда приводит к состоятельным оценкам (иногда смещенным)2. Получаемые оценки распределены асимптотически нормально и имеют минимальновозможную дисперсию по сравнению с другими асимптотически нормальными оценками.Недостаток: требуется решать громоздкие системы уравнений.Имеется СВ Х, f(x,θ) – функция ее плотности вероятности, выражение которой известно.θ – неизвестный параметр, подлежащий оценке.x1, x2,…,xn – n независимых наблюдений над СВ x.В основе МНП лежит функция L(θ) – функция правдоподобия, формирующаяся с учетомсвойств многомерной функции распределения наблюдений над СВ х.f(x1, x2,…,xn,θ)=f(x1, θ)⋅f(x2,θ)⋅…⋅f(xn,θ)В указанное равенство подставляются данные и получаем функцию L(θ):L(θ)=f(x1, θ)⋅f(x2,θ)⋅…⋅f(xn,θ)~За максимальное правдоподобное значение параметра θ принимаем Θ n , при которой L(θ)максимально.~L'(θ)=0 => θmax= Θ n2∑∑Метод моментов(Метод Пирсона).Метод обладает следующими достоинствами:1.
Оценки получаемые этим методом всегда являются состоятельными.2. Метод моментов мало зависит от закона распределения случайной величины.3. Сложность вычисления незначительна.Известна случайная величина Х, которая характеризуется f(x, θ1, θ2…θq), аналитический видэтой функции известен.По выборке объёмом n х1,х2,х3,…хn – значения случайной величины в выборке вычисляемэмпирические начальные моменты случайной величины:18n1~M1 =n∑x1~M2 =nni~= M 1 ( x1 , x2 ,...xn )i =1∑xi~= M 2 ( x1 , x2 ,...xn )∑x~= M q ( x1 , x2 ,...xn )i =11~Mq =nnii =1Находим теоретические моменты:∞∫ xf (x,θ1 ,θ 2 ,...,θ q )dx = M 1 (θ1 ,θ 2 ,...,θ q )M1 =−∞∞2∫ x f (x,θ1 ,θ 2 ,...,θ q )dx = M 2 (θ1 ,θ 2 ,...,θ q )M2 =−∞∞Mq =q∫ x f (x,θ1 ,θ 2 ,...,θ q )dx = M q (θ1 ,θ 2 ,...,θ q )−∞Основная идея метода моментов заключается в приравнивании значения эмпирическихзначений моментов теоретическим.~M 1 ( x1 , x2 ,..., xn ) = M 1 (θ1 ,θ 2 ,...,θ q )~M 2 ( x1 , x2 ,..., xn ) = M 2 (θ1 ,θ 2 ,...,θ q )~M q ( x1 , x2 ,..., xn ) = M q (θ1 ,θ 2 ,...,θ q )Решим систему q-уравнений с q-неизвестными:θ1 = θ1 ( x1 , x2 ,..., xn )~~θ 2 = θ 2 ( x1 , x2 ,..., xn ) состоятельные оценки.~~θ q = θ q ( x1 , x2 ,..., xn )~~Состоятельность этих оценок основана на том, что эмпирические моменты при достаточнобольшом n (n→∞) стремится к теоретическим.
Выполняется закон больших чисел.{}~P Mq − Mq > ε = 0n→∞Распределение средней арифметической для выборкииз нормальной совокупности. Распределение Стьюдента.Выборочное среднее рассчитанное по конкретной выборке, есть конкретное число. Составвыборки случаен и среднее арифметическое вычисленное по элементам другой выборки того жеобъёма, будет число отличное от первого.X - средняя арифметическая величина меняющаяся от выборки к выборке.Теорема: Если случайная величина Х подчиняется нормальному закону с параметрами m иσ2 Х(m, σ2), а х1,х2,х3,…,хn – это выборка из генеральной совокупности, то средняяарифметическая:nxii =1 nX =∑19так же является случайной величиной подчиняющаяся нормальному закону с параметрами m иσ2/n, а нормированная случайная величина:t=X −mσnтак же подчиняется нормальному закону с параметрами (0;1).Предполагается при использовании таблиц интеграла вероятности, что объём выборки nдостаточно велик(n ≥ 30).Существует достаточно большое количество технических задач в которых не удаётся собратьвыборку такого объёма.