А.Н. Бородин - Элементарный курс теории вероятностей и математической статистики (DJVU) (1115320), страница 21
Текст из файла (страница 21)
Воспользуемся схемой Бернулли Я 8). Будем говорить, что в 1-м испытании наступил успех, если (Х~ < х), и неудача, если (Х~ > х). Тогда вероятность успеха р = Р(Х~ < х) = = Г(х), а вероятность неудачи е = Р(Х~ > х) = 1 — Г(х). По формуле Бернулли (8.1) вероятность наступления ровно х успехов равна С,",рьян" ь, и эта вероятность равна вероятной сти события (Г„(х) = -). Что и требовалось доказать. а В рамках приведенной схемы легко вычислить функцию распределения порядковой статистики К(„,р Событие (Х1 1 < х) означает, что наступило не менее чем т событий вида (Х~ < х),! = 1, 2,..., в.
Вероятность такого события по формулам (8.2), (8.3) равна в Р(Х(зз) < х) = Рп(т, в) = ~ С„(Г(*)) (1 — Г(х)) й=~л ю-1 = 1- ~~ ' С„"(Г(х))'(1 — Г(х))"-'. а=о Лля крайних порядковых статистик эти формулы принимают простой вид: Р(ХВ1 < х) = 1 — (1 — Г(х))", Р(Х( 1 < х) = (Г(х))". МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Пример 2. Пусть наблюдается следующая реализация выборки: 0.2; -1.7; -3.6; 2.1; 5.2; -3.4; 4.1; 1.8; -1,3; 2.6.
График емпирической функции распределения для етой реализации имеет вид .вввв вт вв вв тв вт вв ° т вв Рис. 9 Это ступенчатая функция, имеющая в точках выборки скачки размера 0.1. Следующий результат утверждает, что емпирическая функция распределения Г„(х) является хорошей оценкой для функции распределения Г(х). Теорема 1 (Гливеико). С еероллткостьвт едиккца ара знр !Го(х) — Г(х)) -+ О. (18.1) влит Л о к а з а т е л ь с т в о. Мы докажем ото утверждение лишь для случая, когда функция распределения Г(х) непрерывна. Лля произвольной функции Г(х) доказательство осуществляется аналогично, хотя и требует дополнительных рассуждений. Пусть е > 0 — произвольное малое число, для которого число тп = 1/е целое.
Так как функция Г(х) непрерывна и не убывает, то можно выбрать такую возрастающую последовательность чисел хо = — оо, хн..., х,„и х„= со, что Г(хо) = О, Г(хт) = е, ..., Г(хь) = еЕ, ..., Г(х, ) = 1. 1В. СЛУЧАЙНАЯ ВЫБОРКА Поскольку фунции Г„(х) и Г(х) являются неубывающими, то для любого й и х Б [хм хе+1) справедливы соотношения Гв(х) — Г(х) < Гв(хв+1) — Г(хь) = Гв(хь+1) — Г(хь+1) + е, Г (х) — Г(х) > Г (хь) — Г(хв+1) = Г (хв) — Г(хв) — в.
Отсюда следует, что ввр ~Г„(х) — Г(х)~ < шах ~Г„(хв) — Г(хв)~+ в. (18.2) вен~ Оьвьт Положим 11 = М( 1(Х1), Поскольку величины Х1 независимы и одинаково распределены, то и величины У1 независимы и одинаково распределены. В силу определения математического ожидания и первого свойства дисперсии имеем Е(11) = Е(11( 1(Х1)) = Р(Х1 Б (-со, х)) = Р(Х1 < х) = Г(х), 11(У1) = Е(1(( )(Х1)) — Е~(У1) = = Г(х) — Г'(х) = Г(х)(1 — Г(х)) < 1. Тогда, согласно закону больших чисел (теорема 1, 1 16), для любого фиксированного х в Г,(х) = — У У1 -+ ЕЯ) = Г(х) 1т1 с вероятностью единица. Поэтому для конечного набора точек хв, х1,..., х каждое из предельных соотношений Г (хв) -+ Г(хв), 1'= 0,1,...,н1, будет выполняться с вероятностью единица.
Теперь, принимая во внимание оценку (18.2), получим, что с вероятностью единица 1ппвир вор ~Г„(х) — Г(х)( < е = —. е сО вен1 т Событие, состоящее из тех исходов, для которых выполняется это неравенство, обозначим йт. Это неравенство справедливо для всех натуральных ш.
Следовательно, для тех МАТЕМАТИЧЕСКАЯ СТАТИСТИКА И2 исходов, которые входят во все события 0,» одновременно, т. е. входят в произведение П й , выполняетсн соотношение (18.1). Согласно Лемме 1 26 Р(П~~ П ) =1. Таким образом, мноисество исходов, для которых выполняется соотношение (18.1), имеет вероятность единица. Сформулируем без доказательства еще один результат, который характеризует качество оценки Р„(е). Из него следует, что оценка Р„(г) является достаточно хорошей оценкой функции распределения Р(е). Теорема 2 (Колмогорова). Пустиь 2', (-1) ехр(-2!згх), ере О < х, К(с) = О, вре с <О, — функция распределения Колмогорова.
Тоада, если рувх- йел расвредсленил Р(х) ксерсуиеке, ею длл' любоео г Р(~~~ шах [Р„(е) — Р(е)[ < х) -~ А,(с), ври в — оо. »ен' Этот результат можно переформулировать следующим образом: случайная величина Х» = ~/вшах ен [Р»(е) — Р(г)[ при больших в имеет функцию распределения, мало отличающуюся от ~С(с). В силу етого, для любого наперед заданного малого числа а, выбирая х1 „так, чтобы А,(с1 ) = 1-о, мы получим, что оценка шех»ен1 [Р„(х) — Р(е)[ < — ' выпол- 4» няется с вероятностью, приблизительно равной 1 — а.
Таким образом, с вероятностью, близкой к единице, для всех х оценка Р„(х) отличается от Р(е) не более, чем на с1 /~/й, Перейдем к оцениванию плотности распределения случайной величины Х. Пусть у(е) — плотность распределе- ниЯ величины Х, и пУсть (ХиХз,..., Х„) — слУчайнаЯ выборка, отвечающая величине Х. Выберем произвольное число И ) О. Положим еь = [г(И)И, где [а) — обозначает целую часть числа а, т. е. [а) — наибольшее целое число, не превосходящее а (например: [2.31] = 2, [ — 2.1Ц = — 3). О п р е д е л е н и е 3. Эмпирической плотностью распределения, построенной по случайной выборке (Х2, Хз,..., Х„), тв.
сльчдйнди выборка авз называется случайная функция в 1 ~» в(х) = — ь ~~ й[вв вв+ь)(Ха). "" ма Рассмотрим ату функцию подробнее. Когда х пробегает всю вещественную ось от -со до оо, число Ь = [х(Ь) принимает все целые значения..., -2, -1, 0, 1,2,.... Обозначим аав — число тех значений величин Ха, которые попадают в интервал [И, (Ь+1)Ь), т.
е. ив = ",> йр,» 14+ а1в1(Ха). При И ( х ( (Ь+1)Ь Ма имеем й = [х/Л),хь = И, и, следовательно, Д в(х) = — ". Теперь ясно, как построить график функции Д,ь(х), который называется гистограммой распределения случайной величины Х. Нужно разбить всю вещественную ось на интервалы длины Ь и каждому интервалу [ЬЬ,(Й+ 1)Ь) сопоставить число —. ва Пример 3. Пусть дана следующая реализация выборки, состоящей из 20 компонент: 0.78; -0.12; -0.61; 0.92; 0.55; 1.63; -1.16; 0.01; -0.45; 0.20; -0.38; 0.62; 0.46; -0.22; 1.11; -0.77; 0.37; 0.72; -0.24; 0.42.
Гистограмма с шагом Ь = 0.4 длл втой реализации имеет следующий вид: ва.«влвввввваввав в вв ав 1а авм ав ав за Рис. 10 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Эмпирическая плотность распределения у„,л(х) используется в качестве оценки для у(х) — плотности распределения случайной величины Х. Теорема 3 (о сходимости эмпирических плотностей распределения). Пустпг и -+ оо и Ь ~ О так, что пЬ -+ оо. Тогда в каждой точке х, в которой ваотностпг Дх) ненрернвна, уп,л(х) -+ Дх) во вероятности.
Локазательство. В целях упрощения доказательства мы не будем переходить к пределу одновременно при и -+ оо, Ь -+ О и нЬ -+ оо. Предельный переход будет осуществлен последовательно. Сначала перейдем к пределу при и ~ оо при фиксированном Ь, а затем — при Ь -+ О. Предложенное ниже доказательство хорошо отражает существо дела. Локазательство утверждения теоремы 3, в котором осуществляется одновременный предельный переход,не намного сложнее, но оно использует вариант закона больших чисел, который мы не рассматривали. Положим гт = 31е,,е,+л1(Хт). Как и ХЬ величины т1 ЯвлЯ- ются независимыми и одинаково распределенными. Математическое ожидание и дисперсия величины 1'т имеют вид Е(1'~) = Р(Х Е [хл, ха + Ь)), Р(Ут) = Р(Х Е [хл, хл + Ь)) — Р'(Х Е [хл, хл + Ь)) 4 1.
Применяя закон больших чисел (теорема 1, З 16), получим, что при н- оо е Уп,л(х) = — л~' ут -+ тЕ(ут) = -Р(Х е [хл,хл+ Ь)) по вероятности. Лалее, поскольку 1(х) непрерывна, а хл -т х при Ь -+О, имеем -„Р(Х Е [хмхл+ Ь)) = —, Яу)т1у -+ у(х) Таким образом установлено, что по вероятности 1пп 1нп уп,л(х) = Дх). е 18. СЛУЧАЙНАЯ ВЫБОРКА Именно это мы и планировали доказать. Замечание 5. Чтобы обеспечить выполнение условий теоремы 3, следует при построении эмпирической плотности распределения выбирать Б в зависимости от в так, чтобы при больших п и малых Ь произведение вл тоже было большим, например, А = Ц1/й.
В дальнейшем нам потребуется следующая характеристика функции распределения. Определение 2. Кввнтилью порядка р функции распределения г'(х) называется такое число хр, для которого г'(хр) < р, а ]ппаЫ, Г(х) ) р, если оно единственно, а если множество таких чисел составляет целый интервал, то полагаем хр — средняя точка интервала.. Для непрерывной строго возрастающей функшш Г(х) при любом 0 < р < 1 квантиль хр единственна и г'(хр) = р. Квантиль порядка 1/2 функции распределения г'(х) называют медианой распределения. Для случайной величины с непрерывной строго возрастающей функцией распределения вероятность того, что величина примет значение меньше медианы равна вероятности того, что она примет значение больше медианы и равна 1/2.
Многие численные характеристики эмпирического распределения служат в качестве выборочных характеристик. Определим выборочную квантиль порядка р, как кван- тиль порядка р для эмпирического распределения Р„(х), т. е. определим ее равенством Х([ар]+1) ~ если пр — не целое число, хр 1 -(Хбярй + Хбар].рц), если вр — целое число, где (а] — целая часть числа а. Выборочная медиана — это медиана эмпирического распределения.
Она равна величине Х1х.р~), если н = 23 + 1— 1 нечетное, и -(Х11) + Х11~1)), если и = 21 — четное. 2 В следующем параграфе речь пойдет о других выборочных характеристиках. Задача 1. Вычислить выборочную каантиль порядка р = = 0.35 для реализации выборки из примера 2. Определить выборочную медиану. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Решение. В примере 2 х<,>— - — 3.6, х<,>-— — 3.4, х<,> — --1.7, х<,>— - -1.3, х<ь> = 0.2, х<е> = 1.8,х<г> = 2-1, х<а> = 2.6, х<х> = 41 х<„> —- 5.2.
Так как я=10, то [вр)= [3.5] = 3. Следовательно, до за=х<,> — — 1.3. Поскольку 10 — четное число, то выбороч- 1 1 ная медиана равна -(х<,>+с<,>) = -(0.2+1.8)=1. 2 2 319. Оценки ПАРАметгов РАСПРЕДЕЛЕНИЯ. ВЫБОРОЧНЫЕ МОМЕНТЫ Пусть Х = (Х>,Х2,..., Х„) — случайная выборка, отвечающая величине Х с функцией распределения г'(х). Пусть д— некоторый параметр, характеризующий распределение случайной величины Х,например, д = Е(Х) — математическое ожидание, или д = В(Х) — дисперсия, или д = Е(Х1) — момент порядка х.
Пусть по случайной выборке Х для параметра д построена некоторая оценка Т„(Х), которая является случайной величиной. Определение 1. Оценка Т»(я) называется состоятельной оценкой параметра д, если Т„(Х) — д по вероятности при и -> оо. В атом определении, если говорить абсолютно строго, речь идет о состоятельной последовательности оценок, а термин "состоятельная оценка,"служит сокращенным названием для этого понятия. Определение 2.
Оценка Т„(Х) называется несмещенной оценкой праметра д, если Е(у„(Х)) = д. Определение 3. ОценкаТ„(Х) называетсяинвариантной относительно сдвига (безразличной к сдвигу), если для любой постоянной с Т„(Х> + с, Хз + с,..., Х„+ с) = Т„(Х» Хз > °, Х„). Рассмотрим конкретные оценки параметров распределения случайной величины Х.