Ю.В. Прохоров, Л.С. Пономаренко - Лекции по теории вероятностей и математической статистике (1115359), страница 18
Текст из файла (страница 18)
обладают следующими свойствами:12πZπitke dt =1, k = 0,0, k =6 0−π12πZπint −imte edt =1, n = m.0, n =6 m(11.9)−πЗамечание. На множестве комплекснозначных функций, определенныхна [−π; π], для которыхZπ|f (t)|2 dt < ∞,−π120можно ввести скалярное произведениеZπ(f, g) =f (t)g(t)dt.−πТогда свойство (11.9) означает ортогональность функций eitn и eitm приm 6= n.Пусть∞∞XXitkf (t) =ck e ,|ck | < ∞.(11.10)k=−∞k−∞Умножим (11.10) на e−imt и проинтегрируем по отрезку [−π, π]. Тогдаполучим, используя свойства абсолютно сходящихся рядов, что12πZπ−imte−π∞X1f (t)dt =ck2πk=−∞Zπe−imt · eikt dt = cm .−πСледовательно, мы можем, зная характеристическую функцию, однозначно восстановить распределение целочисленной случайной величины.Тем самым доказана следующаяЛемма 11.7. Если f (t; x) — характеристическая функция случайной величины X, принимающей значение m с вероятностью pm (m = ±1, ±2, · · · ),тоZπ1e−itm f (t; X)dt.pm =2π−πЭта формула является аналогом формулы обращения для целочисленных случайных величин.Задача 11.3.
Предложите аналог формулы обращения для дискретныхслучайных величин.Лемма 11.8. Пусть выполнены условия леммы 11.7. Тогда для произвольных целых чисел m1 ≤ m21P{m1 ≤ X ≤ m2 } =2πZπSm1 ,m2 (t)f (t)dt,−πгде1Sm1 ,m21e−it(m2 + 2 ) − e−it(m1 − 2 ),=−2i sin 2t121(11.11)Доказательство.m2XP {m1 ≤ X ≤ m2 } =m=m11=2πZπm2Xf (t) ·−itmem=m1−πZπm2X1pm =e−itm f (t)dt =2πm=m1Zπ1dt =2πf (t) ·−πe−itm1 − e−it(m2 +1)dt.1 − e−it−πДомножив числитель и знаменатель дроби, стоящей под интегралом, наite 2 , получимZπ1P{m1 ≤ X ≤ m2 } =2πe−it(m1 −1/2) − e−it(m2 +1/2)it−π1=2πZπ−πite 2 − e− 2f (t)dt =e−it(m1 −1/2) − e−it(m2 +1/2)f (t)dt,2i sin 2tоткуда и следует утверждение леммы 11.8.Формула (11.11) является аналогом формулы обращения для функций распределения.Следствие 11.7.1. Для всех m1 ≤ m2|Sm1 ,m2 (t)| ≤2.| sin t/2|Лемма 11.9.
Еслиf (t) =Xck eitk ,XkkXdk eitk ,Xg(t) =|ck | < ∞,|dk | < ∞,kто1sup |cm − dm | ≤2πmZπ|f (t) − g(t)|dt,(11.12)−π mZπm22XX|f (t) − g(t)|1sup cm −dm ≤dt. 2π| sin t/2|m1 ≤m2 m=mm=m11−π122(11.13)Эта лемма позволяет оценить близость функций распределения, если известны соответствующие характеристические функции, и являетсяаналогом формулы обращения, приведенной без доказательства в теореме 11.3. Из леммы следует (для целочисленных случайных величин),что из сходимости характеристических функций fn (t) ⇒ g(t) вытекаетсходимость функций распределения Fn (x) → F (x) в каждой точке распределения F (x).Доказательство. Из леммы 11.7 следует, что для всех целых m1cm − dm =2πZπe−itx (f (t) − g(t)) dt,−πи, значит,1sup |cm − dm | ≤2πmZπ|f (t) − g(t)|dt.−πАналогично, применяя лемму 11.8 для m1 ≤ m2 , получаем mZπm22XX1|f (t) − g(t)|cm −dt.dm ≤m=m2π|sint/2|m=m11−πВернемся к схеме Пуассона: A1 , A2 , .
. . — независимые случайные события, P(Ak ) = pk , иnXµn (ω) =IAk (ω).k=1Характеристическая функция случайной величины µn (ω) равнаf (t; µn ) =nYf (t; IAk ) =k=1nYit(1 − pk + pk e ) =k=1Обозначим λ = Eµn =nPnY1 + pk (eit − 1) .k=1pk и рассмотрим случайную величину Y, име-k=1ющую распределение Пуассона с параметром λ :P{Y = m} =e−λ λm,m!123m = 0, 1, 2, . . .Нетрудно показать, чтоit −1)f (t; Y ) = eλ(e,EY = λ,DY = λ .Обозначим∆m = |P{µn = m} − P{Y = m}| .Теорема 11.9. Для схемы Бернулли, если pk = p ≤ 12 для всех k, иλ = np, то3 λ2.(11.14)∆m ≤ ·2 nДоказательство. В силу леммы 11.9 и неравенства леммы 11.5 имеемZπ n λ (eit −1) n 1it∆m ≤ 1 + p(e − 1) − e n dt ≤2π−π1≤2πZπitn 1 + p(eit − 1) − e−p(e −1) dt .−πitОбозначим z = e − 1 , тогда необходимо уметь оценивать сверху величину |epz − (1 + pz)|.
Учитывая, что при n → ∞ и фиксированном λ > 0,p → 0, то надо уметь это делать в малой окрестности 0.Лемма 11.10. Если z - комплексное число, такое что |z| ≤ 1, то|ez − (1 + z)| ≤ (e − 2)|z|2 .Действительно, 23zz112z+ · · · ≤ |z|+ + · · · = |z|2 · (e − 2).|e − (1 + z)| = +2!3!2! 3!Применим эту лемму к доказательству теоремы. Так как it−ititt itz = eit − 1 = e 2 e 2 − e 2 = 2i sin e 2 ,2то |z| ≤ 2| sin 2t | и при p ≤ 12 имеем |pz| ≤ 2p ≤ 1.Следовательно, можно применить лемму 11.10:t|epz − (1 + pz)| ≤ |pz|2 (e − 2) ≤ p2 · 4 sin2 · (e − 2).2Таким образом получаемZπ1t3 λ2∆m ≤ 2(e − 2)p2 n ·2 sin2 dt = 2(e − 2)p2 n ≤ · .2π22 n−πТеорема 11.9 доказана.124Рассмотрим теперь общий случай схемы Пуассона.Теорема 11.10.
Пусть A1 , A2 , . . . — независимые случайные события,такие, что pk = P(Ak ) ≤ 12 . Тогдаn3 X 2∆m = |P{µn = m} − P{Y = m}| ≤ ·p .2 k=1 kДоказательство. Из леммы 11.9 следует, чтоZπ YnnY1it1 + pk (eit − 1) −∆m ≤epk (e −1) dt.2π −πk=1(11.15)k=1Для оценки подынтегральной функции воспользуемся следующей леммой.Лемма 11.11.
Пусть αk , βk (k = 1, 2, . . . , n) — комплексные числа, такиечто |αk | ≤ 1, |βk | ≤ 1. Тогда nnn XYY|αk − βk |.β≤α−kkk=1k=1k=1Доказательство леммы проведем по индукции. При n = 1 утверждение леммы выполняется тривиальным образом. Допустив верностьутверждения для некоторого n, для n + 1 получаем|α1 · . . . · αn αn+1 − β1 · . . . · βn βn+1 | ≤ |α1 . . .
αn αn+1 − α1 · · · αn βn+1 |+nnnYYYβk ≤+|α1 · · · αn βn+1 −β1 · · · βn βn+1 | ≤ |αn+1 −βn+1 |· αk +|βn+1 |· αk −k=1≤ |αn+1 − βn+1 | +nX|αk − βk | =k=1n+1Xk=1k=1|αk − βk |.k=1Воспользовавшись этой леммой, из (11.15) получаем1∆m ≤2πZπ Xn itpk (eit −1) 1+p(e−1)−e dt.k−π k=1Если все pk ≤ 21 , то снова можно применять лемму 11.10, получим1∆m ≤2πZπ Xn−πZπnnXt13X 22222 tpk ·4 sin (e−2)dt ≤ 2(e−2)pk2 sin dt ≤ ·p .22π22 k=1 kk=1k=1−π125Замечание.
Пуассоновское приближение имеет смысл применять,nPкогда величина λ =p2k мала.k=1Приведем несколько примеров.Пример 11.15. Пусть в схеме Бернулли n = 1000; p = 0, 01. Тогдаλ = 10. Вычисляя по формулам биномиального распределения с точностью до пятого знака после запятой, получимP{µn = 10} = 0.12574,тогда как пуассоновская вероятность равна 0.12511, ∆10 = 0.00063.Неравенство теоремы 11.9 для этой величины дает оценку∆103 λ2≤= 0, 152nМы видим,что оценка довольно грубая.Пример 11.16.
Пусть n = 100, p = 0.01, λ = 1. Тогда P{µn = 3} =0.066999, а пуассоновская аппроксимация дает 0.061313. Здесь расхождение ∆3 = 0.005686 сравнимо с оценкой теоремы, согласно которой∆m ≤ 0.01.126Глава 12Задачи математическойстатистики. Основные понятияВ качестве вступительного слова к новой части нашего курса — математической статистике,— приведем цитату из статьи академикаА.
Н. Колмогорова из БСЭ:"Математическая статистика — раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этомстатистическими данными называют сведения о числе объектов в какойлибо более или менее обширной совокупности, обладающих теми илииными признаками."Ставший классическим учебник Г. Крамера "Методы математической статистики"содержит множество различных примеров статистических данных.
Упомянем несколько из них:данные о возрасте родителей для проверки гипотезы о влиянии возраста родителей на пол ребенка;данные об уровнях воды в озере Вэнерн за 1807-1930г.г., которые использовались при проектировании плотины и т.д.В "Таблицах математической статистики"авторов Л. Н. Большева иН. В. Смирнова половину объема всей книги составляет текст, в которомв рецептурной форме даются рекомендации по решению прикладных задач.Теория вероятностей дает математический аппарат для решения задач математической статистики.Результаты наблюдений в математической статистике трактуются какзначения независимых и одинаково распределенных случайных величинX1 , X2 , .
. . , Xn . В некоторых случаях это могут быть и случайные векторы, и зависимые случайные величины с некоторым совместным распре127делением вероятностей.Как правило, мы будем отдельно разбирать следующие случаи:• распределение случайных величин X1 , X2 , . . . , Xn непрерывно и имеет плотность распределения вероятностей;• распределение случайных величин дискретное.Часто доказательство теорем мы будем проводить на примере одногоиз этих случаев, хотя утверждения теорем могут быть верны и в болееобщих ситуациях.Что касается числа наблюдений n, то различают следующие ситуации:1) большие выборки, когда число наблюдений n велико ( порядканескольких сотен ), тогда используют асимптотические теоремытеории вероятностей;2) умеренные выборки ( 30 ≤ n ≤ 100);3) малые выборки (n ≤ 30).В математической статистике независимые одинаково распределенные случайные величины X1 , X2 , .
. . , Xn с общей функцией распределения F (x), называют случайной выборкой объема n из генеральной совокупности с распределением F (x).Приведем также классификацию основных задач математической статистики по характеру статистических выводов.1) Проверка статистических гипотез. Во многих задачах формулируется некоторая гипотеза ( например, гипотеза о влиянии возрастародителей на пол ребенка ), которая может быть принята или отвергнута на основании статистических данных.2) Оценивание неизвестных параметров распределения. Различают оценки точечные и интервальные.3) Определение видов зависимостей между различными объектами.В математической статистике вместо вероятностного пространства(Ω, F, P) рассматривают семейства вероятностных пространств {(Ω, F, P),P ∈ P}, где P — семейство вероятностных распределений на (Ω, F). Этосемейство распределений может быть параметрическим, например, семейство нормальных распределений с двумя параметрами (a, σ 2 ).