Теория универа (555138), страница 10
Текст из файла (страница 10)
В частности, если Х – дискретнаяслучайная величина, заданная рядом распределения, тоng (t ) = ∑ e itxk p k .(14. 2)k =1Для непрерывной случайной величины с плотностью распределения f(x)g (t ) =+∞∫eitxf ( x)dx.(14.3)−∞Пример 1. Пусть Х – число выпадений 6 очков при одном броске игральной кости. Тогда по51 5 + e it.формуле (14.2) g(t) = e it ⋅0 ⋅ + e it ⋅1 ⋅ =666Пример 2.
Найдем характеристическую функцию для нормированной непрерывнойx21 − 2 e. Послучайной величины, распределенной по нормальному закону f ( x) =2πформуле (14.3) g (t ) =+∞∫eitx−∞+∞∫e−∞− Ax 2 ± 2 Bx − Cπ −dx =eAAC − B 2A12πe−x22dx =12π+∞∫eitx −x22dx = e−t22( использовалась формула−∞и то, что i² = -1).Свойства характеристических функций.1. Функцию f(x) можно найти по известной функции g(t) по формуле+∞1f ( x) =e −itx g (t )dt.(14.4)2π −∫∞( преобразование (14.3) называется преобразованием Фурье, а преобразование (14.4) –обратным преобразованием Фурье ).2. Если случайные величины Х и Y связаны соотношением Y = aX, то их характеристическиефункции связаны соотношениемgy (t) = gx (at).(14.5)49PDF created with FinePrint pdfFactory trial version http://www.fineprint.com3.
Характеристическая функция суммы независимых случайных величин равна произведениюnхарактеристических функций слагаемых: для Y = ∑ X kk =1g y (t ) = g x1 (t ) ⋅ g x2 (t ) ⋅ ... ⋅ g xn (t )(14.6)Теорема 14.1 (центральная предельная теорема для одинаково распределенных слагаемых). Если Х1, Х2,…, Хп,… - независимые случайные величины с одинаковым закономраспределения, математическим ожиданием т и дисперсией σ2, то при неограниченномnувеличении п закон распределения суммы Yn = ∑ X k неограниченно приближается к норk =1мальному.Доказательство.Докажем теорему для непрерывных случайных величин Х1, Х2,…, Хп (доказательство длядискретных величин аналогично). Согласно условию теоремы, характеристические функциислагаемых одинаковы: g x (t ) =+∞∫eitxf ( x)dx. Тогда по свойству 3 характеристическая функция−∞суммы Yn будет g yn (t ) = g xn (t ).
Разложим функцию gx(t) в ряд Маклорена: g ′′ (0)g x (t ) = g x (0) + g ′x (0)t + x+ α (t ) t 2 , где α (t ) → 0 при t → 0 . 2Найдем g x (0) =+∞∫−∞+∞f ( x)dx = 1, g ′x (0) = ∫ ixe itx f ( x )dx−∞+∞t=0= i ∫ xe itx f ( x)dx−∞+∞t =0= i ∫ xf ( x )dx = im.−∞Если предположить, что т = 0 ( то есть перенести начало отсчета в точку т ), то g ′x (0) = 0 .+∞g ′x′ (0) = − ∫ x 2 e itx f ( x)dx−∞+∞t=0= − ∫ x 2 f ( x)dx = −σ 2 (так как т = 0). Подставив полученные−∞результаты в формулу Маклорена, найдем, чтоσ 2g x (t ) = 1 − − α (t ) t 2 . 2Рассмотрим новую случайную величину Z n =Yn, отличающуюся от Yn тем, что ееσ nдисперсия при любом п равна 0.
Так как Yn и Zn связаны линейной зависимостью, достаточнодоказать, что Zn распределена по нормальному закону, или, что то же самое, что ее характеристическая функция приближается к характеристической функции нормального закона (см.пример 2). По свойству характеристических функцийn σ 2 t t 2 t t .g zn (t ) = g yn = g x = 1 − − α 2 σ n σ n σ n nσ 2Прологарифмируем полученное выражение:σ 2 t t 2− α , lim k = 0.ln g zn (t ) = n ln(1 − k ), где k = 2n →∞ σ n nσ 2Разложим ln(1 − k ) в ряд при п → ∞, ограничившись двумя членами разложения, тогдаln(1 - k) ≈ - k. Отсюдаn50PDF created with FinePrint pdfFactory trial version http://www.fineprint.comt2t2 t = − + lim 2 α , где последний2 n→∞ σσ n t2предел равен 0, так как α (t ) → 0 при t → 0 .
Следовательно, lim ln g zn (t ) = − , то естьn →∞2 t2 t t2lim ln g zn (t ) = lim n ⋅ (−k ) = lim − + α 2n →∞n→∞n →∞σ n σ 2lim g zn (t ) = en →∞−t22- характеристическая функция нормального распределения. Итак, принеограниченном увеличении числа слагаемых характеристическая функция величины Znнеограниченно приближается к характеристической функции нормального закона; следовательно, закон распределения Zn ( и Yn) неограниченно приближается к нормальному. Теоремадоказана.А.М.Ляпунов доказал центральную предельную теорему для условий более общего вида:Теорема 14.2 (теорема Ляпунова).
Если случайная величина Х представляет собой суммуочень большого числа взаимно независимых случайных величин, для которых выполненоусловие:n∑blimn →∞k =1k32,(14.7) ∑ Dk k =1 где bk – третий абсолютный центральный момент величины Хк, а Dk – ее дисперсия, то Химеет распределение, близкое к нормальному ( условие Ляпунова означает, что влияниекаждого слагаемого на сумму ничтожно мало).nПрактически можно использовать центральную предельную теорему при достаточнонебольшом количестве слагаемых, так как вероятностные расчеты требуют сравнительномалой точности.
Опыт показывает, что для суммы даже десяти и менее слагаемых закон ихраспределения можно заменить нормальным.Частным случаем центральной предельной теоремы для дискретных случайных величинявляется теорема Муавра-Лапласа.Теорема 14.3 (теорема Муавра-Лапласа). Если производится п независимых опытов, вкаждом из которых событие А появляется с вероятностью р, то справедливо соотношение:Y − npp α << β = Φ( β ) − Φ(α ),(14.8)npqгде Y – число появлений события А в п опытах, q = 1 – p.Доказательство.nБудем считать, что Y = ∑ X i , где Хi – число появлений события А в i-м опыте. Тогда случайi =1ную величину Z =Y − my(см. теорему 14.1) можно считать распределенной по нормальномуσyзакону и нормированной, следовательно, вероятность ее попадания в интервал (α, β) можнонайти по формулеp(α < Z < β ) = Φ( β ) − Φ(α ) .Поскольку Y имеет биномиальное распределение, т у = пр, D y = npq, σ y = npq .
ТогдаZ=Y − npnpqСледствие.. Подставляя это выражение в предыдущую формулу, получим равенство (14.8).51PDF created with FinePrint pdfFactory trial version http://www.fineprint.comВ условиях теоремы Муавра-Лапласа вероятность р n (k ) того, что событие А появится в попытах ровно k раз, при большом количестве опытов можно найти по формуле:1p n (k ) ≈⋅ ϕ ( x),(14.9)npqгде x =k − npnpqx2, а ϕ ( x) =1 −2e (значения этой функции приводятся в специальных2πтаблицах).Пример 3. Найти вероятность того, что при 100 бросках монеты число выпадений гербаокажется в пределах от 40 до 60.Применим формулу (14.8), учитывая, что п = 0,5.
Тогда пр = 100·0,5 = 50,Y − 50npq = 100 ⋅ 0,5 ⋅ (1 − 0,5) = 5. Тогда, если 40 < Y < 60, −2 << 2. Следовательно,5Y − 50p (40 < Y < 60 ) = p − 2 << 2 = Φ (2) − Φ (−2) = 0,9772 − 0,0228 = 0,9544.5Пример 4. В условиях предыдущего примера найти вероятность того, что выпадет 45 гербов.45 − 50111= −1 , тогда p100 (45) ≈ ⋅ ϕ (−1) = ⋅ ϕ (1) = ⋅ 0,2420 = 0,0484.Найдем x =555552PDF created with FinePrint pdfFactory trial version http://www.fineprint.comЛекция 15.Основные понятия математической статистики. Генеральная совокупность и выборка.Вариационный ряд, статистический ряд. Группированная выборка.
Группированныйстатистический ряд. Полигон частот. Выборочная функция распределения игистограмма.Математическая статистика занимается установлением закономерностей, которым подчиненымассовые случайные явления, на основе обработки статистических данных, полученных врезультате наблюдений. Двумя основными задачами математической статистики являются:- определение способов сбора и группировки этих статистических данных;- разработка методов анализа полученных данных в зависимости от целей исследования, ккоторым относятся:а) оценка неизвестной вероятности события; оценка неизвестной функции распределения;оценка параметров распределения, вид которого известен; оценка зависимости от другихслучайных величин и т.д.;б) проверка статистических гипотез о виде неизвестного распределения или о значенияхпараметров известного распределения.Для решения этих задач необходимо выбрать из большой совокупности однородных объектовограниченное количество объектов, по результатам изучения которых можно сделать прогнозотносительно исследуемого признака этих объектов.Определим основные понятия математической статистики.Генеральная совокупность – все множество имеющихся объектов.Выборка – набор объектов, случайно отобранных из генеральной совокупности.Объем генеральной совокупности N и объем выборки n – число объектов в рассматриваемой совокупности.Виды выборки:Повторная – каждый отобранный объект перед выбором следующего возвращается вгенеральную совокупность;Бесповторная – отобранный объект в генеральную совокупность не возвращается.Замечание.
Для того, чтобы по исследованию выборки можно было сделать выводы о поведении интересующего нас признака генеральной совокупности, нужно, чтобы выборка правильно представляла пропорции генеральной совокупности, то есть была репрезентативной(представительной). Учитывая закон больших чисел, можно утверждать, что это условиевыполняется, если каждый объект выбран случайно, причем для любого объекта вероятностьпопасть в выборку одинакова.Первичная обработка результатов.Пусть интересующая нас случайная величина Х принимает в выборке значение х1 п1 раз, х2 –п2 раз, …, хк – пк раз, причемk∑ni =1k= n, где п – объем выборки.
Тогда наблюдаемые значенияслучайной величины х1, х2,…, хк называют вариантами, а п1, п2,…, пк – частотами. Еслиnразделить каждую частоту на объем выборки, то получим относительные частоты wi = i .nПоследовательность вариант, записанных в порядке возрастания, называют вариационнымрядом, а перечень вариант и соответствующих им частот или относительных частот – статистическим рядом:xix1x2…xknin1n2…nkwiw1w2…wk53PDF created with FinePrint pdfFactory trial version http://www.fineprint.comПример.При проведении 20 серий из 10 бросков игральной кости число выпадений шести очковоказалось равным 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2,3,4,1.Составим вариационный ряд: 0,1,2,3,4,5.Статистический ряд для абсолютных и относительных частот имеет вид:xi012345ni365321wi0,150,30,250,150,10,05Если исследуется некоторый непрерывный признак, то вариационный ряд может состоять изочень большого количества чисел.
В этом случае удобнее использовать группированнуювыборку. Для ее получения интервал, в котором заключены все наблюдаемые значенияпризнака, разбивают на несколько равных частичных интервалов длиной h, а затем находятдля каждого частичного интервала ni – сумму частот вариант, попавших в i-й интервал.Составленная по этим результатам таблица называется группированным статистическимрядом:Номера12…kинтерваловГраницы(a, a + h)(a + h, a + 2h)…(b – h, b)интерваловСумма частотn1n2…nkвариант, попавших в интервалПолигон частот. Выборочная функция распределения и гистограмма.Для наглядного представления о поведении исследуемой случайной величины в выборкеможно строить различные графики. Один из них – полигон частот: ломаная, отрезки которойсоединяют точки с координатами (x1, n1), (x2, n2),…, (xk, nk), где xi откладываются на осиабсцисс, а ni – на оси ординат.