4 часть (1081361), страница 37
Текст из файла (страница 37)
Построить вариационный и статистический ряды полученной выборки и определить ее размах. При большом объеме выборки ее элементы объединяют в группы (разряды), представляя результаты опытов в виде группированноео статистического ряда. Для этого интервал, содержащий все элементы выборки, разбивается на й непересекающихся интервалов. Вычисления значительно упрощаются, если этн интервалы имеют одинаковую длину б —. Во всем дальнейшем изложении рассматривается именно этот lс случай. После того как частичные интервалы выбраны, определяют частоты — количество и; элементов выборки, попавших в е-й интервал (элемент, совпадающий с верхней границей интервала, относится к последующему интервалу). Получающийся статистический ряд в верхней строке содержит середины д! интервалов группировки, а в нижней— частоты и; (! = 1, 2, ..., к).
Наряду с частотамн одновременно подсчитываются также накопленные частоты ~ пап относительные частоты Пуп н накопленные отноу=! ь ! ) Здесь в а дальнейшем а суммах вила 2 и! будем опускать верхний и =1 ввжнвй индексы. Гл. 19. Математическая статистика 188 сительные частоты ~~ пз/и, 1 = 1, 2,..., й. Полученные результаты з=1 сводятся в таблицу, называемую спаблииеб частот зруппированной выборки. Следует помнить, что группировка выборки вносит погрешность в дальнейшие вычисления, которая растет с уменьшением числа интервалов.
Пример 2. Представить выборку 55 наблюдений в виде таблицы частот, используя 7 интервалов группировки. Выборка: 20,3 15,4 17,2 19,2 23,3 18,1 21,9 15,3 16,8 13,2 20,4 16,5 19,7 20,5 14,3 20,1 16,8 14,7 20,8 19,5 15,3 19,3 17,8 16,2 15,7 22,8 21,9 12,5 10,1 21,1 18,3 14,7 14,5 18,1 18,4 13,9 19,1 18,5 20,2 23,8 16,7 20,4 19,5 17,2 19,6 17,8 21,3 17,5 19,4 17,8 13,5 17,8 11,8 18,6 19,1 а Размах выборки ю = 23,8 — 10,1 — 13,7.
Длина интервала группировки Ь = 13,7/7 2. В качестве первого интервала удобно взять интервал 10-12. Результаты группировки сведены в таблицу 1.1. с Таблица 1.1 В задачах 19.5, 19.6 найти размах выборки, число и длину интервалов, а также составить таблицу частот (границы первого интервала указываются). 19.5. Время решения контрольной задачи учениками 4-го класса (в секундах): 38 60 41 51 33 42 4о 21 53 60 68 52 47 46 49 49 14 57 54 59 77 47 28 48 58 32 42 58 61 30 61 35 47 72 41 45 44 55 30 40 67 65 39 48 43 60 54 42 59 50 Первый интервал: 14-23. Э 1. Методы статистического описания еэультатов наблюдений 189 19.6.
Продолжительность работы электронных ламп одного типа (в часах): 13,4 14,7 15,2 15,1 13,0 8,8 14,0 17,9 15,1 16,5 16,6 14,2 16,3 14,6 11,7 16,4 15,1 17,6 14,1 18,8 11,6 13,9 18,0 12,4 17,2 14,5 16,3 13,7 15,5 16,2 8,4 14,7 15,4 11,3 10,7 16,9 15,8 16,1 12,3 14,0 17,7 14,7 16,2 17,1 10,1 15,8 18,3 17,5 12.,7 20,7 13,5 14,0 15,7 21,9 14,3 17,7 15,4 10,9 18,2 17,3 15,2 16,7 17,3 12,1 19,2 Первый интервал: 8,4 — 10,4.
Пусть (хы хг, ..., х„) — выборка из генеральной совокупности с функцией распределения Г„(х). Распределением выборки назьшастсл распределение дискретной случайной величины, принимающей значения хы хг, ..., х„с вероятностями 1/и. Соответствующая функция распределении называстсл эмпирической (выборочной) функцией распределения и обозначаетсл Г„"(х). Эмпирическал функцйл распределении определлетсп по значенилм накопленных частот соотношением Г,*, (х) = — ~ ~п„ 1 (1) п е,<е где суммируются частоты тех элементов выборки, длл которых выполилетсл неравенство г, < х.
Очевидно, что Г„'(х) = 0 при х < х10 и Г„' (х) = 1 при х > х~ "~. На промежутке (х0~, х~"~) Г„" (х) представляет собой неубывающую кусочно постоянную функцию. Аналогично формуле (1) определпетсл змпирическап функция распределения длл группированной выборки. Значение эмпирической функции распределения для статистики определпетсп следующим утверждением. Теорема (Гливенко). Пусгпь Г„" (х) — эмпирическая функция распределения, построенная по выборке объема и аэ генеральной совокупности с функцией распределения Г„(х). Тогда для любого х е Е ( — со, +ос) и любого е > 0 Пш Р (~ Г„' (х) — Г„(х) ~ < е) = 1. Таким образом, при каждом х Г;, (х) сходится по вероятности к Г„(х) и, следовательно, при большом объеме выборки может служить приближенным значением (оценкой) функции распределенил генеральной совокупности в каждой точке х. В рлдс случаев для наглндного представленип выборки используют гистограмму и полигон частот.
Гистограммой частот группированной выборки называетсп кусочно постоянная функции, постолннал на интервалах группировки и — и' цринимаюшал на каждом из них значения —, 1 = 1, 2, ..., к соответ- 5' отвеина. Площадь ступенчатой фигуры под графиком гистограммы равна объему выборки п. 190 Гл.19. Математическая статистика Аналогично определлстся гистограмма относительных чистоп! Площадь соответствующей ступенчатой фигуры для нее равна единице, При увеличении объема выборки и уменьшении интервала группировки гистограмма относительных частот является статистическим аналогом плотности распределения ух !т) генеральной совокупности. Полигоном частот называется ломаная с вершинами в точках ( ) = п~ 1 го — ), ! = 1 2, ..., lс, а полигоном относительнь х часа!от — ло- Ь)' г1! 1 маная с вершинами в точках (гк — ), 1 = 1, 2,..., Ь. Таким образом, " .Ь) полигон относительных частот получается из полигона частот сжатием по оси Оу в п раз.
Если плотность распределения генеральной совокупности является достаточно гладкой функцией, то полигон относительных частот является более хорошим приближением плотности, чем гистограмма. 16 12 11 15 19 23 х*, !2 16 20 24 х Ркс, 26 Рнс. 24 Пример 3.
Построить гистограмму и полигон частот, а также график эмпирической функции распределения группированной выборки из примера 2. 1,0 0,8 0,6 0,4 0,2 10 12 14 16 18 20 22 24 х Рис, 26 з По результатам группировки !см, таблицу 1.1) строим гистограмму частот !рис. 24). Соединяя отрезками ломаной середины верхних асно- 9 1. Методы статистического олигання результатов наблюдений 191 наний прямоугольников, из которых состоит полученная гистограмма, получаем соответствующий полигон частот (рис. 25).
Так как середина первого интервала группировки х~ —— 11, то Г„' (х) = = 0 при х ( 11. Рассуждая аналогично, находим, что Р"„' (х) = 1 при х > 23. На полуинтервале (11, 23) эмпирическую функцию распределенин строим по данным третьего и последнего столбцов таблицы 1.1. р'„' (х) имеет скачки в точках, соответствующих серединам интервалов группировки. В результате получаем график Г„' (х), изображенный на рис. 26.
[> В задачах 19.7-19.10 построить графики эмпирических функций распределения, гистограммы и полигоны частот для выборок, представленных статистическими рядами. 19.7. 19.8. 19.9. 19.10. 19.11. Измерения емкости затвор — сток у 80 полевых транзисторов дали следующие результаты: 1,9 3,1 1,3 0,7 3,2 1,1 2,9 2,7 2,7 4,0 1,7 3,2 0,9 0,8 3,1 1,2 2,6 1,9 2,3 3,2 4,1 1,3 2,4 4,5 2,5 0,9 1,4 1,6 2,2 3,1 1,5 1,1 2,3 4,3 2,1 0,7 1,2 1,5 1,8 2,9 0,8 0,9 1,7 4,1 4,3 2,6 0,9 0,8 1,2 2,1 3,2 2,9 1,1 3,2 4,5 2,1 3,1 5,1 1,1 1,9 0,9 3,1 0,9 3,1 З,З 2,8 2,5 4,0 4,3 1,1 2,1 3,8 4,6 3,8 2,3 3,9 2,4 4,1 4,2 0,9 Встроить гистограмму и полигон относительных частот по этой Выборке, предварительно проведя группировку. В качестве длины Гл. 19.
Математическая статистика 192 интервала взять следующие значения; а) б = 0,3; б) б = 0,6; в) 6 = 1,2. В задачах статистического анализа сложных систем, например при разработке систем автоматического проектирования (САПР), широко используется метод моделирования выборки из генеральной совокупности с заданным законом распределения. Пусть случайная величина Х имеет функцию распределения Е,(х) 1(ак известно из теории вероятностей (см, задачу 18.504), случайная величина У = Г»(Х) имеет равномерное рзспределение )7(0, 1). Отсюда следует, что случайная величина Х может быть получена из равномерно распределенной случайной величины У по формуле Х = Е. (У), где Е ' — функция, обратная к Р» (заведомо существующая для случайных величин непрерывного типа).
Метод моделирования выборки из генеральной совокупности с законом распределения Г»(х) реализуется следующим алгоритмом: х, = Р; ' (р»), у = 1, 2, ..., и, (2) где уы рт, ..., у„— выборка из генеральной совокупности с равномерным распределением 77 (О, 1), являющаяся последовательностью случайных чисел.