Учебник_Бочаров_Печинкин (846435), страница 36
Текст из файла (страница 36)
2 Рис. 1 Пример 5. График эмпирической функции распределения, построенной по статистическому ряду из табл. 6, приведен на рис. 2. !ч Гистограмма, полигон. Для наглядности выборку иногда преобразуют следующим образом. Всю ось абсцисс делят на интервалы (х„х,е!) длиной ь, = х,е! — х, и определяют функцию р*(х), постоянную на 1-м интервале и принимающую на этом интервале значение р'(х) = и,У(пЬ!), где и, — число элементов выборки, попавших в интервал !х„х,е!). Функция р*(х) называется гистограммой.
При наблюдении дискретной случайной величины вместо гистограммы часто используют полигон частот. Для этого по оси абсцисс откладывают все возможные значения 5!,...,5ь наблюдаемой величины Х, а по оси ординат, пользуясь статистическим рядом, либо числа 166 Гл. 1. Общие сведения иы...,Рь элементов выборки, принявших значения Ьы...,6ь (полигон частот), либо соответствующие наблюденные частоты щ р = — „" рь= — „ (полигон относительных частот).
Для большей наглядности соседние точки соединяются отрезками прямой. Для непрерывной наблюдаемой случайной величины полигоном относительных частот иногда называют ломаную линию, соединяющую середины отрезков, составляющих гистограмму. П р и и е р 6. Построим гистограмму и полигон относительных частот выборки, представленной в табл. 2. Для этого выберем интервалы одинаковой длины Ь, = 1,00. Числа щ н значения р*(т) на каждом интервале приведены в табл. 7. Гистограмма выборки показана на рис. 3 сплошной линией, а полигон относительных частот — штриховой линией. П Таблица 7 П1я 1 ;О.1 — 4 -2 О 2 4 Рис 3 Пример 7.
Построим полигон относительных частот выборки, приведенной в табл. 5. Возможные значения наблюдаемой случайной величины Х (числа частиц, попавших в счетчик Гейгера) представляют собой неотрицательные целые числа. Воспользовавшись статистическим рядом из табл. 6, получаем полигон относительных частот, изображенный на рис. 4. П Предельное поведение эмпирической функции распределения. Предположим, что по выборке Хн..., Хп мы построили эмпирическую функцию распределения Г~*„)(ш) (здесь и в дальнейшем в том случае, когда нам важна зависимость какой-то характеристики от объема выборки п, будем снабжать ее дополнительным нижним индексом (и)). Как мы уже говорили, число )т, = пХ~'„)(х) элементов выборки, принявших значение, меньшее ш, распределено по биномиальному закону с вероятностью успеха рв = с'1ш).
Тогда при и — сс в силу усиленного закона больших чисел 1часть 1, гл. 8, параграф 2) значения 3. Простейшие егпагписгпичеекае преобразования 167 эмпирических функций распределения Г'„~(х) сходятся при каждом х к значению теоретической функции распределения Р(х). В.И. Гливенко и Ф.П. Кантелли обобщили этот факт и доказали следующую теорему.
Теорема Гливеико-Кантелли. Лрн п — эо с вероятностью, равной единице, вцр ~Г~*,О(х) — Г(х) ~ — Гь Смысл теоремы Гливенко — Кантелли заключается в том, что при увеличении объема выборки п у эмпирической функции распределения исчезают свойства случайности и она приближается к теоретической функции распределения. Аналогично, если и велико, то значение гистограммы р*„ (х) в точке х приближенно равно Г(х, ш) — Г(х,) где х„х,+1 — концы интервала, в котором находится х, а = х,э1 — х, есть длина этого интервала. Если теоретическая функция распределения имеет плотность распределения р(х) и при этом длины интервалов Ь, малы, то гистограмма р"„ (х) достаточно хорошо воспроизводит эту плотность.
Выборочные характеристики. Эмпирическая функция распределения Г*(х), построенная по фиксированной выборке Хы ..., Х„„ обладает всеми свойствами обычной функции распределения (дискретной случайной величины). В частности, по ней можно найти математическое ожидание (среднее) ~и* .= — (Х1 -г... + Х„), и второй момент т~ —— — (Х~~ +... + Хп), дисперсию а ' = — [(Х~ — т, ) +,. + (Մ— т*)~1 = т,* — (п~'), момент й-го порядка т*. = ~ (Хь + ...
+ Х~), центральный момент Й-го порядка 7гь — — — [(Х~ — т*)ь + .. + (Մ— т')~1 и и т. д. Соответствующие характеристики называются выборочными (выборочное среднее, выборочный второй момент, выборочная диспер- 168 7л. 1. Оби4ив сведения сия и т.п.). Ясно, что выборочные характеристики как функции от случайных величин Хн, Х„сами являются случайными величинами, причем их распределения определяются в соответствии с общими положениями теории вероятностей (см. часть 1, гл. 6, параграф 7).
Так, функция распределения выборочного среднего т* для случая дискретной наблюдаемой случайной величины определяется формулой Г ° (х) = ~ Р(х~)... Р(:с„), где суммирование ведется по всем хн...,х„, принимающим значе- ниЯ (50...,55) и УдовлетвоРЯющим неРавенствУ (х1+ ... + х„))п < х, а функция распределения выборочного второго момента т* для непрерывного случая — формулой Е ° (х) = — ... р(х~)...р(х„)с1х~...с1х, — „1е ( 4-...
4-я Н < я Наряду с выборочной дисперсией сгв' часто используют и другую характеристику разброса выборки вокруг среднего: в*= — — ~(Х~ — т ) +...+(Մ— т,*) ~ = — -о 1 2, *2 и з* п — 1 и — 1 Характеристику ва* также будем называть выборочной дисперсией, а для того чтобы не путать вз и вз*, каждый раз будем указывать, о какой именно выборочной дисперсии идет речь. Выборочная дисперсия вз* отличается от выборочной дисперсии оз" только лишь наличием множителя п)(п — 1), который с увеличением объема выборки и стремится к единице, и, казалось бы, нет смысла вводить две практически одинаковые величины.
Однако, как мы увидим из дальнейшего, в~' является несмещенной оценкой теоретической дисперсии д~, чего нельзя сказать о выборочной дисперсии сгз", хотя стандартные методы приводят именно к аз*. Пример 8. Подсчитаем выборочное среднее и выборочные дисперсии для выборки, приведенной в табл.2: т* = ( — 1,04 — 1,06 Ч- 1,06 — .. — 1,57 Ч- 1,92) = 0,082, 1 50 и ' = — [( — 1,04 — 0,082)з+ ( — 1,06 — 0,082) + .
+ (1,92 — 0,082)з) = 1,34, 50 в = в'=137. 50 49 Для подсчета выборочной диспе(~сии из* можно было бы воспользоваться также формулой из* = тз — (т") . О 4. Основные распределения матемагшческой статистики 169 4. Основные распределения математической статистики Наиболее часто в математической статистике используются: нормальное распределение, т~-распределение (распределение Пирсона), 1-распределение (распределение Стьюдента), х'-распределение (распределение Фишера), распределение Колмогорова и ыз-распределение. Все эти распределения связаны с нормальным. В свою очередь, широкое распространение нормального распределения обусловлено исключительно центральной предельной теоремой (см. часть 1, гл.
8, параграф 4). Ввиду их особой важности все названные распределения затабулированы и содержатся в различных статистических таблицах, а также, частично, в большинстве учебников по теории вероятностей и математической статистике. Наиболее полными из известных и доступных читателю в нашей стране являются таблицы Л. Н. Большева и Н. В. Смирнова (1), на которые мы и будем ссылаться в дальнейшем.
Нормальное распределение. Одномерное стандартное нормальное распределение (стандартный нормальный закон) задается своей плотностью распределения (см. часть 1, гл. 5, параграф 4) :р(х) = Ф'(х) = й2 Значения функции Ф(х) и плотности р(х) стандартного нормального распределения, а также квантилей эо (функции ьоь, обратной функции стандартного нормального распределения) приведены в (1), табл. 1.1 — 1.3 (см. также табл. 2 и 3 приложения).
Общее одномерное иормальиое распределение характеризуется двумя параметрами: средним (математическим ожиданием) т и дисперсией аз. Его можно трактовать как распределение случайной величины '1 =пь+ч 'а где случайная величина С подчинена стандартному нормальному закону. Плотность распределения и функцию распределения общего нормального закона будем обозначать через д(х;т,а~) и Ф(х;т,аа).
Многомерное (й-мерное) нормальное распределение (часть 1, гл. 6, параграф 4) определяется вектором средних пт = (ты ...,гиь) и матрицей ковариаций А = (р, ). ~з-распределение (см. часть 1, гл. 5, параграф 4, а также примеры 28 и 30, часть 1, гл. 6, параграф 7). Пусть ~ы ...,~„ — независимые случайные величины, распределенные по стандартному нормальному закону. Распределение случайной величины х'=-1'+" +с.' 170 Вл. 1. Общие сведения носит название Хз-распределения с п, степенями свободы. ХЯ-распреде- ление имеет плотность распределения Ит)=.Н(л)= 1 7 е *7Я (л)0) 2" 7~Г(п7'2) где Г(.) введено в параграфе 4 гл.
5. Значения функции Х~-распределения и сг-процентных точек (а-процентная точка Хз-распределения представляет собой (1 — а7'100)-кван- тиль Х1 доо) Хгцраспределения приведены в [1], табл. 2.1а и 2.2а. В дальнейшем нам будет полезно следующее свойство. Пусть — независимые случайные величины, распределенные по нормальному закону с одинаковыми параметрами гп и в~. Положим Ц = -„Ж+ +4п) Тогда случайная величина Х = †., [ф — 0) + ...
-ь (~„ — 0) 1 в имеет Хз-распределение, но с и — 1 степенями свободы. Доказательство этого факта содержится в примере 3. Еще одна схема, в которой появляется Х~-распределение — полиномиальная схема (см. часть 1, гл. 4, параграф 7). Пусть производится п независимых одинаковых испытаний, в каждом из которых с вероятностью р~ может произойти одно из событий А~ (1 = 1,..., Ь). Обозначим через ит число появлений события .4н Тогда из многомерного аналога интегральной теоремы Муавра-Лапласа следует, что случайная величина Х = + + з (и1 — пр~), (иь — 'прь) птп прь при и — оо асимптотически распределена по закону ХЯ с Д вЂ” 1 степенями свободы.














