Учебник_Бочаров_Печинкин (846435), страница 35
Текст из файла (страница 35)
Часто бывает удобно пользоваться не самой выборкой Х!,..., Х„, а некоторой ее модификацией, называемой вариационным рядом. Вариационный ряд Х!*,..., Х„* представляет собой ту же самую выборку Х!,...,Х„, но расположенную в порядке возрастания элементов: Х; < Х* « ... Х„*. Такое преобразование не приводит к потере информации относительно теоретической функции распределения с'(х), поскольку, переставив элементы вариационного ряда Х;,...,Х„* в случайном порядке, мы получим новый набор случайных величин Х,',...,Х„', совместная функция распределения Ех х (х!,...,х„) которых в точности совпадает с функцией распределения Гх, х„(х!,...,х„) первоначальной выборки Х!,..., Х„.
Для Х,* и Х„* употребляют название «крайние члены вариационного ряда». Пример 1. Измерение проекции вектора скорости молекул водорода на одну из осей координат дало (с учетом направления вектора) результаты (х 10 м!с), представленные в табл 2 Вариационный ряд этой выборки приведен в табл 3. Крайними членами вариацнонного ряда Х,*,...,Х„* являются Х,* =- 2,33 и Хд — — 3,47. с) Если среди элементов выборки Х!,...,Х„ (а значит, и среди элементов вариационного ряда Х;,...,Х„*) имеются одинаковые, что происходит при наблюдении дискретной случайной величины, а также довольно часто встречается при наблюдении непрерывной случайной величины с округлением значений, то наряду с вариационным рядом используют представление выборки в виде статистического 3.
Простейшие статистические преобразоеаыия 161 Таблица 2 Х Х Х Х Х Хв Хг х х х — 0,53 — 1,58 0,01 -0,18, -0,52 — 1,04 — 1,06 1,06 — 0,79 0,41 Х„! Х„ Х11 Х12 Х12 х, 0,01, 0,30 — 1,60 — 1,29 — 0,10 — 0,88 1,27 0,01 0,60 2,25 Хв х„о х, Х22 Хм Хм Хм х„ Хзв — 0,08 0,54 1,02 1,68 1,12 — 0,01 — 0,80 — 0,50 2,15 0,96 Х ~ Х, Х Х 0,32 0,35 Хзг Л 34 Хм Хзв — 0,98 0,74 ( — 1,32 Хзз 0,35 — 2,33 — 0,72 — 1,46 0,14 Х43 Хю Хзз Х42 Х44 Х43 Х43 Ха Х43 — 0,05 — 0,27 -1,57 1,92 Таблица 3 0,52 — 0,28 0,65 3,47 2,19 0,40 ХЗ ! Х10 Х;* Лв Х; Х," х," — 1,04 — 0,98 — 2,33 — 1,60 -1,58 — 1,57 — 1,46 — 1,32 — 1,29 — 1,06 Х13 1 Хзо Х,*в Х,*, Х1*2 Х1 Х,*в Х,*, '«17 — 0,52 — 0,90 — 0.88 — 0,80 — 0,79 — 0,72 — 0,53 — 0,28 — 0,27 — 0,18 Л2! Хзв Хчв Х22 Хзз Х4 Хзв «23 '«30 0,30 ) 0,32 — 0,08 — 0,05 — 0,10 — 0,01 О,О! ) О,О! 0,01 0,14 Х.,", ) Х„*о 0,74 ( 0,96 Хзв «зь 0,52 0,54 Хзз Х31 ХЗЗ Х34 Хвв 0,60 0,35 0,40 0,41 0,65 0,35 Х,*в ! Х,* 2,25 1 3,47 Х41 Х42 Х43 1,06 ) 1,12 Х44 Х4 Х43 1,68 ~ 1,92 Х42 1,02 1,27 2,15 2,19 6 П П Бочаров, А В.
Печипкии ряда !табл. 4), в котором Я1,..., Я„в представляют собой расположенные в порядке возрастания различные значения элементов выборки Х1,..., Х„, а и1... п,„— числа элементов выборки, значения которых равны соответственно Я1,..., У П р и м е р 2. В течение минуты каждую секунду регистрировалось число попавших в счетчик Гейгера частиц. Результаты наблюдений приведены в табл. 5. Статистический ряд выборки представлен в табл. 6 ьз 162 Тл. 1.
Общие сведения Таблица 4 Таблица 5 Таблица 6 Статистики. Для получения обоснованных статистических выводов необходимо проводить достаточно большое число испытаний, т.е. иметь выборку достаточно большого объема гь Ясно, что не только использование такой выборки, но и хранение ее весьма затруднительно. Чтобы избавиться от этих трудностей, а также для других целей, полезно ввести понятие статистики, обшее определение которой формулируется следующим образом. Назовем статистикой о = фн ..., оь) произвольную (измеримую) й-мерную функцию от выборки Хы, Х„: Я = Я (Хы...,Х„), Я, =- Яь(хы...,Х„). 3.
Простейшие статистические преобразования 163 Как функция от случайного вектора (Хы ...,Х„) статистика Я также будет случайным вектором (см, часть 1, гл. 6, параграф 7), и ее функция распределения ~в, ву(хы..,ха) = Р(Я, < хы,Яь < хв) определяется для дискретной наблюдаемой случайной величины Х формулой Гв, ву(хы...,хь) =-~,Р(у1) "т (у ) и для непрерывной — формулой где султмнрование или интегрирование производится по всем возможным значениям уы..., У„(в дискретном случае каждое у, принадлежит множеству ~бы...,бт,~), для которых выполнена система неравенств о1(уы...,У„) <:гы ..., Яа(уы...,у„) < хь.
П р и м е р 3 Пусть выборка Хи..., Х„произведена из генеральной совокупности с теоретической функцией распределения Р(з:) = Ф(х;т,оз), являющейся нормальной с математическим ожиданием (средним значением) тп и дисперсией о-. Рассмотрим двумерную статистику (9и Яа), где 9 =,Уй (Х,..., Х„) = — (Х +... + Х ), 1 Ъа = Яг(Хи...,Ху) = (Х1 — Я~) + ... -~- (Хп — Я) Тогда т =(ут ...~-у,ы! ст, ву ту~ — в~ 1у ч-... н1у„— з~ р < у Мы, однако, не будем вычислять записанный интеграл, а воспользуемся тем фактом (см. пример 29, часть 1, гл 6, параграф 7), что любое линейное преобразование переводит нормально распределенный вектор в вектор, снова имеющий нормальное распределение, причем ортогональное преобразование переводит вектор с независимыми координатами, имеющими одинаковые дисперсии, в вектор с также независимыми и имеющими те же самые дисперсии координатами Из курса теории вероятностей известно, что статистика Я~ имеет нормальное распределение со средним гп и дисперсией о~7п.
Положим Х,=Х,— т, Я,= — (Х,Ф..,ФХ). п Очевидно, что Я~ = тп+ Я1, .9з = (Х1' — Ь!) + .. + (Х,, — Я1()". Пусть теперь А — линейное ортогональное преобразование пространства Н, ставящее в соответствие каждому вектору х = (хи ...,х„) вектор у = = (у~ .,у ) = Ах, где у1 = (х~ + .. + х„)(~/и (как известно из курса линейной алгебры, такое преобразование всегда существует). Тогда, если Х' = (Х,', ,Х,'), то (Уи , У„) = Ъ' = АХ' будет нормально распреде- 164 Гл.
1. Общие сведения ленным случайным вектором, имеющим независимые координаты У, с нулевым средним и дисперсией о~. Кроме того, У! =- х1п В(. Далее, рассмотрим п бе = У. (Х!) — квадрат длины вектора Х~. Простейшие преобразования пока=! зывают, что Вз = Е (Х!! — В! )з Е п(Я! )е = Яз 1- и('ъ! ) =! С другой стороны, в силу ортогональности преобразования А н о =~ У! =п(В!) +уз+ ..+У„. Отсюда, в частности, следует, что Яг=уз 4-...4-У„", т е Яз/о~ представляет собой сумму квадратов п — 1 независимых случайных величин, распределенных по стандартному нормальному закону.
Вспоминая теперь, что случайные величины У! = . п В!', Уп..., Ун независимы, получаем окончательный ответ: статистики В! и Яз независимы (Гв! вг(м!,лз) .= = Рщ (м!) рв (тг)), статистика я! распределена по нормальному закону с па* 2 раметрами т и о )и, а случайная величина Яг/о (в том случае, когда дисперсия ое неизвестна, отношение,5з/оз не является статистикой, поскольку 2 зависит от неизвестного параметра о ) — по закону Х- с и — 1 степенямн свободы (см.
также параграф 4) С1 Отметим, что проведенные рассуждения будут нами постоянно использоваться в гл. 4, посвященной статистическим задачам, связанным с нормально распределенными наблюдениями. Важный класс статистик составляют так называемые достаточные статистики. Не давая пока строгого математического определения, скажем, что статистика В является достаточной, если она содержит всю ту информацию относительно теоретической функции распределения Р(з!), что и исходная выборка Х1, ...,Х„. В частности, вариационный ряд всегда представляет собой достаточную статистику. Более сложными примерами достаточных статистик являются число успехов в схеме Бернулли и двумерная статистика В из примера 3 для выборки из генеральной совокупности с нормальной теоретической функцией распределения.
В современной математической статистике достаточные статистики играют очень важную роль. Эмпирическая функция распределения. Пусть мы имеем выборку Х!,...,Х„ объема и, из генеральной совокупности с теоретической функцией распределения Е(х). Построим по выборке Х!,...,Хп аналог теоретической функции распределения Е(х). Положим где р. число элементов выборки, значения которых Х, меньше х, Поскольку каждое Х, меньше щ с вероятностью рн = Р(щ), а сами Х, 3.
Простейшие статистические преобразования !65 независимы, то ри является целочисленной случайной величиной, распределенной по биномиальному закону: Р(р = гг!)= Рп(гп) = ( ) (Г(х)!т (1 — г'(х))п Функция Г*(х) носит название эмпирической (выборочной) функции распределения. Ясно, что при каждом х значение эмпирической функции распределения Г*(х) является случайной величиной, принимающей значения О, ! уп,..., 1; если же рассматривать Г*(х) как функцию от х, то Г*(х) представляет собой случайный процесс. Построение эмпирической функции распределения г'*(г) удобно производить с помощью вариационного ряда Х;,...,Х„*.
Функция Г*(х) постоянна на каждом интервале (Х,*., Х,"4,), а в точке Х," увеличивается на 1/п. П р н и е р 4. График эмпирической функции распределения, построенной по вариационному ряду из табл. 3, приведен иа рнс. !. П Если выборка задана статистическим рядом (см. табл. 4), то эмпирическая функция распределения также постоянна на интервалах (л„У,4!), но ее значение в точке 7, увеличивается на п(п, а не на 1/и. -4 †Π" 4 " О 2 4 б В Рис.















