В.Ю. Королев - Теория вероятностей и математическая статистика (1115266), страница 20
Текст из файла (страница 20)
е 3'" Ух т(х, У)~(х + 8'(а) = 1лп и о аЛ (у) + 8(а) В'(г) 3" Ух,т(х УИх+— ЛЫ+— 1 " . Г' Ух,т(х.у) Ух,т(х У)'~х = / ' Их. ЛЫ -~ ' ' !- Ы) Другими словами, мы получили формулу Р(Х<х~Уииу)=/ ' ' Ых, Ух,т(х. У) (13.3.5) /- Ут(У) Р(Е < х) = ~х(г)Их, соотношение (13.3.5) позволает иам назвать функцию Ух т(х У) 8у(х) = Л (У) (13З.6) условной пиатноппъю непрерывной случайной величины Х при условии у=у справедливую длл любых х и у прн единственном условии Ут(у) Р О. Поэтому по аналогии с определением "безусловной" плотности уг(х) случайной величины Х как неотрицательной функции, длл юторой при каждом х справедливо соотношение 1.13.
Усвоение реенредеаенне 114 1.13.4. Условные математические ожидании непрерывных случайных велмчин Определенная в предыдущем подразделе функция я„(х) при каждом зиачеиии у, для которого уг(у) ф О, обладает всеми свойствами плотиости вероятностей. Поэтому по аналогии с "безусловным" математическим ожиданием непрерывной случайной величины мы можем определить условное математическое ожидание непрерывной случайной величины Х при условии Т = у (юторое, как и в дискретном случае, мы будем обозначать Е(Х ! Г = у)) как Е(Х ! У=У) =/ ххз(х)Их =У ' ' ах. Г хУх,г(х, у) ./- Л (у) Очевидно, что введенное таким образом условное математичесюе ожидание непрерывной случайной величииы Х при условии У = у является (иеслучайиой) функцией аргумента у. Эта функция иазывается регрессией Х на Т.
Если мы теперь вместо у подставим в зту фувкцию случайную величииу у, то мы, естественно, получвм случайную величину (обратвм виимаиие, что формальная подстановка У вместо у в обозначение Е(Х ! У = у) приведет к юифузу). Под условным математическим ожиданием ненрерывной случайной величины Х относительно ненрерывной случайной величины Т мы будем поиимать случайную величину Е(Х ! У) = / хяу(х)дх = ~ ' ' е(х.
Ген хух г(х, у) — 00 / „ л (у) Как и в дискретном случае, условное математическое ожидание иепрерывиой случайной величины Х отлссительио непрерывной случайлой величины У обладает свойством лииейлости: если Х = аХ1 + рХз, где а и ф — числа, а Х1 и Хз — случайные величины, то Е(х ! у) = аЕ(х1 ! у) + РЕ(хз ! У). Как и в дискретном случае, "безусловное" математичесюе ожидаиие условною математичесюго ожидввия непрерывной случайной величины Н5 1.13.4. Условные матемамнчеснне аненоаннл Х относительно непрерывной случаииой величины У равно "безусловно- му" математическому ожиданию случайной величины Х: ЕЕ(Х ~ У) = ' " Ых ~у(у) Иу со х1х,г(х, у) хух г(х, у) л(х Ыу х ~х,г(х, у)Иу Их = х~х(х) Их = ЕХ.
Примир 13.4.1. Пусть Х и у — независимые случайные величины, имеющие одииаковое показательиое распределеиие с параметром Л. В силу иезависимости случайных величин Х и У их совместиая плотность имеет вид 1хг(х,у) =Ле ~ Ле ~у =Л е "(+"1 при х, у > О. В силу соотношения (12.1.7) совместиая плотность случайиых величии Х и Х + У равна Ух,х+г(х, у) = ух,г(х, у — х) = Лте Цл+" л1 = Лзе "л при О ( х ~ у и равна нулю вие интервала [О, у1. Обратим виимаиие, что найденная совместная плопюсть случайных величии Х и Х+У постоянна по х в указанном интервале.
Далее, в примере 1 мы установили, что плотность суммы Х + Г имеет вид 1х+г(з) хЛзе "' при иеотрицательиых х и зта плотность равна нулю для отрицательных х. Найдем теперь условную плотность случайной величины Х при условии Х + У = з для иеюторого положительного л. По определению (13.3.6) зта плотность имеет вид ух х+г(х, л) Лзе лл 1 Хл(х)— 1х+г(л) лЛЗе ы л 116 1.13.
Услоааые раслределеаи длл х н [О, з1 и л1(х) = 0 длл х ф (О, 4. Таким образом, мы установили, что условнал плотносп случайной величины Х при условии Х + У = з совпадает с плотностью равномерного распределенил на отрезке (О, 4. При этом легло видеть, что Г'Ых г Е(Х ~ Х + У = х) = / Л 2 и соответственно Е(Х ~ Х+у)= 2 Основные понятия прикладной статистики 2.1. Задачи математической и прикладной, статистики Основной целью теории вер!л!тностей является построение математических моделей стохастнческнх ситуаций, выявление закономерностей в проявлении случайных событий, позволяющих выразить вероатностн более сложных событий через вероятности более простых. Однаао, как правило, зтн закономерности записываются не в абсолютно точном виде, а нуждаютсл в последующем угсчнении с учетом реально наблюдаемых значений тех или иных случайных величин.
Поясним сказанное простым примером. Примн' 1.1.1. Пусть Хп Хз,..., Մ— результаты прямого измерения неюторого параметра а. На каждое измерение влияют некоторые факторы, лз-за которых каждое измерение содержит случайную погрешносп: Х = а+а, ! = 1,..., л. Предполапа, что систематическая погрешность отсугствует, на основании закона больших чисел мы делаем заключение о том, что в качестве итоговой оценки параметра а следует взать среднее арифметнчесюе наблкл!ений: 118 2. Д Задачи орикоодной смамнсмнки Более того, на основании центральной предельной теоремы мы можем заключить, что если все измерения Хп..., Х„равноточны с одной и той же дисперсией ЮХ1 — — аз, то погрешность в (1.1.1) имеет приближенно нормальное распределение с параметрами О и аз/и.
Как видим, чтобы дать исчерпывающий ответ о значении параметра а, юторый должен содержать и информацию о точности нашей оценки, мы должны по наблюдениям Хп..., Х„каким-то образом оценить неизвестный параметр аз. Получение выводов о неизвестных параметрах вероятностных моделей на основе реальных данных является основной задачей математичесюй статистики, к описанию основных процедур юторой мы и приступаем.
Однаю при применении статистических процедур, обоснованносп которых вытекает из теорем математичесюй статистики, мы сталкиваемся с одной важной особенностью. В любой математичесюй дисциплине, в том числе и в математичесюй статистике, имеются фундаментальное н прикладное направление. Красивые математически строгие утверждения фундаментальной стагиспши, являясь теоремами, начинаются со слов "предположим, что ... ", за юторыми следует набор математических условий, при юторых справедливо утверждение теоремы.
К сожалению, как правило, зти условия на практике либо очень трудно, либо невозможно проверить без каких-либо дополнительных предположений или допущений. Но, как мы уже говорили выше, специалистам-прикладникам нриходится решать не те задачи, юторые можно решить, а те задячи, юторые нужно решать. Позтому неизбежно возникает необходимость изучения заюномерностей в применении статистических методов к практическим задачам.
Ведь любой метод можно применить правильно н неправильно. Как и столярные илн слесарные инструменты, каждый метод математической статистики предназначен для своей юнкретной ситуации и, будучи применен не по назначению, может принести существенный вред. При-. кладная статистика как раз и занимается практическим применением методов математической сппястики, выработкой практических реюмендаций, какие методы, как и в каких ситуациях применять можно, а какие — нельзя. Так как при зтом часто приходится руюводствоваться нематематическими, трудно формализуемыми соображениями, то прикладную 119 2.2.
Выборочные характеристики сппнстнку можно считать как наукой, так в искусствам. Мы не будем подробно говорить о всех направлевнях этого искусства, ведь для серьезного разговора на эту тему надо вметь полное представление о всех методах математической статистики. Мы ограничимся лишь тем, что затронем неюторые особевностн практнчесюго применения неюторых нз статистических процедур, которые будут опнсаны во второй главе.
2.2. Выборочные характеристики 2.2.1. Выборка. Вариационный рид. Поридковые статистики Выводы о значениях параметров вероятностной модели делаются на основе наблюдаемых значений случайных величин, связанных с изучаемой стохастнчесюй ситуацией. Как правило, наблюдаемые значения можно ввтерпретировать квк значенвя одной в той же случайной велнчнны, получелные в результате несюльквх независимых воспроизведений стохастнчесюй свтуашш. Но это то же самое, что наблюдаемые значевня несколькнх незавнснмых н одннаково распределенных случайных величнн. Поскольку мы будем обсуждать свойства лронвд)у, нлн алгоритмов статистических выводов, которые не должны зависеть от конкретных значенвй начальных данных, то мы будем считать, что данные представляют собой выборку, повнмаемую в следующем смысле. Опгкдллнвил 2.1.1.
Выборкой назывшотся независимые одннаюво распределенные случайные величины Х1, Хз,..., Х„. Колнчеспю л наблюденнй в выборке называетсл абьемам выборки. Иногда, чтобы подчеркнуп независимость наблюдений в выборке, выборку, определенную выше, называют независимой. Чтобы подчеркнуть совпадение распределений элементов выборки, выборку, определенную вьппе, иногда называют однородной. Пусть Г(х) — функцнл распределення элемента выборки, то есть Р(х) = Р(Х1 ( х). Иногда в связи со свойством воспроизводимости стохастнчесюй ситуации говорят, что Х1, Хз,..., Մ— это выборка нз генеральной совокупности с распределенвем Г(х). Чисто формально в дальнейшем мы будем отождествлять понятие генеральной совокупнос- шо 2.2.