М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 6
Текст из файла (страница 6)
9. СОвмчь»'поч распределение пары порядковых статистик. Аналогично (18) можно найти совместную ф.р. двух порядко. вых статистик Х»»» н Хю, й<!. Прн х<у л Р(Х<»1<х,'Х<п <у) =Р(*»ЯЕ(х,,к )»й, а В В Р в ,~), Е(х,-мд» ~ )!) = ~,~ Р (~Е(х,с ) 1 »»» /-г $! ЯЕ(.<х,ю»» ---з) =1), ~~)„,, "', х с-ю »»»»-~ х Р (х)'(Е'(у) — Е (х))'(1 — Р (у))ч- -*. Если ф. р.
Р(х) имеет плотность Е(х), то пара (Х»»ь Хю) имеет совместную плотность, которую можно получить, дифференцируя по х и у их совместную ф.р. Полезнее, однако, сделать предельный переход при 6-~.0, 6)0, в следующем выражении (предполагаем т<у): б-»У(х<Х~»г(х+6, у<Хм<у+6). (31) Используя равиовероятиость всех л1 перестановок Хь ( Хь ( ... (Х~„. запишем (31) в виде 6-'л! У(х<Х»~(х+б, у<Х~<у+б, Х~<... (Х„).
(32) Выражение (32) эквивалентно при 6-»0 следующему: б 'л! У(Х»<... (Х».ч<х<Х»<х+6< <Х,,='... <Хь;(у<Х~ ку+Ь<Х~ 1<... <Х„), (33' Действительно, если, скажем, в интервал (х, х+6) попало значение сше одной сл.в., то вероятность в (32) оценивается сверху величиной (Е(х+6) — Е'(х) )»(Е(у+ 6) — г (у) ) -)т(хЦ(у)бз, Ь-»0, в»о згемя как вероятность в (33) имеет порядок б' (при !(х))1у)чьО).
Используя независимость сл.в. Хь 1=1,...,л, равиозеЕ1»зтиос1ь (й — 1)! перестановок пз Х„...,Х» ч и (! — й— --1>. 'перестановок пз Х»ь .,Х»ь получаем лля (ЗЗ) выражение Ь-'-'л! й'~Х, ( ... < Х» ~ <х)у»(х(Х»(хч.б» я к Р(х+ Ь < Х», (... ( Х~, ". у) 0»(у( Х» < у Ь):с ~ З'!И -, Ь: Хр, ~ ( ... < Л,) о--',:.'-- Г(л!»-'(Е(хи Ь)— у 1 " »а--1!. ЗО Е(х)"-7~(х) м (а — 1)! (1 — а — 1)! (ч — 1)' х (г (у) — Г (х))'-'-' 1(у) (1 — Г(у))"-'. (35) й с плрлмвтры сдвигл и млсштлвл: грлфичвскии лнллиз !.
Семейство сдвига-масштаба. Значительный теоретический н прикладной интерес представляет статистическая модель независимых наблюдений Х, Х,...Х„ (1) с общей ф.р. вида Р((х — И)/о), где Р(х) — известная непрерывная ф.р., а параметры сдвига и н масштаба о>0, вообще говоря, неизвестны. Нормированные сл. в, У,=(Х,— р)/о, 1 1, 2,...,п, 12) очевидно, также независимы н одинаково распределены, а 1гк общая ф: р. равна уе(У~(х) =У'((Х~ — р)(о<х) =йэ(Х~ <ах+ 11) = г (х). Семейство ф.р. Р((х — р)/и) может быть образовано из любой ф. р, г" (х), однако в математической статистике и ее прило.
жениях употребляют сравнительно небольшой набор распределений, которые благодаря особым теоретическим свойствам часто используются а реальных задачах. К числу таких распределений относится прежде всего нормальное г" (х)=-. ~ е-'чЮ= — Ф(х). У2я Параметры р н о семейства Ф((х — р)1о) имеют хорошо известный вероятностный смысл: МХ, =, 11+ оМУ,.= р ч- о = ~ 1е — и'-'й = р, 1 у 2л У 2а,) — Е(х)) (Г(у) — Г(х+ б))' — т-';( (! — Я вЂ” 1)! тч(У(у+б) — У(у)) (1 — Р(у ' б))" '. 134) (л — 1)! Пределом выражения (34) является совместная плотность лары порядковых статистик (Хм1, Хю), й<!, в точке (х, у), х<у, и этот предел равен От»»е»»»»»»а» л»е семейство экспоненциальных распределений, задающееся плотностью ' ("'= 0' 0' е-', х>0, Эдесь МУ»=1, 0у»=1 и МХ»=!»+»», )уХ» о'.
Приведем еще один интересный пример, когда семейство ф. р., пе являющееся сдвиго-масштабным, становнтся таким после преобразования. Распределение с ф. р. 6(х)-1 — ехр ] — (х/р)т], х>0, (3) возникает в теории зкстремальных значений н часто (под названием распределение Вейбулла) употребляется в качестве распределения времени жизни изделия в задачах надежности. Пусть сл. в. Х имеет ф.
р. »»(х). Тогда сл. в. Я 1п Х имеет ф. р. У, (Е < х) =: »ть (1п Х < х) = Р (Х ~( е") = =1 — екр] — ]$ ~ет"]=1 — ехр] — ехр[у(х — 1п])))]. Таким образот», если случайная выборка Х», »=1,...,а, взята из семейства (3) с параметрамн р>0, у>0, то Х» 1пХ», »=1..., ...,и, является случайной выборкой из семейства Р((х — и)/о), где Р(х) 1 — ехр ] — ехр х], (4) а параметры и, о связаны с й, у формуламн и=)п]), -у ' Отметим, что ф.р. (4) также возникает в теории экстремальных значений.
2. Вероятностная бумага. Во многих случаях теоретические соображения нли предшествующий опыт позволяют высказать предположение о том, что случайная выборка х», хь...,х„взята из распределения Р((х— — и)/о) с известной непрерывной Р(х), но неизвестными и, о. Используя статистический материал х», хм..., х„желательно проверить зто предположение. Соответствующая задача относится к области теории проверки статистических гипотез. Существуют различные принципы и разработаны различные методы решения подобных задач, однако предварительный графический анализ данных остается полезным инструментом исследования, особенно для небольшой выборки.
Эмпирическая ф.р. является естественным прнбл»»»кен»»еь» теоретической ф. р., но, за искл»очепнем выборки нз равномерного распределения (когда теоретическая ф.р.— прямая линия), граф»»»»»:сная подгонка ф. р. нз семейства Р((х — »»)/о) к з. ф. р. ч2 представляет, очевидно, определенные трудностн. Преодолеть нх можно, «распрямив» графнк Р((х — и)/а). С этой целью, предполагая, что Р(х) непрерывна н строго монотонна в точках х, в которых 0<Р(х)<1, введем отображение полосы — со<х<+со, 0<у<1 в плоскость по формуле (х, у)-+(х, Р '(у)), (5) где Р'-'(у) — функцня, обратная к Р(х).
Отображение (5) по условиям, наложенным на Р(х), взанмно-однозначно н взанмно-непрерывно в области своего определения. Прн этом отображении (х, Р(х))->-(х, Р-'(Р(х))) =(х, х), (6) т. е. графнк у Р(х), 0<у<1, переходит в прямую линию у=х (нлн ее интервал, если существуют такие значення х, что Р(х) =1 нлн Р(х) О). Далее, (х, Р((х — м)/о))-ь(х, Р '(Р((х — р)/о))) =(х, (х — м)/о), т. е. график Р((х — н)/о), ф. р. нз рассматриваемого семейства, переходит в прямую линяю у (х — и)/о.
Опишем вытекающую отсюда методику. Пусть Р (х) — э.ф.р. случайной выборкн нз семейства Р((х — р)/о). График у=Р»(х) преобразуем в у=Р'-'(Р„(х)) н подберем наиболее тесно прилегающую к нему прямую лннню у (х — р) /о. (7) Прн этом о — котангенс угла наклона прямой (7) к осн х— будет служнть оценкой параметра о. Оценкой р будет абсцисса точки пересечения прямой (7) с осью х. Если график у Р-'(Р„(х)) снстематическн уклоняется от лннейной завнснмостн, то есть все основания сомневаться в том, что наблюдаемые данные взяты пз распределения Р((х — р)/о).
Прн фактической реалнзацнн указанного приема нет необходнмост~ строить целиком график у=Р-'(Р„(х)), а следует отметить только точки (хпь Р-'(1/и)), /=1,...л, отвечающие скачкам Р„(х), н подгонять прямую к этнм точкам. Ввиду неудобств, связанных с точкой (хмь Р-'(1)), обычно строят точки (хпь Р-'Х Х 6. (п+1))), 1 1, ..., л, Более удачным является выбор точек в виде ~хо, Р-'((1 — 05)/и)), 1=1, 2,...,л. Лля графической работы с семейством сдвига-масштаба Р(1х — р)/а) удобно нзготовнть так называемую вероятностную бумагу, выбрав по осн ордннат неравномерный масштаб и ирнннсан точке с декартовой координатой у новую координату у'= =Р(у). В новой системе коорд|шат ху' непосредственно наносятся то"кн (хнь (1 — 0,5)/л).
Оцифровка осн ордннат для нормального закона показана на рис. 2. 2 м. э, коз.ичв, к э. пэохвров 3. Примеры графического аналнза. С помошью таблицы случайных чисел образована выборка объема а=10 нз нормального закона с )>=1, 0=2: — 2,504; 0,342; — 1,512; 1,636; 4,062; 1,698; — 0,916; 0,882; 1,830; — 1,168. -05 Рнс. 2. Иаготоваенне нормальной ве- Рпс. 3. Тонки (хпк Ф->((1 — 0.5>10)1 роятностной 6)магн и прплеган>п>ая прямая япк искусственной норнапьнпй выборки По таблице функцнн, обратной к нормальной, пз (1] находим 8(3) 9(2) !О 1) 7(4) 6(5] ( †)0,385 ( †)О,125 ( — )0,675 [ — )1,036 ( — !!.645 Точки (х(о, Ф-'((( — 0,5)/10)), ( 1, 2,...,10, отмечены на графике (рнс. 3), н подобрана на глаз прямая у=(х — )г)/о, нлн х сну+)ь где )>=0,44; 0=1,87.
Выборочные среднее и дисперсия равны 1 х=- — а~ хг=0,435; за-— — ~'хт — х:.=2,976; за — -1,125. Как видно, графнческое нрнблнженне дает оценки р, о. близкне к выборочным. ° 34 В следу!ощей таблице приведены данные о ежегодном потреблении в фунтах на душу населения мясных продуктов, включая птицу и рыбу, в США с 1919 по 1941 г. (считывать по строкам) [3[: 171,о 167,9 166,6 164,7 !46,'7 !66,2 Эти данные предлагается описать моделью х,-а+ Ы+ с(а+ г))а+ е„ (9) где Г обозначает год, х! — потребление в этот год.