Полезная книга (543702), страница 24
Текст из файла (страница 24)
Причиной этого является специфичность задач математической статистики, являющихся в известной мере обратными к задачам теории вероятностей. Если в теории вероятностей мы считаем заданной модель явления и производим расчет возможного реального течения этого явления, то п математической статистике мы исходим из известных реализаций каких- либо случайных событий, из так называеглых стагистических даняьгх, которые обычно носят числовой характер. Математическая статистика разрабатывает различные методы, которые позволяют но этим статистическим данным подобрать подходящую теоретико-вероятпостну!о модель. Например, пусть имеется п независимых наблюдений в схеме Бернулли и пусть в пч из пих произошло событие А. Поскольку модель в схеме Бернулли определяется числом испытаний и и вероятностью р = Р(А), то на этом примере мы сталкиваемся с одной из задач математической статистики: как по т осуществлениям события А в п независимых испытаниях определить вероятность р Р (А)г Гл.
13, стктистическив длнпыв !во $ М. ВЫВОРОЧНЫН МЕТОД Псречислпм те основные задачи, которые решает ма. тематическая статистика, на примере схемы Бернулли. а) Проверки статиста (еских гипотез. Из каких-либо априорных соображений мы можем предполагать, что р = ргь где рь — некоторое фиксированное значение. По ь! относительной частоте — мы должны решить, справеди лпва гипотеза р = рь или нет. Поскольку прн больших !и и относительная частота — близка к р, то статистичеи скнй критерий по проверке гипотезы р = рь должен и основываться па разности ~ — — р„~. Если она большая, то, по-видимому, гипотеза неверна, если же она мала, то у нас нет основания отвергать гипотезу р = рь. б) Статистическое о((спивание неизвестных пароме(- роь. Иногда нам требуется по наблюденному гп указать то число р', которое можно принять за вероятность р в схеме Бернулли.
В нашем примере естественно взягь ь! р'= —. Оценка должна быть в том или ином смысле и близкой к оцениваемому параметру. в) Доверительные интгрваль(. Иногда нас интересует не точное значение неизвестного параметра р, а требуется указать тот интервал р «р «р, в котором с ве. роятностью, близкой к единице, лежит параметр р, Такой интервал (р(пг), р(гп)), концы которого случайшы и;ависят лишь от наблюдаемого значсиия (и, пазы. вас гся доверительным интервалом, Б последующих главах мы уточним понятия, связапныс с этими основными задачами, н рассмотрим этн задачи применительно к некоторым вероятностным моделям.
й 51. Выборочный метод Терминология многих статнстп (вских задач связана со следующей урновой схемой. Пусть имеется урна с карточками, на которых нанесены числа Хь Х,,;, Хн. Из урны случайно выбираются п карточек с числами хь хз, ..., х, Полученный набор чисел Х(, ХЛ, ..., Х„ называется выборкой объема п из генеральной совокупности Х, Х,.«., Х. (2) Как известно, выборка может быть без возвраиленил, когда каждое подмножество (Х(,..... Х(,) мощности п из всего множества (2) появляется с вероятностью 1/Сй, и с возвраи(ением, когда каждый упорядоченный набор (Х(, ..., Х; ), где могут быть повторения, появляется с вероятностью 1/Л(".
Нетрудно видеть, что в случае выборки с возвращением х(, ., х„являются ие. зависнмыми случайными величинами с законом распределения случайной величины В, которая с одной и той же вероятностью 1/й( принимает каждое из значений (2), если все Х; различны: Р(В=Х()= и., 1=1, ..., й(. 1 В этом случае мы говорим, что (1) есть нсзависимач выборка объема и, или независимая реализация объема п случайной величины $. Упорядочивая выборку (1) по возрастанию, мы получаем вариайионнь(й ряд Х(11 «~Х(11- ... «Х(ь1 ° С любой выборкой (1) можно связать так называемое эмпирическое, или выборочное, распределение, приписывая каждому значепи(о х; вероятность 1/п. Эмпирической (илн вь(барочной) функ((ией распределения будет т~ р(х) = — „~ ~(л,~л). Поскольку выборка (1) случайна, то эмпирическая функция распределения при каждом х есть случайная величина.
Математическое ожидание (среднее), дисперсия, моменты эмпирического распределения также будут случайными величинами и будут называться соответственно эмпирическими (или вь(борочныл(и) л(атематическил( ожиданиел( (средним), дисперсией,моменгами. 5 а! еыноночныи мыол 193 ГЛ. 1а. СТАТИСТИч!ЕСКИЕ ДАННЫЕ Таким ооразом, выборочное среднее есть среднее ариф- метическое элементов выборки 1 й 1 (3) и выборочная дисперсия равна н! У (х х)2 п х й-! Выборочные моменты к центральные моменты порядка т определя1отся выражениями — х'и — ~~ (х! — х)". ю-! ') В математической статистике случайные величины ооозначаютсн часто сукнами х1, у! и т, д., нва!ню!иимнсн элементами выборка. В прикладных курсах матсматической статистики большое место занимает так называемая описателонсйя статистика, в которой излагшотся рациональные способы задания статистических данных и вычисления сводных характеристик типа (3) и (4).
Например, еслихй=а+ ч и ч +у„то х=а+ у, где у = — р уо и за = — ~ у',.— (а — у)'. ! ! ю-! Эти формулы облегчают вычисления в случае, когда числа х1 большие. Подбирая подходящее а, мы сводим все вычисления к арифметическим действиям над числами у! с небольшим числом знакое. «Выборочная» терминология сохраняется и в том случае, когда генеральная совокушюсть (2) не состоит из конечного числа элементов Ф, а просто есть некий генератор независимых случайных величин х; с каким. либо распределением ').
Такой идеализацией в статистике пользуются или при очень больших Л1 (например, при статистических обследованиях в демографии, экономике, социологии), или в том случае, когда элементы выборки (1) можно получать какой-либо однородной среднее и дисперсию генеральной совокупности (2). Теорем а 1. Э.!!т!ирпинское среднее х бесповторной во!борки (1) имеет следу!ои(ее лттематичесное оахидиние и дисперсгио: Ъ' У вЂ” н ййх=Х, Эх=в (б) н У вЂ” ! Д о к а з а т е л ь с т в о, Воспользуемся формула ми н й м~с ' 1 и! и о,с — — ',(~ о, ч ! 2, с .
1,, 2). ! ! 1 !(/ (6) Вычислим Мхй, Ох! Соч(хь х;). Поскольку для вычисления пам нужны лппн дпумернь1с распределения х1, хр рассмотрим конечное вероятностное пространство (О, оа'., Р), ГдЕ ЭЛЕМЕНтарПЫЕ СОбЫтИя Оа =(Й, 1), 1 ~~ АЛЬ чь1= 12', и элементарные вероятности р(со) = 1 У (У вЂ” 1) Случайп1ке величины х„х1 определим равенствами хй(й 1) = Хм х1(й 1) = Х1. Тогда н — Хй — — Х У ~~ й И 0х,= — 'У(Մ— Х)2=У У г й=! и при !'Ф/ (~он(х!' х1) = У(У В ~' (Хй Х)(Х1 Х) = й,-й! н н 2 (У вЂ” ~)~ Л.(Х Х" +~2. (Х вЂ” Х)~ ~=- — У !. й-! й-1 процедурой .чюбое число раз (например, результаты пз.
мерсний, размер деталей при массовом нх изготовлении и т.д,).' В дальне!Нпсм мы будем в основном заниматься пе. зависимыми выборками. Относительно бесповторной выборки докажем лишь следующую теорему. Обозначим Х=- — '~'Хи бв= — ', ~'(Х, — Х)2 1-! ! ! гл. !з, стлтистичвскив данныи Подставляя полученные значения в (6), получаем формулы (5). 3 а и е ч а и и с. Для выборки с возвращением дисперсия х равна Яа/!!. По неравенству Чебышева прп Р 1у' ~ ~и-ь со мы получим х — ь Х как в случае выборки с возвращенном, так и в случае выборки без возвращения. Задачи 1. Из конечной генеральной совокупности (Хп Х„, ..., Х,) бсругся последовательно две бесповторные выборки (хг, ..., х„,) ц (у„ ..., ро,), н! + лт"" йтт Найти ковариацию и коэффициент карре.
л, и с-! ! ч-~ ляцпп мсгад" сред!тат х= — З х. и й= — ! р.. г =-1 1=! 2. Найти матсматвчсскос ожидание Мзз выборочпои дисперсии !! Ю зз = — ху (х. — х)'-', где х= — хз х, для бссповторной выборки !'- ! 1-1 х, , х из конечной генеральной совокупности (Хп Х„ ...„ Х,). и '''' 'л 3. 1-1айти математическое огкидацис Мзз выборочной дисперсии и а' = — — ху (х — х)з, если х... „х — независимая пызорка из !'.- ! распределения с дисперсией 0хг=о'.
4. ВЫЧИСЛнтЬ МХ ! И (УХ!ау, ЕСЛН ВаРнаЦНОППЫй РЯД ХО!~~к!!!К-... х „получен из независимой выборки х, ..., х„с равномериьш распределенном н (О, о), Г л а в а 14. СТАТИСТИ'1ЕСКИЕ КРИТЕРИИ $52. Статистические гипотезы Пусть случайная величина й или случайный вектор й =(й! "„$ч) имеет плотность р(х; О), зависящую ог параметра О, одномерного или многомерного, принимающего значения из некоторого мно!кества 6. В частности, если р(х; О) одномерная плотность н нсзависн. мая выборка х„хп, ..., х„ (1) получена нз распределения с атой плотностью, то и-мерная плотность, соответствующая выборке (1), равна произведению р(хо ..., х„; О)=Цр(ха;О). л=! Хотя мы будем далее говорить о р(х; О) как о плотности, все сказанное с очевидпымп видоизменениями будет применимо и к дискретным случайным величия нам с законом распределения р 1х- О) Р (е х) где х принимает счетное или кокс шос число значений. Значение параметра 0 вполне определяет плотность р(х; О).
Тс нлн ипыс предположения о значениях параметра О мы будем называть статистических!и еипогезил!и. Статистйчсская гипотеза называется простой, если она состоит в том, !то 0 = Оо, где Оо — некоторое фиксированное з!шчение. Если же наше предположение заключается в том, что О ы дз, где !Оо — подмножество множества параметров И, состоящее более чем из од. ной точки, то мы говорим о сложной еипотезе. Рассмо! ° рим примеры. гх — а!' Пример 1. Пусть р(х;и, п)==е "'" — плотз/ал о ность нормального распределения, зависящая от дву- Э 63, РРОВень значимости и мощность кРитеРия 197 ГЛ, И.