Б.А. Севастьянов - Курс теории вероятностей и математической статистики (1115332), страница 27
Текст из файла (страница 27)
Та. кой интервал (р(т), р(т)), концы которого случайны и зависят лишь от наблюдаемого значения т, называется доверительным интервалом. Б последующих главах мы уточним понятия, связанные с этими основными задачами, и рассмотрим этн задачи применительно к некоторым вероятностным моделям. й 51. Выборочный метод Терминология многих статистических задач связана со следующей урновой схемой. Пусть имеется урна с карточками, на которых ~внесены числа Хь Х„..., Хн Из урны случайно выбираются и карточек с числами хь хз, ..., х . Полученный набор чисел Хо Х2~ ° э Хь % Б!. аывоточны!! метОд называется выборкой объема и из генеральной совокупности Х,Х,...,Х.
(2) Как известно, выборка может быть без возвращения, когда каждое подмножество (Х!,, ..., Х!,) мощности и из всего множества (2) появляется с вероятностью 1/Сн, и с возвращением, когда каждый упорядоченный набор (Х!с ..., Х; ), где могут быть повторения, появляется с вероятностью 1//ч'".
Нетрудно видеть, что в случае выборки с возвращением х!, ., х„являются пе. зависимыми случайными величинами с законом распределения случайной величины З,которая с одной н тойже вероятностью !/й! принимает каждое из значений (2), если все Л, разли*!ны: Р(с =Х!) = —, /= 1,, А!. ! ь' В этом случае мы говорим, что (1) есть нсзависимаа выборка объел!а и, или независимая реализация объема и случайной величины $. Упорядочивая выборку (1) по возрастани!о, мы получаем варииционный ряд хп) ««хи! ... ««х1„!.
С любой выборкой (1) можно связать так называемое эмпирическое, или выборочное, распределение, приписывая каждому значени!о х; вероятность 1/п. Эмпирической (нли выборочной) функцией распределения Судет Поскольку выборка (1) случайна, то эмпирическая функция распределения при каждом х есть случайная величина. Математическое ожидание (среднее), дисперсия, моменты эмпирического распределения также будут случайными величинами и будут называться соответственно змоирическими (или выборочныл!и) математическим охсиданиел! (средним), дисперсией, моментами.
!'Л. !а СТАТИСТИа!НСКИН ДЛНИЫН 192 Таким образом, выборочное среднее есть среднее ариф. метичсское элементов выборки (3) и выборочная дисперсия равна и! = — л (ха — х) . л Выборочные моменты и центральные моменты порядка г определяются выражениями — х"!, — ~ (х,. — х)". ю-! В прикладных курсах математической статистики большое место занимает так называемая описательная статистика, в которой излагаются рациональные способы задания статистических данных и вычисления сводимое характеристик типа (3) и (4) .
Например, если х! = а + л и +у„то х=а+у, где у= — „лл уи и зв= — „~ у! — (а — у) . ! ! ! Эти формулы облегчают вычисления в случае, когда числа х! большие. Подбирая подходящее а, мы сводим все вычисления к арифметическим действиям над чи.- лами у; с небольшим числом знаков. «Выборочная» терминология сохраняется и в том случае, когда генеральная совокупность (2) не состоит из конечного числа элементов !н', а просто есть некий генератор независимых случайных величин х; с каким- либо распределением ').
Такой идеализацией в статистике пользуются или при очень больших У (например, при статистических обследованиях в демографии, экономике, социологии), или в том случае, когда элементы выборки (1) можно получать какой-либо однородной ') В математической статистике случайные величины обозначаются часто бунваия кь у! и т, л., ане!ию!ни!и!си алеиснтаии выборки. 5 Я ВЫГОРОЧНЫИ МЬ1ОД среднее и дисперсию генеральной совокупности (2). Теорем а 1.
Эл!тигрическое среднее х беспоеторной выборки (1) имеет следу!огиее л!атемитическое оглсидиние и дисперсию: Мх=Х, (б) 52 У и 1.ЛХ = — ' и У вЂ” ! Д о к а з а т е л ь с т в о. Воспользуемся формула ми п / и М» — ' Л'М,, Р, —,(~Р*;«-2~С !И,И!). 1! 1 ! 1(1 (б) Вычислим Мхг, Рхг Соч(хп х,). Г1оскольку для вычисления пам нужны лн!нь двумерные распределения хо хп рассмотрим конечное вероятностное пространство (11, Ф, Р), где элементарные события Р»=(Й, 1), 1 ~(йчь 1 Ф1~ ~12', и элементарные вероятности р(»Р) = Случайные величины хг, хл определим равенствами х1()1, 1)=Хм х!(11, 1)=-Х1. Тогда Л 1 Мхг = —. ~ Хг = Х, И 1 Р.
~и(Х Х)г сг У 2 и при 1~1 Соч (х„х;) =,,),л' (Хг — Х) (Х1 — Х) = !2221 пропедурой любое Число раз (например, результаты пз. мерепий, размер деталей прн массовом их изготовлении и т. д.) ° В дальнсйп!см мы будем в основном заниматься пе. зависимыми выборками. Относи !слыло бесповторной выборки докажем лишь следующую теорему. Обозначим У н Х=- — '~'хо бг= —,' ~(хг — Х)г 1-! 1 ! !'л.
кк статистические дАнные Подставляя полученные значения в (6), получаем формулы (5). 3 а и е ч а и и с..!1ля выборки с возвращением дисперсия Х равна 5з/гг. По неравенству Чебышева прп Р .ц! = и — ~- оо мы получим х — Х как в случае выборки с возвращением, так и в случае выборки без возвращения. Задачи Нз кокс пгой гснсральиой совокупности (Хп Х„..., Х,) беру!ся последовательно две бесповторпые выборки (х1, ..., х„) „ (рс ..., рп,), и!+л., Л'. Найти копариациго и козффициспт коррсп~ и.
1 Ч-~ ! Ч-» ляцпп между среди!и!и х = — З х. и р = — ~ !! .. ,Л'' пз г'= ! 1=! й. Найти матсмапысскос ожидание Мз' выборочпой дисперсии Л и 1,, 1 з' = — гг (х. — х)'-', где х= — р х., для беспавториой выборка Л ю и Л г-! г-! х, ..., х из копсчпой гсисральиой совокуппости (Хп Х„ ..., Ху). Л '!' 2'''' х 3.
Найти математическое ожвдавис Мз' иыборо и!ой дисперсии з = — — хг (х — х1-', если х, ..., х — иезааисимап выбоРка иа распределения с дисперсией Вх. »= оа. ! 4. Вычисз!гть Мх!Ы и 0х!А1, если ваРиацпокпый РпД хо!~(х!П~~... .. с" х 1„! получеп из пезагвсимой выборки х, ..., х„с равиомервым распределением в (О, и), Г л а в а 14. СТАТИСТИЧЕСКИЕ КРИТЕРИИ й 52.
Статистические гипотезы Пусть случайная величина й или случайный вектор 5 =($ь ., ь ) имеет плотность р(х; 0), зависящую ог параметра О, одномерного нли многомерного, принимающего значения нз некоторого множества О. В частности, если р(х; 0) -одномерная плотность и независимая выборка х,, хьч ..., х„ (1) получена из распределения с этой плотностью, то и-мер- ная плотность, соответствующая выборке (1), равна произведению р(х„..., х„; 8) = Ц р (х~, О).
с =-~ Хотя мы будем далее говорить о р(х; О) как о плотсказапиое с очевндпымн видоизменениями будет применимо и к дискретным случайным величи- нам с законом распределения р(х; О) =Р(е=-, ), где х принимает счетное или конечное число значений.
Значение параметра О вполне определяет плотность р(х; 0). Тс нлп щ ыс предположения о значениях пара- метра 0 мы будем называть сг;мистическими гипоге- зама. Статистическая гипотеза называется простой, если ова состоит в том, что 0 = Оа, где Оь — некоторое фиксированное значение. Если же наше предположение заключается в том, что 0 с:— : Эм где 00 — подмножество множества параметров О, состоящее более чем из од- ной точки, тц мы говорим о сложной гипотезе. Рассмоы рим прнмерьь ы -а)' 1 П р имер 1. Г(усть р(х; а, о)==е '"' — плоть~ал о ность нормзльного распределения, зависящая от дву- ГЛ, 1С СТАТИСТИЧЕСКИЕ КРИТЕРИИ мерного параметра (а, о). Гипотеза (а, о) = (О, 1) является простой, а гипотеза а = а,, где а, фиксировано, — сложной.
П р и мер 2. Пусть р(х; О) =С„О' (1 — О)" — веРоятность х успехов в схеме Бернулли с я независимыми испытаниями. Примером простой гипотезы служит О ==. = 1/2, а примером сложной — О ) 1/2. Задача проверки статистических гипотез ставится следующим образом. Известно, что выборка (1) получена из распределения, име1ощсго плотность вида р(х; О). Относительно параметра О имеется некоторая основная, или нроверяезная, гипотеза Не. 0 ~ 04 Мы должны построить такой стзтнстычсскип критерий, который позволяет нам заключить, согласуется лп выборка (!) с гипотезой Не или нет. Обычно критерий строится с помощью критического множества. Из множествз Л всех возможных значений х = (хь ..., х„) выборки (1) выделяется такое подмножество 5, называемое критическим, что при х~ 5 гипотеза Не отвергается, а в остальных случаях она принимается.
Критическое множество 5 выбирается таким, чтобы вероятность Р„(5) =- = ~ р(х; 0)Ых выборке х попасть в 5 при гипотезе Н„ была мала. Получаемый с помощью критического мно. жества 5 статистический критерий называют иногда $-критериеж, Естественно, что множество 5, удовлетворяющее этому требованию, можно выбрать многими способами. Более определенный выбор возникает в том случае, когда нам задана конкурирующая, или альтернативная, гипотеза Ни 0 ен 6ь Мы будем рассматривать главным образом случай двух простых гнпотеи проверяемой гипотезы Н;.
рц(х) = р(х; О,) и конкурирующей гипотезы Н4. р4(х) = р(х; 0,). Есть задачи, в которых гипотезы Н, и Н, равноправны. Так обстоит дело при разбиении множества каких-либо объектов на два вида по значениям определенных параметров. Однако очень часто в реальных задачах гипотезы Не и Н, выступают неравноправно. Например, размер годной детали, изготавливаемой на заводе, есть случайная величина, имеюгцая нормальное распределение с параме4- рами (ае, ае), Предположим, что дефектная деталь имеет ч м.