XVII Математическая статистика (1081432), страница 3
Текст из файла (страница 3)
В силу объективных причин обеспечивать контроль каждого прибора, как правило, не удается. Поэтому для контроля качества продукции поступают следующим образом. Выбирают наудачу некоторое количество п (конечное число) приборов и по их показателям судят о всей продукции в целом, например о доле бракованных изделий или о средней продолжительности бесперебойной работы прибора н т.д.
В подобных ситуациях естественно предполагать, что наблюдения за контролируемым показателем (хотя бы мысленно) можно проводить сколько угодно раз. Результаты п наблюдений рассматриваются как значения случайной величины — рассматриваемого количественного признака. Эта случайная величина может быть как 1.1. Выборка и выборочные характеристики 19 дискретной, так и непрерывной. Например, она может принимать только два значения 0 и 1, если речь идет о проверке, является прибор бракованным нлв нет. В другой же ситуации, когда оценивается время бесперебойной работы прибора, естественно считать, что случайная величина может принимать любое неотрицательное значение и является непрерывной.
В математической статистике множество возможных значений случайной величины Х называют еенеральной совокупяостпью случайной величины Х или просто генеральной совокупностью Х. Под законом распределения (распределением) еенеральной совокупностпи Х будем понимать закон распределения вероятностей случайной величины Х. Исходным материалом для изучении свойств генеральной совокупности (т.е. некоторой случайной величины) являются зкспериментпальные (стпатпистпические) данные, под которыми понимают значения случайной величины, полученные в результате повторений случайного эксперимента (наблюденнй над случайной величиной).
Предполагаем, что эксперимент хотя бы теоретически может быть повторен сколько угодно раз в одних и тех же условиях. Под словами „в одних и тех же условиях" будем понимать, что распределение случайной величины Х;, т' = 1, 2, ..., заданной на множестве исходов т-го эксперимента, не зависит от номера испытания и совпадает с распределением генеральной совокупности Х. В этом случае принято говорить о независимых повтпорных зкспериментпах (испытпанилх) или о независимых повтпорных наблюдениях над случайной величиной.
Совокупность независимых случайных величин Х1, ..., Х„, каждая иэ которых имеет то же распределение, что и случайнал величина Х, будем называть случайной выборкой иэ генеральной совокупности Х и записывать Х„= (Х1, ..., Х„) (иногда просто Хт, ..., Х„). При этом число и называют объемом случайной выборки, а случайные величины Х;— злементпами случайной выборки.
20 Ь ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОЙ ТЕОРИИ Любое возможное значеняе х„= (хы ..., х„) случайной выборки Х„будем называть выборкой из генеральной совокупности Х (также ревлизацией сличайиой выборки Х„) Число н характеризует объем выборки, а числа х;, 1= 1, и, представляют собой элементы выборки х"„. Выборку х„можно интерпретировать как совокупность и чисел хм ..., х, полученных в результате проведения и повторных независимых наблюдений над случайной величиной Х. Основой любых выводов о вероятностных свойствах генеральной совокупности Х, т.е. снзвнзистических выводов, является выборочный мензод, суть которого заключается в том, что свойства случайной величины Х устанавливаются путем изучения тех же свойств на случайной выборке. Множество возможных значений случайной выборки Х„ содержит информацию о случайной величине, полученную в эксперименте. Это множество называют выборочным кространснзвом и обозначают Х„.
Выборочным пространством может быть или п-мерное линейное арифметическое пространство Е", или его подмножество. Если Х вЂ” дискретная случайная величина, то выборочное пространство — конечное или счетное. Элементы Х;, 1 = 1, и, случайной выборки Х„независимы и имеют то же распределение, что и генеральная совокупность Х. Таким образом, функция распределения Ру(ФО...,Ф„) случайной выборки Х„имеет вид где Г(1) — функция распределения случайной величины Х (генеральной совокупности Х).
О распределении случайной величины Х в одних случаях у исследователя могут быть самые общие представления. Напри- 21 2ск Выборка в выборочные характеристики мер, Х является непрерывной случайной величиной и только (о распределении практически ничего не известно(). В других случаях функция распределения (в случае непрерывной случайной величины — плотность распределения вероятностей) известна, но не известны параметры, от которых она зависит.
Например, известно, что генеральная совокупность Х имеет нормальный закон распределения 1 ( -р)' р(х) = е 2вэ ~/2яо где р и о — неизвестные параметры. Значит, можно говорить только о семействе (классе) Р распределений случайной выборки, в котором содержится априорна.в информат1тсв (информация до опыта) исследователя.
Выборочное пространство, на котором задан класс распределений Р, назовем стпатпистпичесяой моделью'. В случае повторных независимых испытаний статистическую модель будем обозначать (г(х)), поскольку она полностью определена функцией распределения г (х) генеральной совокупности Х. Если функция распределения (плотность распределения) задана с точностью до неизвестного иектора параметров д = = (дм ..., В„) с множеством возможных значений ст, т.е.
и б 9, то статистическую модель называют параметпричесяой моделью. Параметрическую модель обозначают (г (х; д); о Е 9). Множество ет называют параметпричесяим мноэяестпвом. Следует отметить, что о параметрическом множестве исследонатель может не иметь никакой априорной информации. Стпатпистпичесяую модель называют непрерывной или дисттретпной, если случайнал величина Х является, соответственно, непрерывной или дискретной. В дальнейшем мы будем 'Раэумеетел, это слишком узкое толкование термина, которое уместно лишь в рамках данной книги.
22 1. ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОЙ ТЕОРИИ предполагать, что генеральная совокупность Х с функцией распределения Г(х) является либо дискретной, либо непрерывной случайной величиной. В первом случае распределение Х задают в виде таблицы (ряда распределений), а во втором — в виде плотности распределения рл(х). При этом будем использовать единое обозначение р(х) (или р(х;д) для параметрических моделей) как для плотности распределения случайной величины Х, когда она непрерывная, так и для вероятностя Р(Х = х) в случае дискретной случайной величины Х.
Пример 1.1. Пусть известно, что генеральная совокупность случайной величины Х распределена по нормальному закону с известной дисперсией и неизвестным средним д. Тогда статистическая модель имеет вид (Г(х; д); д Е 9 = К) и может быть задана с помощью плотности распределения вероятностей (х — я)з р(х;д) = — е зе~, х Е К. ~/2~го Если неизвестны оба параметра: среднее значение д~ и среднее квадратичное отклонение дз, то статистическая модель имеет вид ) Г(х;д); д = (ды дз) б 9), где го С К~ (д~ Е К, дз Е К+) и плотность распределения вероятностей содержит дна неизвестных параметра: (х — я1)з 1 р(х;дыдз) = е ~~~, х Е К.
ь/2ггдг Пример 1.2. Пусть случайная величина Х имеет распределение Пуассона с неизвестным параметром. Тогда статистическая модель имеет вид (Г(х;д); д е 9 = (О, оо)), где Г(х;д) определяется равенством р1х д) = Рг6Х = х = —,е, х = О, 1, 2, д л 23 1.1. Выборка и выборочные характеристики Замечание 1.1. Наряду с генеральной совокупностью одномерной случайной величины можно рассматривать генеральную совокупность многомерной (векторной) случайной величины, распространяя введенные выше понятия на этот случай. При этом случайную выборку объема и из генеральной совокупности (Х, У, ..., Я) будем обозначать (Х„, У„, ..., У„).
В дальнейшем мы будем рассматривать различные функции У = д(Х1,...,Х„) (или У = д(Х )) случайной выборки Х„= = (Х1, ..., Х„), например: У = —',т Х;. 1 п Любую функцию д(Х ) случайной выборки в математической статистике называют стпвтвисктикой, или выборочной хврактверистпикой. Распределение этой случайной величины называют выборочным распределением. Выборочное распределение однозначно определяется совместным распределением случайных величин Хм ..., Х„, т.е. распределением случайной выборки Х„. Значение д(х„) выборочной характеристики д(Х„), определенное по реализации х„ случайной выборки Х„, называют ее выборо ным значением. В математической статистике часто приходится рассматривать поведение выборочных характеристик при н-+ оо, где в — объем случайной выборки (Х1, ..., Х„).
При этом будем писать У„= д(Х1,...,Х„) и рассматривать последовательность случайных величин (У„1, сходящуюся в том или ином смысле к некоторому У вЂ” случайной величине или константе. В (ХЪЧ] были рассмотрены основные типы сходимости последовательности случайных величин и связь между ними. В этой книге будем испольэовать два вида сходимости: сходимость по вероятности и сходимость по распределению, или слабую сходимость. 24 Ь ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОЙ ТЕОРИИ Напомним, что последовательность (У„) случайных неличин Р называют сходящейся по нероятности к У, т.е.