XVII Математическая статистика (1081432), страница 4
Текст из файла (страница 4)
У„-+ У, если для любого е > О 11щ РИУ.-У! >е)-+О. Если имеет место равенство 1пп Гу„(х) = Гу (х) в каждой точке непрерывности Гу(х), то говорят о слабой сходимости последовательности Гу„(х) 4динций распределения (сходимости по распределению) и пишут Гу„(х) ==э Гу(х). Уместно также говорить о слабой сходимости последовательности (У„) случайных величин к У.
В этом смысле можно утверждать, что из сходимости по вероятности следует слабая сходимость. Отметим, что в теории вероятностей и ее приложениях наиболее часто используемые законы распределения случайных величин имеют общепринятые названия и обозначения. Например, нормальный закон со средним р и дисперсией оз обозначают символом Ф(р, оз); распределение Пуассона со средним Л вЂ” символом П(Л) и т.д. Если наблюдаемая в эксперименте случайная величина Х имеет распределение некоторого стандартного типа, то соответствующая статистическая модель имеет такое же название: нормальнал модель, модель Коши, биномиальнал модель, пиассоноаснал модель и т.д.
Для обозначения того, что случайная величина Х имеет закон распределения Г(х), употребляют символическую запись Х ° Г(х). Например, запись Х Ж(р,оз) означает, что случайная величина Х имеет нормальный закон распределения с параметрами р и оз. ЬЗ. Основные ввдачи математической статистики 1.2.
Основные задачи математической статистики При решении любой задачи математической статистики исследователь располагает двумя источниками информации. Первый и наиболее определенный (явный) — это результаты наблюдений (эксперимента) в виде выборки из некоторой геиеральиоб совокуииоспзи скалярной или некторной случайной величины.
При этом объем выборки и может быть фиксирован, а может увеличиваться в ходе эксперимента (т.е. могут использоваться так называемые последовательные процедуры статистического анализа). Второй источник — это вся априориал информация об интересующих исследователи свойствах изучаемого объекта, которая накоплена к текущему моменту. Формально объем априорной информации отражается в той исходной сеиатисеинческой модели, которую исследователь выбирает при решении своей задачи. В математической статистике всегда в той или иной мере используют априорную информацию об исследуемом объекте, но степень обоснованности такого использования лежит на совести (илн зависит от компетентности) конкретного исследователя.
Если есть сомнения в том или ином исходном допущении при решении конкретной задачи, то его нужно проверять и обосновывать, а при невозможности зто сделать — отбросить и попытаться найти решение задачи без привлечения сомнительных допущений. Перечислим некоторые задачи математической статистики, наиболее часто встречающиеся в ее приложениях. Оценка неизвестных параметров.
Задача оценивания неизвестных параметров возникает в тех случаях, когда функция распределения генеральной совокупности известна с точностью до параметра д. В этом случае необходимо найти такую 2б ь основные понятия вынорочной титии стпатпистпику В(Х„), выборочное значение д = В(х„) которой для рассматриваемой реализации У случайной выборки можно было бы считать приближенным значением параметра д. Статистику д(Х„), выборочное значение д которой для любой реализации й„принимают за приближенное значение неизвестного параметра д, называют его тпочечной оценкой или просто оценкой, а д — значением тпочечной оценки (просто оценки). Понятно, что точечная оценка д(Х„) должна удовлетворять вполне определенным требованиям для того, чтобы ее выборочное значение д соответствовало истинному значению параметра В.
Свойства точечных оценок рассмотрены ниже (см. 2). Для точечных оценок параметра д будем использовать н другие обозначения, например В(Х„), д" (Х„). Возможным является и иной подход к решению рассматриваемой задачи: найти такие статистики д(Х„) и д(Х„), чтобы с вероятностью у выполнялось неравенство р(в(х„) <в<в(х„)~= ~. В этом случае говорят об интпервальной оценке для д. Интервал (в(х„), в(х„)) называют доверитпельнььн интпервалом для В с коэффициентом доверил у. Доверительные интервалы обсуждаются в 3. Проверка статистических гипотез.
Стпатпнстпической еинотпезой называют любое предположение о распределении вероятностей наблюдаемой случайной величины — скалярной или векторной. В некотором смысле задача проверки статистической гипотезы является обратной к задаче оценивании параметра. Прн оценивании параметра мы ничего не знаем о его истинном значении. При проверке статистической гипотезы мы из каких-то ЬЗ. Осиоииые задачи математической статистики 27 соображений предполагаем известным его значение и хотим по результатам эксперимента проверить наше предположение. Примерами гипотез могут служить следующие предположения о вероятностных свойствах наблюдаемых случайных величин: 1) «« = ««е, где р — математическое ожидание случайной величины Х (гипотеза о величине математического ожидания); 2) «г«з — — «тзз, где о«з и с«зэ — дисперсии случайных величин Х« и Хз (гипотеза об однородности дисперсий)," 3) и'(х) = Ру(х), где и'(х) — неизвестнэл функция распределения наблюдаемой случайной величины Х, а Рг(х) — некоторая предполагаемая исследователем функция распределения (гипотеза о виде распределения).
Установление формы и степени связи между случайными величинами. Методы математической статистики, способствующие установлению формы и степени связи между случайными величинами, излагаются в таких разделах математической статистики, как корреляционный анализ, дисперсионный анализ, регрессионный анализ и др. Смысл таких задач поясним на простом примере. Пусть У вЂ” случайная величина, поведение которой мы хотели бы определять по значениям двух других случайных величин Х«и Хз.
Например, У вЂ” это степень шума двигателя автомашины, а Х«и Хз — соответственно величина пробега автомобиля и вес груза в нем. Корреляционный и дисперсионный анализ позволяет нам ответить на вопрос: есть ли связь между Хм Хз и У и насколько она существенна. На основе же регрессионного анализа мы можем построить так называемую регрессионную модель в виде зависимости у = «р(хм хз), где у — среднее значение шума У в зависимости от значений х«и хз случайных величин Х«и Хз.
Наличие такой модели 28 ь ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОЙ теОРиИ (которую строят, опираясь на результаты имеющихся статистических данных — результатов эксплуатации автомобилей) позволяет в дальнейшем выбрать наилучший режим эксплуатации и решать многие другие задачи. Подобные задачи рассмотрены в 6 — 8. 1.З.Предварительная обработка результатов эксперимента Прежде чем перейти к детальному анализу полученных в результате проведенного эксперимента статистических данных, обычно проводят их предварительную обработку. Иногда результаты такой обработки уже сами по себе дают ответы на многие вопросы.
Но в большинстве случаев они служат исходным материалом для дальнейшего анализа. Варинционпый ряд. Одним из самых простых преобразований статистических данных является их упорядочивание по величине. Пусть (хм ..., х„) — выборка объема и из генеральной совокупности Х. Ее можно упорядочить, расположив значения в неубывающем порядке: х(1) ~ ~х(г) ~~ ~ ~х(г) "ч "ч х(а) ~ (1.2) где х(П вЂ” наименьший, х(„) — наибольший из элементов выборки.
Определение 1.1. Последовательность чисел х(з) х(г) ". х(а) ". х( ) удовлетворяющих условию (1.2), называют вариаг)ионным р,ядом выборки, или, для краткости, просто вариаг(ионным рядом; число х(;), 1 = 1, и, называют (-м членом вариаг)ионного ряда. ЬЗ. Предаарительнае обработка реаультатоа эксперимента 29 Обозначим Хур 1 = 1, и, случайную величину, которая при каждой реализации случайной выборки Х„принимает значение, равное 1-му члену вариационного ряда. Определение 1.2. Последовательность случайных величин ХПН Х(яр ..., Хб), ..., Хрб называют варвационным р.ядом случайной выборки.
При этом Х(0, 1= 1, н, называют ь-м членом вариационноео р,яда случайной выборкв. Переход от случайной выборки Х„к ее вариационному ряду не приводит к потере информации, содержащейся в случайной выборке, поскольку их совместная функция распределения (1.1) остается одной и той же. Однако функция распределения каждой случайной величины Х(0, 1= 1, п, уже не совпадает с функцией распределения Г(х) генеральной совокупности Х, хотя и может быть через нее выражена. Например, можно показать (см.
пример 2.20), что для крайних членов варвационноео ряда случайной выборки Х01 и Х~„) их функции распределения имеют вид Р(Х00 < х) = 1 — (1 — г'(х)) Р(Х<„> < х) = г (х). Эти соотношения позволяют находить неизвестную функцию распределения г'(х) генеральной совокупности Х, имея в эксперименте лишь результаты измерений либо величины Х(П, либо Х(„р Пример 1.3. В результате пяти повторных независимых наблюдений некоторой случайной величины Х (например, Х— давление в газовом баллоне, измеряемое в мегапаскалях) полу- 30 ь ОснОВные пОКЯтиЯ ВыБОРОчнОЙ теОРии чены следующие ее значения: хя — — 10,4; хз — — 9,5; хз — 10,7; х4 — — 9,3; хя — — 10,1. Для данной выборки объема и = 5 вариационный ряд имеет вид хрб = 10,1; х00 = 10,4; х(я1 = 10,7.
х01 — — 9,3; х00 = 9,5; Статистический ряд. Среди злеменоюв выборки хы ..., х„(а значит, и среди членов вариационного ряда х01, х(зр ..., х00) могут быть одинаковые. Так бывает, либо когда наблюдаемая случайная величина Х вЂ” дискретная, либо когда Х— непрерывная, но ее значения при измерениях округляют.
Пусть среди элементов выборки хя, ..., х„выделены т < и их различных значений, расположенных в порядке возрастания. Обозначим их х0р ..., х( р Предположим, что каждое из них повторяется соответственно пы ...,и раз, причем, разумеетм ся, ~;и;=и. Таблица 1.1 Стаагаисюнические Ванные, представленные в виде статистического ряда, называют хрунннрованнымн. Определение 1.3. Созатннсганчесним р.вдом для выборки называют таблицу, которая в первой строке содержит значения хПН ..., х(„,1 (напомним, что х01 « ... х1„,1), а во второй — числа их повторений (табл. 1.1). Число и;, 1 = 1, т, показывающее, сколько раз встречался элемент я(0 в выборке, называют часюнотноб, а отношение нч/и — оозноснюнельноб частноозоб этого значения.
ЬЗ. Предаарительнав обработка реаультатоа эксперимента 31 Исходные данные группируют обычно при больших объемах выборки (свыше 50), причем не только в виде статистического ряда, но и следующим образом. "отрезок .7 = [х1ц, хбб), содержащий все выборочные значения, разбивают на т промежутков 4, как правило одинаковой длины Ь. При этом считают, что каждый промежуток содержит свой левый конец, но лишь последний промежуток содержит и свой правый конец. При таком соглашении каждая точка отрезка,У содержится в одном и только в одном промежутке 4. Далее, для каждого промежутка.7;, 1= 1, т, подсчитывают число пь элементов выборки, попавших в него (при этом и = п1+...+п ), а результаты представляют в виде табл. 1.2, которую называют питерваяьиььм статистпчесиим рядом. Таблица 1.8 Иногда в верхней строке табл.
1.2 указывают не интервал, а его середину хь, а в нижней строке вместо частоты пь записывают относительную частоту пь/п. Число промежутков т, на которые разбивают отрезок .У, выбирают в зависимости от объема выборки и. Для ориентировочной оценки величины т можно пользоваться следующей формулой'. 1оазп+ 11 которая дает нижнюю оценку величины т и наиболее точна при больших значениях п. Например, при п = 100 она дает т > 6, а при и= 1000 — т> 9. 'Смл Абвоэли С.А., Еиюков И.С., Меюолкни ЛЛ., 198З. 32 ь ОснОВные пОнятия ВыБОРОчнОЙ теОРии Пример 1.4.
В течение суток измеряют нзлряженне Х тока в электросети в вольтах. В результате опыта получена выборка объема и = 30: 107; 108; 110; 109; 110; 111; 109; 110; 111; 107; 108; 109; 110; 108; 107; 110; 109; 111; 111; 110; 109; 112; 113; 110; 106; 110; 109; 110; 108; 112. Построим статистический ряд этой выборки, Наименьшее значение в выборке х(Н вЂ” — 106, наибольшее— х(з1 —— 113. Подсчитываем частоту тц„й = 1,8, каждого из восьми различных значений в выборке и строим табл. 1.3. Таблица 1.8 Эмпирическая и выборочная функции распределения. Рассмотрим функцию п(х,Х„), которая для каждого значения х б Е и каждой реализации х„случайной выборки Х„принимает значение, равное числу элементов в выборке х„, меньших х. Определение 1.4.