А.Н. Бородин - Элементарный курс теории вероятностей и математической статистики (DJVU) (1115320), страница 22
Текст из файла (страница 22)
Для того, чтобы в дальнейшем не усложнять формулировки теорем, мы сразу предположим, что выполняется следующее условие: если рассматривается оценка илн момента порядка Х центрального момента порядка х, то у случайной величины Х конечен момент порядка 2х. Это условие нам потребуется для того, чтобы применять закон больших чисел (2 16).
19. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 147 1. Выборочное среднее. В качестве оценки для математического ожидания гя = Е(Х) используется оценка — 1 о Х„= — 2,, Хн которая называется выборочным средним. н Замечание 1. Выборочное среднее является средним значением (математическим ожиданием) для емпирическей функции распределения. В етом утверждении присутствует необычное наслоение, связанное с понятием случайный.
Эмпирическая функция распределения сама зависит от случая, т. е. каждому значению случайной выборки отвечает своя реализация емпирической функции распределенил. Рассматривая вту реализацию как обычную функцию распределения, мы можем вычислить среднее той случайной величины, которая ей соответствует. Согласно замечанию 4 з 18 ета величина принимает значения (если их упорядочить) Х1е>, й = 1, 2,..., н, с равныт ми вероятностями —.
Среднее же втой дискретной случайн Ф ной величины по определению (см. $12) равно ~ К<а1- = е=г = Х„, т. е. равно выборочному среднему. Теорема 1. Выборочное среднее Х„является несмещенной состоятельной оценкой математического олсиданая Е(Х). Доказательство. Несмещенность является следствием цепочки равенств и о о Е(Х ) = -Е( Хг) = — ~Е(Хг) = — ~~ т = т. г=1 г=1 ыг Состоятельность Х„следует из закона больших чисел (З 16), согласно которому Х„-+ т по вероятности. Лля выборочного среднего очевидно следуюшее равенство Х„(Хг + с,..., Х„+ с) = = — ~1 (Х1 + с) = с+ Х„(Х, Хг,..., Х„), (19.1) которое можно охарактеризовать как свойство аддитивности выборочного среднего.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 2. Выборочная дисперсия. В качестве оценки для дисперсии Р(Х) используется оценка в 52 = — 'Е(Х1 — Х )2 1=1 которая называется выборочной дисперсией. Выборочная дисперсия характеризует среднеквадратичное отклонение выборочных величин от выборочного среднего. 1 В определении выборочной дисперсии множитель— н-1 1 взят вместо множителя — для того, чтобы добиться важного свойства несмещенности оценки 5„. 2 Теорема 3. Виборочная дисиерсия 52 является инвариантноб относителгно свдига несмеи1еиноб состоятелгноб оиениоб дисаерсии Р(Х).
Локазательство. Использул равенство (19.1), получим 52 (Х1 + с,..., Х„+ с) = — ~~~ (Х1 + с — Х„(Х1 + с,..., Х„+ с))2 = —,» (х, - х.(х„..., х„))' = 5„'(х„..., х„). (19.2) Это доказывает инвариантность оценки 52 относительно сдвига. Проверим несмещенность. Пусть т = Е(Х~),ог = Р(Х1). Положим гг = Х1 — т. Тогда Е(У~) = Е(Х~) — т = О, Р(У1) = = Р(Х1) = оз. В силу инвариантностн относительно сдвига 52(Х) = 52(У). Далее имеем 12.
ОЦЕНКИ ПДРДМЕтРОВ РДСПРЕДСЛКНИЯ 142 и У2 1=1 и ~~~» У2 1=1 1 и -1 2и — 2 и — 2 — — У + — У и и 1 и 1 и — 1 и — г — — У и — 1 (19.3) Используя третье свойство математического ожидания (2 12) и равенства Е(У1) = О, получим и и Е(Уи)= Е(~х'.,У1) = 2Е(~~'. 11 +2~У1У1) = 1=1 1и1 1<1 и и ~Д~ Е(У12)+2~ Е(У1)Е(У)) ~~ 'Е(У12) 1<1 1=1 Теперь, применяя (19.3), найдем, что Е(сг(Х)) Е(Яг(У)) и 1 г и 2 иа2 и а2 2 = — "~ Е(У, ) — — Е(Уи) = — — — — = и . и — 1 и — 1 " и — 1 и-1 и 1=1 и Я(Х)= 1 ~ ~Х вЂ” — Х 1=1 и = — "(-1~Х2-Х'„). 1=1 (19.4) В силу состоятельности выборочного среднего Х„-+ Е(Х) по вероятности.
Поскольку квадраты независимых одинаково распределенных случайных величин являются независимыми одинаково распределенными величинами, то по закону больших чисел (2 16) имеем и -'т~ .112- Е(Х') 1и1 Следовательно, Бит(Х) является несмещенной оценкой дисперсии случайной величины Х. Докажем состоятельность. Аналогично (19.3) имеем МАТЕМАТИЧЕСКАЯ СТАТИСТИКА по вероятности.
Так как — -+ 1, то из (19.4) следует, что н — 1 5в(Х) + Е(Х ) Е (Х) Р(Х) по вероятности, а ото и означает состоятельность оценки яо(Х). Замечание 2. Лля различных вычислений часто бывает удобней пользоваться следующей формулой для выборочной дисперсии: Я2(Х) = —, Е Х~з — — ", Х„'. ьы Эта формула содержится в (19.4). 3. Выборочные моменты. Выборочным моментом порядка й, построенным.по выборке Х, называется величина о Х"'= -'С Х". -т,., ы1 Аналогично случаю с выборочным средним легко убедиться, что выборочный момент порядка й является моментом порядка я для емпнрической функции распределения. Теорема 3. Выборочный момент Х„являетея неемен1ен— ее» нвй состоятельной оаенхой момента аль.
Лов азат ельство. Несмещенность следует из равенств и в Е(Х„) = -ЕЯ~ Х~е) = — ~» Е(Х~ь) = Е(Х~) = шы нп ы1 Состоятельность непосредственно вытекает из закона больших чисел: при н -+ оо Хо = — ~~~ Х~~ -+ Е(Х ) п ьы по вероятности. Выборочным центральным моментом порядка я, я ) 2, построенным по выборке Х,называется величина и Ф" = -'~(Х, — Х.)". ь=т 1и оценки пдрдмп.ров рдспрбдбябния ззт Теорема 4.
Вмборонний центральннй момент' ь„являю(ь) ется инвариантной относительно сдвига состоятельной оцен«ой центрального момента рь. Л о к аз ат е л ь с т в о. Инвариантность относительно сдви-(г) га оценки о'„(Х) устанавливается точно так же, как инвариантность оценки,Я(Х) (см. доказательство теоремы 2). Лля доказательства состоятельности воспользуемся равенством Ь-1 аь — Ьь =(а — Ь)~~Ь атйь 1 т. =о В силу етого равенства — )~,(Х1 — Ко) — — ~~',(Х1 — Е(Х)) 1и1 1=1 о 1-1 = (К.
- Е(Х))-'~ ~;(Х1 -Х„)-(Х, — Е(Х))'-'- й-1 н = (Մ— Е(К)) ) — Ц~1 (Х1 — Х„)~(Х вЂ” Е(Х))» =о (19.5) Применяя оценки (12.1), (12.2) и свойства 1), 2) математи- ческого ожидания ($12), получим Е(~ц~1 (Х1 — Хо) (Х1 — Е(Х))ь 1 вь~) < Ы1 о < ~г Е(!(Хь — Х„) (Х1 — Е(Х))ь 1 т)) < 1=1 < ((Е(Х вЂ” К.)'-)'"(Е(Х вЂ” ж(Х))"-'-'-)"') В силу состоятельности выборочного среднего Մ— Е(Х)- 0 по вероятности.
С помощью прямых вычислений можно проверить, что математические ожидания квадратов случайных величин (Х1 -Х„)оь и (Х1-Е(Х))ь 1 "' конечны и не зависят 19. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ Для выборочной ковариации и для выборочного коеффициента корреляции несложно получить следующие выражения: С„(Х,У) = — ', Ц;Х,У, — ( — ",)Х„У„, (19.7) » -„' ~: х,И вЂ” х»у» " т1 Л„(Х,У) (19.8) Теорема 5. Виборочная ковариация С„(Х,У) является инвариантной относительно сдвива нсся4си1сннвй соствтвсявной оценкой ковариации соч(Х,У). Доказательство.
Используя формулу (19.6) и выкладки, аналогичные (19.1), (19.2), несложно проверить, что для любых си сз справедливо равенство С, (Х + ем У + сз) = С,(Х,У), где с1 —— (сноп...,с~),сз = (сз,сх,...,сз)-и-мерные вектора с одинаковыми компонентами. Это равенство и означает, что выборочная ковариация С„(Х, У) инвариантна относительно сдвига. Докажем несмещенность оценки (19.7). В силу инвариантности относительно сдвига можно считать, что Х~ и У~ имеют нулевые средние (ЕХ~ = ЕУ~ = 0), иначе из етих величин можно вычесть математические ожидания, не изменив оценку.
При нулевых средних Е(Х„У„) = —, "~, Е(ХЯ) = -Е(ХУ ). Теперь несложно убедиться в несмещенности оценки: » ЕС„(Х, У) = — ~Ц~ Е(ХМ) — ( — )Е(Х„У») = т1 = — Е(ХУ) — — Е(ХУ) = Е(ХУ) = сои(Х, У). МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 154 Последнее равенство верно, поскольку мы предположили, что величины Х и У имеют нулевые средние. Лля доказательства состоятельности воспользуемся формулой (19.7). Поскольку двумерные величины (ХИ 7~) являются независимыми и одинаково распределенными, то произведения их координат ХЯ будут независимыми одинаково распределенными величинами.
Применим закон больших чисел (з 16), согласно которому и — Х~У~ -~ Е(ХУ) "ьм по вероятности. Так как выборочное среднее является состоятельной оценкой, то имеем Х„-+ Е(Х), У„-~ Е(У) по вероятности. Используя эти предельные соотношения в формуле (19.7), получим, что г С„ф, У) = — (- Ц~~ ХЯ вЂ” Х„У„) -+ Е(ХУ) — Е(Х)Е(У) по вероятности. Правая часть етого соотношения равна сои(Х, У). Следовательно, С„(Х, у) является состоятельной оценкой ковариации. Теорема 6. Виборочний коэффициент корреляции В„(Х, У) является иноариантной относительно сдвига сосгноятелгной оценкой коэффициента корреляции г(Х, У).
Показательство. Поскольку выборочный коэффишгент корреляции равен отношению выборочной ковариации к корню из произведения выборочных дисперсий, то инвариантность относительно сдвига и состоятельность атой оценки следует из аналогичных свойств выборочной ковариации и выборочных дисперсий. Задача 1. При обработке данных 15 испытаний спортивного самолета были получены следующие значения его максимальной скорости: 422.2; 418.7; 425.6; 420.3; 425.8; 423.1; 431.5; 428.2; 438.3; 434.0; 411.3; 417.2; 413.5; 441.3; 420.0 м/сек.
Определить несмешенные оценки математического ожидания и дисперсии максимальной скорости самолета. 19. ОчЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 1ББ Звдачи Задача 19.1. Произведено 16 измерений начальной скорости снаряда. Результаты измерений (в м/с) следующие: 1235.6; 1237.5; 1232.9; 1236.2; 1238.5; 1234.2; 1235.9; 1233.3; 1234.5; 1236.8; 1237.6; 1233.1; 1234.3; 1237.5; 1235.4; 1234.7.
Вычислить оценки математического ожидания и дисперсии начальной скорости снаряда. Задача 19.2. На телефонной станции производились наблюдения за числом неправильных соединений в минуту. Наблюдения в течение часа дали следующие результаты: 3, 1, 3, 4, 2, 1, 2, 4, О, 3, О, 2, 2, О, 2, 1, 4, 3, 3, 1, 4, 2, 2, 1, 1, 3, 2, 7, 2, О, О, 1, 3, 3, 1, 2, 4, 2, О, 2, 3, 1, 1, 2, 1, О, 3, 4, 1, 2, 2, 1, 1, 5. Оценить среднее и дисперсию числа неправильных соединений. Задача 19.3. Сырье, поступающее на завод из карьера, содержит два полезных компонента — минералы А и В. Результаты анализов десяти образцов сырья, поступившего в разное время из разных мест карьера, приведены в таблице, Решение. Лля того чтобы упростить вычисления воспользуемся свойством инвариантности относительно сдвига для выборочной дисперсии, а для выборочного среднего используем равенство (19.1).
Тогда вместо исходной реализации выборки можно рассмотреть, например, реализацию Ы: 2.2; -1.3; 5.6; 0.3; 5.8; 3.1; 11.5; 8.2; 18.3; 14.0; -8.7; — 2.8; — 6.5; 21.3; 0.0, которая отличается от исходной на значение с = 420. Выборочное среднее атой реализа- 15 цки равно л15 = — ~, 'л1 = 4.73. Лля вычисления выбо- 15 ~ рочной дисперсии воспользуемся равенством (19.4). Имеем 15 в~~в — — — Я з~~ — — (Еж)1 = — 1391.08- — (4.73)1 ж 75.392. Сле- 14 1 14 14 14 довательно, оценка математлческого ожидания максимальной скорости спортивного самолета равна 424.73 м/сек.
Несмещенная оценка дисперсии приблизительно равна 75.392 мз/сект. мдтемдтическдя стдтистикд 155 где х и р — выборочные значения случайных величин Х и У, выражающих соответственно процентное содержание минералов А и В в образцах. 67 54 72 64 39 22 58 43 46 34 у 24 15 23 19 16 11 20 16 17 13 Оценить коэффициент корреляции величин Х и У. 320. Асимптптические свойстВА ВыБОРОчных мОментОВ Пусть р — некоторый параметр распределения случайной величины Х, значение котоРого нам неизвестно, и тп(д) = = тп(Х1,Хз, ° ° ,Х„) — оценка параметра Р, построенная по выборке Х. Хорошая оценка, естественно> должна быть состоятельной, т.