Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 13
Текст из файла (страница 13)
В этой главе мы рассмотрим это распределение, известное также как распределение Стьюдента, или 1-распределение, а также обсудим его многомерное обобщение, данное Гарольд~щ Хотеллингом [5Ц. Кроме того, мы рассмотрим Е-распределение (или отношение дисперсий) и распределение у,' (хи-квадрат), так как они связаны с задачами, сформулированными в зтой главе.
3.1. ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНЕГО ЗНАЧЕНИЯ ЗАДАННЮИ ПОСТОЯННОЙ ВЕЛИЧИНЕ В последней главе мы отмечали, что если дисперсия генеральной совокупности известна или определена заранее, то гипотезу Н,: р = р, можно проверить относительно конкурирующей одно- или двусторонней гипотезы с помощью нормального распределения. Соответствующая статистика равна: Х вЂ” Р~~ г = (3.1) ~7 где ох =о/3/а для больших выборок. Однако если значение о~ неизвестно или заранее не определено, то оно обычно оценивается на основании выборки. Естественной оценкой а' является а2, и если мы заменим о на я в определении стандартной оп|ибки среднего значения, то получим а~гнку стандаргиной ошибки среднего Я 3~а (3.2) Заменив о- его оценкой зх в выражении (3.1), будем иметь (3.3) Статистика азиз (3.3) подчиняется 1-распределениюсп — 1 степенями свободы.
Следовательно, среди и наблюдений Х», Х„..., Х„с заданным выборочным средним Х независимы только и — 1 наблюдений. Другими словами, если среднее в данной последовательности чисел задано, 'го только й — 1 чисел могут быть выбраны случайным образом. Если эти и — 1 чисел известны, то п-е число должно быть таким, чтобы среднее значение всей последовательности совпадало с заданным. Для обозначения числа степеней свободы мы будем пользоваться символом ~. Предположим, например, что из большой партии взята наудачу выборка в 36 болтов, работающих на срез.
Желательно иметь-болты со срезывающим усилием 25 единиц. Болты с меньшим срезывающим усилием с~и~ко~ часто ломаются, и б~л~~ с большим срсзывающим усилием могут привести к повреждению оборудования, в котором онн установлены. Семейство гипотез в этом примере имеет вид: На . р. = 25; Н,: 1$ф25; будем считать, что проверка должна быть выполнена с уровнем значимости а = 0,05.
Из указанной выборки было найдено, что Х =20,0 и а = 2,0. Тогда 8- = 2/$' 36=1/3. Статистика 1 равна: г =- Х 'Ра =(20 — 25)3= — 15, ах а число степеней свободы для этого критерия равно: ъ =- и — 1=35. Табл. 2 приложения содержит правые «хвостыа нескольких 1-распределений. Каждому значению числа степеней свободы ъ соответствует одно 1-распределение.
В этой таблице при а/2=0,025 и ~ = 35 мы находим критические значения 1, равные приблизительна' ~- 2,03. Поскольку выборочцое значение 1, равное — 15,0, меньше, чем — 2,03, мы отвергаем нулевую гипотезу и отвергаем данную партию как неподходящую. Если бы требовалась проверка односторонней гипотезы, то она выполнялась бы совершенно аналогичным образом, за исключением того, чго при определениМ критического значения 1 вместо а/2 было бы взято а, и, конечно, существовало бы только одно критическое значение 1. Доверительные пределы. 100~1 — а) %-ные доверительные пределы для среднего значения могут быть построены путем вычисления величины Л Ях ИаП; ъ) ~3.4 полученной обращением выражения (3.3) с критическим значением ~,„~~.„вместо ~.
Через 1 ~ , -обозначено значение 1, соответствующее а~2 и числу ъ степеней свободы. Если мы зададим в нашем примере 95о4~-ные доверительные пределы для р,, то 100(1 — а) %=95% и и - 0,05, Отсюда я/2 = 0,025, ъ = 35 и ~е ааа:аа =- 2,ОЗ. Доверительные пределы равны 20 -1- 2,03 — = 20 -1- 0,68.
' Значение ~ для ъ =- 35 в этой таблице отсутствует. Использованное аначенйе получено интерполированием значений длн ъ = 30 и ~ = 40. Вспомните, что ~-распределение, как и нормальное распределение, симметрично, („ледовательно, нижний предел равен 19,32, а верхний предел — 20,68, ямы можем утверждать, что при повторных выборкахтакимобразом построенные доверительные пределы будут накрывать неизвестное среднее значение генеральной совокупности в среднем в 95 случаях из 1ОО. Обратите внимание, что этот интервал не покрывает значения р — — 25. Таким образом, как и в предыдущей главе, центральный доверительный интервал эквивалентен критерию двусторонней гипотезы при том же значении я. Дополнительные замечания.
При увеличении числа степеней свободы 1-распределение сходится к стандартному нормальному распределению. Заметим, что в табл. 2 приложения при стремлении ~ к бесконечности площадь-правого чхвоста» соответствующего 1-распределения стремится к площади правого чхвсста» стандартного нормального распределения, т. е. (3.5) 1ип 1,„„,=г„. Когда число степеней свободы достигает или превышает 6О, то, как правило, нормальным распределением можно пользоваться с небольшой потерей точности.в качестве аппроксимации 1-распределения, По этой причине критерий 1 часто называют методом малых выборок. Однако различие между использованием г и использованием 1 заключается в том, является ли значение а' известным или оно неизвестно и оценивается по данным выборки.
Если о' известно или задано и если генеральная совокупность подчиняется У, (р, а') и (или) объем выборки велик, то согласно центральной предельной теореме распределение выборочных средних будет приблизительно нормальным со средним р, и стандартной ошибкой с„-. Поэтому г — приемлемая статистика для построения критерия. Если оа оценивается по данным выборки, а обычно так и бывает, и если генеральная совокупность подчиняется М, (р,, оа), то подходящей статистикой будет 1. Обратите внимание, что для г нормальность генеральной совокупности не является необходимой, в то время как для 1 она необходима. Табл. 3 приложения содержит определенный набор правых ахвостов» Р-распределения.
В основе этого распределения лежит пара чисел степеней свободы ~, и ~„и для каждого уровня а имеется одна таблица величины Р. Если ч, = 1, то Р-распределение и 1-распределение связаны соотношением' ~~и|~", 7 = ~р; „ч, (3.6) Наконец, еще одним полезным распределением, которое будет использоваться в этой главе, является распределение уа, Подобно ~-распределению ~а основано па одном значении ч. Правые ахвосты» распределения тт приведены в табл.
4 приложения. * Иго соотиоыевпе справедливо при ивлевой гипотеае. В втой пиите иы ве будем рассматривать нецеитральные распределения. В табл. 2 и 3 приложения обратите внимание на то, что для перехода от значений 1 к значениям Р при даиио а следуе пол оват я ~ /2. для ° ветствующих Ра у у с "~ =- 1. Это соответствие ие противоречит соотношению (3 6), так кай если ~ртоЬ (~:; 8~~~, „или ~: ~ ~ = а, то РтоЬ (~~:д (~ )а) = а.
Распределение у,' связана с нормальным распределением и Г-рас. пределением следующими соотношениями: уа; „=(~„~д)', где м =-1; Ха- ч =~1~а. ъ ъ е где ~о=- о~. Отсюда следует, чта (см. примечание 4) (4х/2) =Га-„ч1 м~~ где ъ'~ = 1 и ~ъо = ОО. 3.2. ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ ВЕКТОРА СРЕДНИХ ЗАДАННОМУ ПОСТОЯННОМУ ВЕКТОРУ Предположим теперь„что мы имеем р выборочных средних, каждое на основе и наблюдений из генеральной совокупности с многомерной нормальной плотностью всроя.гнасти Ф„(р, Х).
Обозначим эти выборочные средние через Х' = ~Х, Х, ... Х~). Предполагается, что этот вектор средних представляет собой аиенку р„ где Р = (Р1 Ря -" Ря~ .Мы хатим проверить нулевую гипотезу, состоящую в том, что вектор средних генеральной совокупности не отличается от заданного вектора Ио — Ьо1 Роо " Ро~~ Другими словами, мы хатим проверить гипотезу Но.Я=~Во при альтернативе Н|: ИФРоПо определению равенства векторов мы проверяем гипотезу, что одновременно все р~ равны соответствующим р, Другими славами, мы проверяем одновременно р нулевых гипотез, т. е. р, = р„, и р, = = ро, и ...
и р„= ро,. Одним из подходов к решениюэтой задачи было бы мйагократиое применение простого одномерного критерия 1, рассмотренного в предыдущем разделе. Иначе говоря, можно проверить гипотезу Н,: р., = ро1, затем Н,: ро = роо и т. д. Одна из трудностей такого подхода состоит в том, что желаемый совмесииий уровень зн2- чимоиии не может быть точно определен путем повторного использования одномерных интервалов. Например, предположим, что мы хотим проверить два генеральных средних и задаем доверительные интервалы для р, и р, при помощи одномерного метода ~см. (3.4)1, Обозначим интервал для р., через Р„а интервал для р,, — через 7,.
Предположим далее, что каждый из этих интервалав Отвечает95$$~-найдоверительиай вероятности. Тогда при повторных выборках вероятность того, что 1~ покрывает р, составляет 0,95, а вероятность того, что К~ покрывает р, составляет также 0,95. Обозначим эти вероятности как РгоЬ (Е,) = 0,95, РгоЬ (Е,) = 0,95, где Е, — событие, состоящее в том, что У, покрывает р„а Е, — событие, состоящее в чом, что 1 покрывает р . Пересечение этих двух доверительных интервалов образует прямоугольную доверительную область (заштрихованная площадь на рис. 3.1). Обозначим совместное появление двух событий Е~ и Е, через Е, Й Е, (читается Е, и Еа).
Тогда если Е, и Е, независимы, то РгоЬ (Е1 П Еа) .=--- РгоЬ (Е1) РгоЬ (Е,). В нашем примере совместная доверительная область обладает вероятнсстью (0,95)", если события Е, и Е, независимы. Однако, когда Е, и Е, относятся к таким данным, которые встречаются в экономических исследованиях, он Редко бывают независимы . у Можно показать, что если события Е, и Е, ие являются независимыми, то РгоЬ (Е, Д Е,) ~~ 1 — (1 — 095) — (1 — 0,95) — -- -О,90 для двух 95%-ных доверительных Ф; интервалов, и мы не можем точно определить совместный уровень значимости.
Этот вывод можно обобщить и на * Э' ' Д Рис. 3.1, Доверительная область . произвольное число средних значений. В традиционной и современной статистике мы часто встречаемся с проблемой одновременной проверки нескольких средних значений (или задания доверительных областей). Таким образом, для обеспечения желаемого совместного уровня значимости нам необходим критерий, позволяющий рассматривать все средние значения одновременно.