Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 15
Текст из файла (страница 15)
Н,: — .~ /д(п — 1) с~ Х=ь у с1 ~с~ ~я" дай — 9 ( -ч) Здесь д.=- 3 (так как одновременно рассматриваются три нулевые, гипотезы), а К вЂ” соответствующие постоянные. Эта гипотеза может- быть записана в виде и,: с'р — -к„ 1 и ее можно проверить с помощью 30110... 0 С'= 01 100... О, 10120... О где С' — матрица размера 3 Х р. Затем поменять в (3.15) С'р, на К и с помощью полученного выражения завершить проверку гипотезы. Ф Доверительные пределы для линейных комбинаций. Совместные ° Ф Р ф доверительные пределы для С р находятся с помощью выражения,' (3.15) и критического значения Т'.
Таким образом, С'Р, буде~ ограни- ~ чена областью 1 у: ~С'Х-6'~в)'(С'$С)-'~С'Х:С'р) ~ Р)~:~,, д. (3.!6) ) а(а — 4 с доверительной вероятностью 100 (1 — а)%. Если С вЂ” единичная матрица, то о = р и выражение (3.16) формально эквивалентно (3,12). Тогда, чтобы получить 1ОО(1 — а)%-ные доверительные пределы;-' для линейной комбинации с~р (где с~ есть столбец матрицы С), мы можем ';: записать: (3.16а ): например, для словесных и количественных оценок при сс = 0,05 находим ЦС вЂ” 1) Р 2Щ(4 46), 10035 п(л — д) ~ ~ 10 (8) так как Р = д = 2.
Лля словесных оценок с~ =- ~1 О), так что с~ Х= 576 с1 Яс1 —— 6248,9. Следовательно, 95%-ные доверительные пределы равны: 576 -Ь Я(1,0035) (6248,9) — =- 576 ~- В,2 или 496,8 ~ р,, 655,2. Для количественных оценок мы имеем с~ — — 10 1), откуда с,' Х =596 С2 $са =3693,3. Следовательно, 95%-ные доверительные пределы равны: 596 -~- 3/(1,0035) (3693,3) = 596 -1- 60,9 или 535,1 - р~ =. '656,9. Заметим, что доверительные пределы для р, покрывают значение 590, в то время как доверительные пределы для р, не покрывают значение 690. Таким образом, доверительные пределы эквивалентны проверке гипотезы с применением линейных комбинаций. Соотношения между доверительными интервалами.
Мы упоминали, что с помощью выражения (3.15а) ил1и (3.16а) можно найти среднее значение, которое стало причиной отбрасывания нулевой гипотезы. Этот метод можно с успехом применять во многих случаях, но не всегда. Мы объясним это на примере с экзаменационными оценками студентов, где имеется только два средних значения и д ==- р = 2.
В случае р» 2 наглядно представить себе совместный доверительный эллипсоид очень трудно или даже невозможно, так как это будет тело в р-мерном, р ~ 2, пространстве. Обычно при р.: 2 мы вынуждены проектировать соответствующий контур эллипсоида в одномерное пространство. Обсудим такую проекцию. Доверительный эллипс, изображенный на рис.
3.2, в, окружен рамкой, иначе говоря, проведены вертикальные и горизонтальные линии, касательные к эллипсу. Эти линии пересекают ось р, в точках 496,8 и 655,2 и ось р, в точках 535,1 и 656,9. Таким образом, эти линии задают минимальные размеры рамки, в которую можно заключить э'тот эллипс. В данном случае размеры рамки определяются доверительными интервалами линейной комбинации с с~ = 11 01 и ср — — ~0 1], которые мы только что вычислили. Рассмотрим эллипс на рис. 3.3, ограниченный подобной рамкой„ Любая нулевая гипотеза, лежащая за пределами этой рамки, будет отвергнута с помощью либо этого эллипса, либо доверительных интервалов линейной комбинации.
Другими словами, причиной отбрасывания совместной нулевой гипотезы можно считать словесную и (или) количественную оценку. Любая нулевая гипотеза, лежащая внутри эллипса, будет принята как при использовании эллипса, так и доверительных. интервалов линейной комбинации, Однако любая нулевая гипотеза, попадающая в заштрихованную область между эллипсом и рамкой, будет отвергнута при использовании совместного доверительного эллипса, но принята при использовании доверительных интервалов линейной комбинации. Таким образом, если совместная гипотеза была отвергнута, то проверка линейной комбинации, подобно описанной в этой главе, чгобы выяснить, какое (какие) из средних вызвало (вызвали) ее отбрасывание, оказывается не всегда возможной.
Если причину отбрасывания совРнс. 3.3. Ловернтельные ннтерна- местной гипотезы нельзя. однозначлы линейной н ~мбннаиин но отнести к какому-либо одному среднему значению, то что же служит основанием для того, чтобы-отвергнуть совместную гипотезу? Этим основанием должна быть комбинация двух средних значений. У 1 1 Таким образом, вектор с~, равный, например — —, задает пару пря- 2 2 мых, касательных к совместному доверительному эллипсу, и любой вектор с~ (за исключением нулевого вектора), взятый в сочетании с (3.16а), даст пару прямых, касательных к совместномудоверительному эллипсу, Если р -: 2, вектор с~ задает гиперплоскости, касательные к совместному доверительному эллипсоиду.
Бесконечно больп|ое числ~ таких касательных прямых (или гиперплоскостей) будут описывать этот эллипс (соответственно эллипсоид), и заштрихованная область исчезнет. Именно в этом смысле мы говорим, что доверительные интервалы для линейных. комбинаций совместны. 3.3. ПРовеРкА гипотезы о РАвенстве ДВУХ СРЕДНИХ ЗНАЧЕНИИ Следующая полезная проверка касается равенства двух средних, например р., и рн. Предполагая, что рассматриваемые генеральные совокупности есть У, (р„Ф) и У, (р„Ф), мы проверим гипотезу Но-Р1=Р 01 е р 1~~ ~хну 11ользуясь 1-распределением.
Найдем сначала юбъеди11е11ную» оценку общей дисперсии совокупности о»: Хх~а+ Ххаа Ъ~ ик+ Рьа — 2 (3.17) где х, = Х~ — Х~ и хй = Х, — Хй. Эта еобьединенная» оценка есть не что иное, как среднее двух выборочных дисперсий, так как (3.17) может быть записано в виде 031 — 1) 81~ +1иа — 1) 8аа ~»» = (а1 — 1)+(л,— 1) (3.17а) где 8„и ж,й — выборочные дисперсии. Тогда в предположении неза- висимости дисперсия разности между этими двумя выборочными сред- ними будет равна,' а ъ~е ~ ааа %+Па + = » ° п1 па п1 и Старий способ Статыстика Новый способ Х,=35 единиц Среднее время В вяине Вариация Объем выборки Х, =-40 единиц нахождения Пользуясь этой информацией, мы вычисляем 1 220+1 190,2 410 25+20 — 2 43 Ф вЂ” — — '+ — ' — 5,045, 56,05 56,05 х1 — ха 25 22 Статистика критерия имеет вид: У,— Ха (У1 — Х,) ~'йи, (3.19) Х ъ аа ~~ п1+ла с л, + и,— 2 сипеняыи свабоды в з„= )~ 8 Предположим, что предлагается новый способ обработки металла для защиты его от коррозии.
Принято решение провести испытание нового способа по сравнениюс существующим для того, чтобы опреде- лить, следует ли принимать новый способ. Уровень значимости заранее задается равным 0,01. В результате испытания, которое проводится путем погружения случайных выборок образцов в коррозийную ванну, получены следующие данные (были взяты 25.металлических полос, обработанных старым способом, и 20 металлических полос, обработан- ных новым способом): откуда 55 — 4Π— 5 1~5,Ол5 2,2 Оо: Р1 = рз' и,: р,1<.
р,, В табл. 2 приложения мы находим значение 10,1„4„— 2,4. Так как выборочное значение 1 по абсолютной величине меньше 2,4, мы не отвергаем нулевую гипотезу об отсутствии статистического различия в долговечности дв~'х испытываемых партий образцов. Доверительные пределы. Доверительные пределы могут быть найдены и для рмности между двумя средними значениями. Для упрощения обозначений пусть Лр, = р, — р,, и ЛЖ = Х, — Х,. Тогда 1ОО (1 — сс)%-ные доверительные пределы для Лр можно вывести из уравнения (3.19): (3.2О) где у = п1 + д2 — 2.
Если в нашем примере мы зададим 99%-ные доверительные пределы, то, поскольку ~,,„,; 4З м 2,7, они будут равны — 5-Ь2,2 (2,7), т. е. — 10„94 = Лр ~-. 0,94, Так как нуль находится внутри этого доверительного интервала, можно сделать вывод, что на заданном доверительном уровне стати- стическое различие между сравниваемыми способами обработки от- сутствует. Пусть два вектора средних Х, и Х, выбраны из двух многомерных нормальных генеральных совокупностей У„(р„Х) и Ф„(р,, 3).
Обратите внимание на предположение, что обе совокупности имеют одну и ту же ковариационную матрицу Х. Мы хотим проверить гипотезу Оо: р1 = рз' ~~: ря ФН2» или, что то же самое, Оо - ~Ф = О' Н~ . Лр, =~~ 0» В этом примере семейство гипотез имеет вид: 3.4, ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ ДВУХ ВЕКТОРОВ СРЕДНИХ ЗНАЧЕНИЙ т.
е. мы хотим проверить» все ли элементы двух одновременно равны. Ф векторов средних тим определить, будут ли векторы средних оценок для этих двух групп студентов существенно различными. Для второй группы студентов, как мы уже знаем из раздела 3.2, 56 240 17 240 17 240 33 240 х,'х~ =- Для первой группы студентов 121 569 25 615 25 615 56 492 Таким образом, согласно (3.21) объединенная ковариацнонная матри- ца равна: 8 467 2 041 2 041 4 273 а обратная ей матрица 8 — и 0,0001335 — 0,0000637 — 0,0000637 0,0002645 Для уравнения (3.23) нам также нужны величина — — — =- 5,652 лю+л 23 и разность 22,461 114,769 Таким образом, Т~ ==(5,652) ~22,461 114,7691 0,0001335 — 0,0000637 — 0,0000637 0,0002645 22,461 114,769 Если мы хотим проверить нулевую гипотезу на уровне а = 0,01, то из (3.24) мы находим„что критическое значение Т' равно: Т~ + 1 ' 123 '01' 2' 20 80+13 2 Ц так как Г,» О,,,д = 5,85.
Следовательно, мы отвергаем нулевую гипотезу и делаем вывод, что векторы средних на заданном уровне значимости различны. Доверительная область. 100 (1 — а) %-ную доверительную область для Лр = р,— р, можно построить с помощью ЛХ = Х,— — Х,. Уравнение соответствующего эллипсоида следует из (3.23) и (3.24), а именно: этот эллипсоид ограничен поверхностью УД ~ У Ц» РХ ~ ) (~1+М (»»~+~э 21Р Р Р.25) на заданном доверительном уровне значимости.
Мы предоставляем вычисление этой области для примера, рассматриваемого в данном разделе, читателю в качестве упражнения, так как оно производится, по существу, так же, как в разделе 3.2. Линейные комбинации. Можно проверять также гипотезы о~носительно линейных комбинаций СЛр с матрицей С, представляющей собой р Х д матрицу ранга д. По аналогии с уравнением (3.23) запип1ем Т'=- — ''- (С' ЬХ)'(С' З, С)-'(С' ЛХ~.
п+а, Критическое значение Т' задается выражением Аналог уравнения (3.15а) для ~-го вектора-столбца С имеет вид: п~нз(сс ЛХ) (и~+из) с~ 84, су (3.26а) с критическим значением Т',, „,+„, ~ 1. Попробуем теперь выяснить причины отбрасывания нулевой гипотезы, состоящей в том, что векторы средних оценок для успевающих и неуспевающих аспирантов равны. Сравним сначала словесные оценки, приняв с~ = ~1 03. Б этом случае (3.26а) превращается Р СЮ1 аз1 ~а~ ж 3 ~10+13) (8 467) ~ Данные, использованные при анализе экзаменационных оценок в этой главе, представляк>т собой фактические оценки студентов одного из университетов США. ~Успевающими студентом считался студент, который сдал квалификационные экзамены по аспирантской программе в течение 5 лет с момента начала обучения. Фред Уестфнлд высказал предположение, что словесная оценка может оказаться полезной для предсказания уровня диссертационной работы.