М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 12
Текст из файла (страница 12)
Количество мух таблица 4 Времена реааннн уап Я = 1,2, двух трупп мух на Хеяегвне наа, лег = !п уы, пег = Ф-г ((! — 0,5) ?пе), и, = 15, и, = !6 Рм' !еел них ив'.: г1? ем е» 66 3 5 5 7 9 9 1О 12 20 24 24 34 43 46 58 14О 3,1 9,4 15,6 21,9 28,1 34.4 40,6 46.9 53,1 59,4 65,6 71,9 78,! 84,4 90,6 96,9 — 1,866 — 1,316 — О, 911 — 0,775 — 0,579 — 0,401 — 0,237 — 0,077 0,07? 0,237 0,401 0,579 0,775 0,911 1,316 1,866 0,4?7 0,699 0,699 О, 845 0,954 0,954 1, 000 1,079 1,301 1, 380 1, 380 1, 532 1,634 1,663 1,763 2,146 2 5 5 7 8 9 14 18 24 26 26 34 37 42 90 3,3 1О,О 16,7 23,3 30,0 36,7 43,3 50,0 56,7 63,3 70,0 76,7 83,3 90,0 96.7 — 1, 838 — 1,281 — 0,966 — 0,729 — 0,524 — 0,339 — О, 168 0.000 0,168 0,339 0,524 0,729 0,966 1,281 1,838 0,301 0,699 О, 699 0,845 0,903 0,954 1, 146 1,255 1,380 1,415 1,415 1,532 1,568 1,623 1,954 900 99' 90 95 70 50 50 Ю 95 90 70 50 м 70 Ь $2 20 00 00 00 Юз 2 50 0070 а7Ю000яазбз70 000 Рпс.
8. Времена реакции на дейстппе Ряс. 9. Логарнфм аремен реакннн на ядя группы и» 1б муа на нормальной дейстпне яда даун групп па Рб и бумаге 18 мух на нормальной бумаге и похоже„что этн точкн хорошо укладываются на логарифмическую крнвую види и=а+Ь!пу. Значения хм=1пум, Й=1, 2, 1= =1, 2, ..., а», также приведены в табл.
4, а на рнс. 9 нанесены точки (хеь Ф '(рм)), !=1, 2, ..., ль Графический анализ показывает, что наблюденные значения логарифма времен реакций, которые мы по условиям эксперимента считаем независимыми и одинаково распредсленпымн в пределах каждой выборки, могут рассматрнваться как наблюдения над нормальными сл.в. Основываясь на этих допущениях, применим изложенную выше теорию длн сравнения этих выборок с целью выяснения влняния разницы в длительности воздействия ядом на время реакцин. Выборочные средние н дисперсии равны х~ =1,219; ха= 1,179; 012=0,2080; 022 0„1930. Начнем с вопроса о значнмостн различия выборочных дисперсий.
Наблюденное значение статистики Е-критерия равно и е,=з-,'/52=1,08явхе,а(Риля)=10033, т. е, гипотеза п1»=а22 при любом а, чуть меньшем 0,5, должна быть принята. Итак, согласие наблюденных значеннй с предположением п1а=п22 очень хорошее, н мы принимаем эту гипотезу. Считая о~а=бее, проверим с помощью 2-крнтеряя гипотезу о ранепстве средних. Имеем х~ — х»=0040; 02=(150Р+1402')/29=02008; з )0! /16+ 1/15 = 0,02594. в первом опыте л1 16, а во втором ля=15. В табл. 4 приведены значения уг», й=1, 2, ! 1, 2, ..., лм — времена реакции в минутах в порядке возрастания (порядковые статистики), а также значения ри=(1 — 05)/л» н ии=Ф (рм), й=1, 2, 1=10 2, ..., лм с целью проверки данных на нормальность. Точка (уп, пп) отмечены на рнс.
8. Как вндно, завнснмость и от у далека от лннейной Наблюденное значение статистики 1-критерия равно И (,-~ф г $7л,+Т7,)-0040Ф О~Ы~94- = 0,040!0,161 = О 25 иа хо в(1ав) = 0 2557 и, следовательно, гипотеза и~в - рз принимается иа уровне значи- мости а<0,4, что также свидетельствует о хорошем согласии дан- ных с гипотезой. ГЛАВА»» ЛИНЕЙНАЯ СТАТИСТИЧЕСКАЯ МОДЕЛЬ й 9. ОцениВАние КОВФФициентОВ линеинОА мОдели !.
Введеиме. Модели, которые рассматрнвалнсь до снх пор, включалн предположение о независимости и одинаковой распределенности наблюдений. Для построения оценок функционалов от теоретической ф.р. или ее параметров, имеющих вероятностный смысл, мы обращались к з.ф.р. Если для оцеинваиня одной н той же величины оказывалось возможиыл» предложить более одной статистики, то предпочтение отдавалось той, распределение которой теснее сконцентрировано вокруг оцениваемой величины. Если оценка несмещенная, то мерой рассеивания служила ее дисперсия. Сравнение несмешениых оценок по величине нх дисперсий является одним из наиболее часто используемых в математической статистике критериев.
В некоторых статистических моделях оказывается возможным поставить н решить задачу нахождения наилучших по данному критерию оценок — оценок, имеющих минимальную дисперсию в классе всех несмещенных. В атом и следующем параграфах рассматривается более простая задача отыскания наилучших иесмещеииых оценок в классе линейных функций от наблюдений нлн от их порядковых статистик. 2. Примеры линейных моделей. П р н м е р 1.
Пусть Т= (Уь Уь ., Ул) независимая выборка нз А'(1», о») с неизвестными и н о. Представим наблюдения в форме У;=р+аеь»=1, ..., и, (1) где е; — независимые А»(0, 1)-распределеиные сл. в. Вводя л-мерные векторы-строки 1 (1, 1, ..., 1), е (вь ...,е,), запишем (1) в векторной форме У=1» 1+ив. (2) Поставим задачу отыскания линейной несмещенной оценки пара. метра р с минимальной дисперсией.
Пусть Ь (Ьь ..., Ь,) — числовой вектор, такой, что статистика 'пт"=Ь,У)+...+Ь„У„ (3) несмещенно оценивает 14 (знак транспонирования ' означает переход к вектору-столбцу): 14=М('пт') =Ь,МХ,+...+Ь„МХ.=(Ь,+...+Ь„))ь Отсюда следует, что вектор Ь должен удовлетворять условию Ь,+...+Ь.=1. Дисперсия оценки (3) равна 0(ЬУ') Ь,зОУ, +... + Ь„Ч)У„= (Ь11+...+ Ь„з) 01=15[Роз. Таким образом, оценка (3) будет наилучшей, если вектор Ь имеет наименьшую возможную длину, а сумма его координат равна 1. Хорошо известно, что таким вектором является Ь=л-'1, т.
е. наилучшая линейная несмещенная оценка р совпадает с выборочным средины л 1 1%ч р= — 1У'= — 3'У~ = У, л л (4) ~.5! 8,4 8,4 6,0 7,5 7,8 8,0 8,2 8,9 6,3 6,3 6,8 7;0 7,1 хт 39 33 80 11б 160 1бб 172 131 147 104 Предположим, что прибор осуществляет линейную связь между измеряемой велничиой х и показанием у, но что каждое измерение подвержено случайной ошибке; а ошибки от опыта к опыту не- 70 Подчеркнем следующее важное обстоятельство: при решении задачи отыскания наилучшей линейной несмещенной оценки были использованы лишь свойства моментов сл. вектора е: Мес=0„1=1, ..., л, [Ме,еь 1, 1=1, ..., л[=7, (5) где 7 — единичная матрица. Если выполнены соотношения (5), то рассуждения, приводящие к оценке (4), сохраняют свою силу н когда сл.в.
еь 1=1, ...., л, имеют произвольное совместное распределение вероятностей. Пример 2 [6[. В следующей таблице приведены результаты я=15 измерений влажности некоторого материала„проведенных для градуироваиня прибора. Значения х; — влажность в процентах, измеренная некоторым методом достаточно точно, так что можно сказать, что ошибка отсутствует, у; — показания прибора для материала с влажностью хь лоррелированы и имеют одинаковые дисперсии а'. Тогда для опи- сания рассматриваемого опыта можно предложить модель у!=О!+Отх!+аз!, !=1, ..., л, или т'=О!1+Отх+ае, где сл. вектор е подчиняется условию (5), а, О! и 8! — неизвестные параметры, х=(х!, хь ..., х„).
Пусть а (а!, ат) — произвольный числовой вектор. Будем искать линейную оценку ЬУ -Ь,У,+...+Ь„У., несмещенно оценивающую линейную комбинацию неизвестных параметров а,й,+а,й,=ай'. В частных случаях а=(1, 0) и а (О, 1) получим соответствующие оценки для О! и Оь По условию несмешенности л л МЫ =~'. Ь,ййУ,=Я Ь,(8,+8,,)= ! ! ! ! ч л = О! ~ Ь! + 8, ~г, Ь|х! ж 8!а! + О,а,, с-! каковы бы ии были 8! и Оь В таком случае а й Е Ь!=а,, Е Ьх =а, ! ! ! ! нли (Ь1', Ьх') -Ь [1', х'] = (а„аз). (6) Лпсперсия оценки Ьт" равна л л 0ЬУ, ~ Ь!1Н, ).," Ь'аз аз ~~ Ь!! с-! ! ! (7) 71 Таким образом, среди всех векторов, удовлетворяюших (6), надо найти тот, который имеет нанменьшу!о длину. Заметим, что если Ь вЂ” любой вектор, удовлетворяющий (6), то его проекция на и!пейное подпростраиство У, порожденное векторами 1, х, очевидно, также удовлетворяет (6), а длина проекции ие превосхоз!!т длины вектора. Поэтому при поиске вектора наименьшей длины, удовлетворяюшего (6), мы ничего не потеряем, если ограничимся лишь теми векторами Ь, которые лежат в подпространстве 1т Ь=с!1+стх.
(О) Подставляя (8) в условие несмещениости (6), получаем с»11'+ с»х!' = аь (9) с»1х'+ с,хх'=а». Определитель системы (9) равен и Я х;'. — (), х; ~' =- л !~!' (х; — х)' »-! »=1 »-! и отличен от нуля, если только хФ1, и в этол» случае существует единственный вектор Ь в форме (8), дающий несмещенную оценку, а следовательно, соответствующая оценка Ьт" имеет инни.