Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 55
Текст из файла (страница 55)
Л именно (с(1 = и21 + ре + гс1 2— ХМ2 = = и, хв + и, у2 + я ае — Л'М2, где М вЂ” взвешенное среднее, составлсшюе из х, у и а с весами .п„п, и и;. 44 Я1ж+212и+Яе (17) ся Поэтому вместо (16) можно записать ~(1 = п, (х — М)' + и, (у — М)2 + п, (а — .М)2. (18) В теории наименьших квадратов к такому же выражению (18) приходят тогда, когда х, у и а представляют собой неравно- точные оценки для неизвестного параметра е. Так как х, у и а вычисляются по п„п, и вв наблюдениям соответственно, то их нужно снабдить весами я„п, и и, и вычислить взвешенное среднее (17).
Согласно теории наименьших квадратов, ввыборочная дисперсия одного наблюдения на единицу весав равна 221(к — М)1+ и (у — М)'+ и,(в — М)1 3 — 1 — 1 Знаменатель равен числу классов, уменьшенному на единицУ; следовательно, в случае г классов, в знаменателе должно стоять г — 1. г 88. Диенереионннй анализ Если предположить, что все три класса х, у и г имеют не только равные дисперсии, но также и равные средние значения, то, согласно теории наименьших квадратов, г~ ~—— где а — произвольное число.
Если 91 и 91 уже вычислены, то для получения оценок гз и гзз нУжно лишь 9, н Яе РазДелить на соответс1вУюЩее ечнсло сзепепей свободыес 91 ги =— е — 1 ' (21) Б. КРИТЕРИЙ Р Если величина г' меньше или лишь немногим больше величины гг, то нет оснований считать средние значения в классах различными. ОДнако если гз значительно пРевосхоДит ггг, то возникает будет являться несмещенной оценкой для общей дисперсии оз. Независимо от теории наименьших квадратов мы снова покажем, что оценка (19) является несмещенной, т.
е. покажем, что среднее значение Щ равно (г — 1) ог (в нашем случае зто среднее значение равно 2о'). Пусть 6 — общее среднее значение для х, у и г. Введением новых переменных х — о, у — о и г — Ю можно добиться, чтобы общее среднее значение стало равным нулю.
В атом случае средние значения х,', у,' и 4 будут равны о', а средние значения всех остальных произведений х; х, х, у и т. д. будут равны нулю. Так как при ортогональном преобразовании указанные свойства средних значений для квадратов и произведений сохраняются, то средние значения азы о)з, аг» и а', о', в' также равны сг'. Следовательно, среднее значение (15) равно 2о', что и требовалось доказать. С помощью (7) и (8) точно так же можно показать, что среднее значение г" ,равно 1г'.
Этот результат, разумеется, остается справедливым и в том случае, когда математические ожидания х, у и г различны, так как замена переменных х,'=х,— а, у,'=у — о, ги=.г„— с НЕ ОКаЗЫВаЕт ВЛИЯНИЯ На згг, Наиболее удобными формулами для вычисления 91 и Яз являются (18) и (7). Для контроля можно воспользоваться (13) или формулой 1,11 + Яе = Я =- Х~(Х вЂ” а)'+ ~(У вЂ” а)'+ + ~ч",(г — а)' — йг (М вЂ” а)и, (20) 300 )"л. ХЕ. Е)роверкп гипогпез с помощью статистических критериев подозрение, что эти истинныс средние значения различны. Чтобы исследовать, насколько это псдозренис является обоснованным, составим отношение (22) вв (" )) СЕв и применим критерий Ег.
Для того чтобы получить точную формулу для функции распределения отношения Р, нужно, конечно, воспользоваться предположением, согласно которому все хи уе и ав независимы и распределены одинаково нормалык). В этом случае а', о', и)' и и,, о„ и„ ...,и„, о„, и>„ будут также независимыми нормально распределенными случайными величинами с одинаковой дисперсией ае, так как плотность вероятности [Е.йв-в)* е Е:)в-е) ° + Е:(е-в)') Се при ортогональном преобразовании переменных переходит в плотность вероятности того же вида: вы — — ((и' — е) ьп)'Ч-ы' -)-тл+ и$+ гв+ ".в гы'„) (23) Следовательно, СЕл 6' + ь м <г' ов (24) подчиняется распределению Хв с Ел = 2 (в общем случае Ел = г — )) (25) степенями свободы, и точно так же ив+вы+ гсв+, .+и,',+о,',+т,', (2б) подчиняется распределению Хе с Ев = Л' — 3 (в общем случае Ев = лчг — г) степенями свободы.
Оба отноп)ения (24) и (26) независимы, так как плотность вероятности (23) представляет собой произведение двух ссмножи)елей, из которых первый зависит лишь от а', о', и', а второй — лишь от и,, о„..., исс Таким образом, Если все хо у и а независимы и риспределены одинаково нормально со средним значением 0 и дисперсией сев, то отношение (22) подчиняется распределению У. Следовательно, для проверки гипотезы о равенстве средних можно применить критерий Р. У)голо степеней .З 55.
дисперсионния онплпз 301 свободы в числителе и знаменателе равно г — 1 и дтг — т соответст ванно. В приложениях целесообразно составлять таблицу следующего вида: Сумма ( Число степеивеДРа- ~ иеи сиободм тои Оден, дисперсии !й=т — ! Дисперсия между классами ......,............. Дисперсия внутри клас- щт:ус= в! а Ят'!т = еа г2:(Х вЂ” !)= Ф сов ................... Дисперсия по всем наблкп лен ням я, + яе ят — д.е а ! с последующим сложением пх квадратов (аг —:, пг + п1 и ад + '- и.; "+ ала) в значительной степени выравнивает отклонения ог В. РАСПРЕДЕЛЕНИЯ, ОТЛИЧНЫЕ ОТ 1ЮРМА;1ЬНОго Можно ли применять критерий Р в том случае, когда распределение х, у и г отлично от нормальпогой При исследовании этого вопроса мы предположим, что в каждом классе количество величин п нс слишком мало, например, п ~ 4.
При этом предположении ~, = г — ! будет существенно меньше, чем уе = (и — 1) г. Отсюда следует, что отпосителыгая ошибка оцепки в,' подвержена значительно большим случайным колебаниям, чем относительная ошибка оценки аа. ПоэтомУ фУ1ициЯ РаспРеделениЯ отношениЯ Р' зависит главным образом от распределения числителя. Как видно из формул (!8) н (19), числитель отношения Г зависит лишь от тп у и г, которые предсзавляют собой выборочные средние значения, вычисленные по выборкам объема и ~ 4. Согласно центральпой предельной теореме, такие средние значения имеют приблимгешк1 нормальное распределение даже в том слу гае, когда распределения отдельных элементов этих выборок сильно отклоняются от нормального распределения.
Если теперь по х, у, а построить две линейные комбинации и' и ш' и сложить их квадраты, то последствия отклонения распределений х, д, а от нормального еще более сгладятся. Образование отношения (22) лишь незначительно ухудшит это приближение. При малых п обстановка будет несколько менее благоприятной. Однако даже в случае и = 2 образование сумм и разно- стей 302 Гл. Х1. Проверка гипотез с памаигью статистических критериее нормальности.
Конкретные числовые примеры демонстрируют это свойство значительно лучше, чем рассуждения на основе общей теории. Подводя итог, мы вправе сказать, что критерии Л' можно ггрименять даже в том случае, когди не известно, подчиняются результагпы надлюдений нормальному распределению или нет; при этом ошибка будет небольшой', Пример 40 (по книге йбанег В. А., ЯсвФ. !тась)г., 11 ес!. Ех.
38). г)ля зкспернментального определения точности подсчета бактерий в почве некоторый участок земли был разбит на четыре разные части, с каждой нз которых был произведен посев бактерий на семи пластинках. В результате на 28 пластинках были получены следующие количества колонии: Проба почвы Пластин. кв и ни ~ гт 69 67 66 64 62 58 54 426 461 60,9 65,9 Сумма Гредггсс 440 62,9 Для того чтобы провернтгн являются ли отклонения средних в четырех выборках чисто случайнымн нли нет, был прнлгснсн метод тисперснонного анализа, который дал слсдукнцис результаты: Сумма 1 Часто степе.
~ Оцспва квадратов нса свободы днсперснн Между классамн ...... ыг = 95, гг — -- 3 е, = 32 2 Внутри классов ...... Я =- 1446 72 = 24 еа =- 60 Все наблюдения ...... ~ г3 = 1541 ~ )чт — 1 =27~ еа = 57 Выборочная дисперсия ннутри классов здесь больше выборочной дисперсии между классамн, н уже нозтому различие выбора шых средних ' галя того, чтобы зто утверждение было верно, нужно, чтобы выборочные средине м, у, 2 были распределены приближенно нормально, а для этого в свою очередь достаточно, чтобы у одниаяоно распределенных результатов вабпю,гений существовала дисперсия. — Прим. перев 72 69 63 59 59 53 51 74 72 70 69 бб 58 52 78 74 70 58 58 56 450 64,3 а 58. Диглерсиинный анализ 303 незначимо: вычислить )г = 32(60 совсем не нужно.
Все 28 пластинок можно рассматривать как выборку нз однородной совокупности. Общее выбороч- ное среднее равно 63,5, а наилучшая оценка для дисперсии 1541 а' = — = 57,1. 27 Гели бы отдельные результаты наблюдений подчннялнсь распределению Пуассона с математичесним ощипанном 63,5, то истинная лисперсия равнялась бы он = 63,5 (з 10 А). Для того чтобы проверить, насколько это предположение согласуется с результатами наблюдений, вычислим отно- шение 27аз 1541 Хз =- — =- — =- 24,3.
ив 63,5 Волн бы результаты наблюдений были распределены нормально, то случайная величина дз подчинялась бы распределению )Г' с 27 степенями свободы. Распрелеленис Пуассона с большим математическим ожиданием 63,5 совсем незначительно отклоняется от соответствующего нормального распределения. Следовательно, в силу формул (9) и (10) нз 4 23, нужно ожндатгн что дв будет иметь срелнее значение 27 и квалратнчное отклонение '1'54 =- 7,4: )(з = 27 ~ 7,4. г. связь с кннтспивм Если имеется лишь деа ряда наблюдений, то азу = Щ = и, (х — М)з + пз (У вЂ” М)з = 1, 1+ з(У = — — (х — у)' и1ма а из+ из и аз 0з Д (з — и)'+ ~(р — у)' 2 )тг следовательно, (з — р)' ~1 1), 2 аг аа (27) Таким образом, отклонение найденного значения 24,3 от математического ожичання 27 следует признать случайным, и поэтому правдоподобное предположение о том, что результаты наблюдений подчиняются распределению Пуассона, экспериментом не опровергается.