Налимов В.В. - Теория эксперимента, страница 14
Описание файла
DJVU-файл из архива "Налимов В.В. - Теория эксперимента", который расположен в категории "". Всё это находится в предмете "техника эксперимента в электронике и наноэлектронике" из 6 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "техника эксперимента в электронике и наноэлектронике" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 14 - страница
и е! БОнцепция гедукцпп (гвегткил ипсоогмкции М средлео. Колл мы будем оценивать центр рассеянил, пользуясь какой-нибудь неэффектпвиоп оценкой, скажем, медианой, то прп достаточно болыпой выборке отношение дисперсий для двух оценок будет близко к 2(я = 0,637. Это означает, что если мы хотим получкть оценки с одпяаковой дпсперсвей. то, иримевяв среднее арнфмгэическоо, нужно воспользоваться лшпл 64ейе от того числа наблюдений, которое требуется прп оцевке центра рассеяния по медиане.
Экспорвментатору обычно удобнее оценивать рассеяние не дисперсией, а квадратичвой ошибкой, нмесощей ту же»азмерность, что и сами язморепня. Прп таком подходе оценка целлгра рассеяния по среднему потребует 60«й наблсоденлй от того их числа, котороо пу иво сделать крп оцевко по лседиане. Мы видим, по вынгрыпл от применения эффективных оценок оказьсвается сравнвтельно небольшим.
Значительно больший выигрыш можно получить, используя, скажем, приемы многофакторного эксперимента — здесь, прв большом чвсле независимых перомениых, можно улучшить отвошенпе дисперсий в нескояько раз (подробное об отом см. стр. 66). На последнее обстоятельство обратпл в~лпмаиие еще Фишер (37) в своей последней, посмертно опубликованиоп статье. Он сам дал сравпитею,- пую оценку отвосжгельной аффективвостп тех двух ириомов, которые он ввел в математисескуло статистику. здось Р (у, О) .. фувквпя правдоподобия, оврелеленвая выше на стр йй где в запись по вводился параметр О. Практпчесюл удобнее решать уравнение а)п Р рп 6) =0 66 (максимумы ф) пкцкй Р (у.
О) и )и Р (у, О) совпадасол). Метод максимального правдоподобия всегда приводит к состолтельным, хохл иногда п смещенным оценкам, распределеплым аспмлтоткческп нормально п влсщощим наимоньшуло возможную дисперсию по сравиеппкс с другпмп, такдсе аспмптотячески нормальнлэмп оценками. Для норлсально распределенной случайной величкяы метод максимального правдоподобия праводвт к сяедующим оценкам: среднему арифметическому )( длв первого парамотра (це~тра рассеяния) л дисперсии, определяемой по формуле с'(з) = --- 7 рс. — У)з в 1--1 для параметра масштабности. Первая из этих оценок оказывается песмещенной, вторая — немного смесцеппой.
П статистике предпочслтают пользоваться несколько мевес зффгктввиой, ло песмещеинол оценкой дисперсии Посмотря на небольшой практпчеслсий пынгрьпп, концепция эффективности в сочотанин с поннтиями состоятельности и несмещенности стала той логической основой, на которой начала развиваться математическая статистика.
Здось, правда, прин(лось столкпутьсл с целым родом трудностей. Оказалось, что далеко не всегда можно построить оценки одновременно состоятельные и несмещепные. С такой неприятностью, в частности, прсиплось встротитьгл при оценке спектральной плотпости. Зта оценка оказалась несостоятелсьной, т. е. опа не уто сплетен с ростом числа нябл(одепий, Здесь создалась ситуация, напоминающая принцип неопределенности Гойзенберга в физике.
Оказалось, что оценку можно сделать состоятельной, осли отказатьсл от гребованив ее несмещеиности, причем эффективность оценки становится тем луч(не, чем больше смещение, т, о. систоматичоская ошибка, вводимая при вычислениях (подробнее сб этом см. На стр. 11(:).
Вторая трудность возникла в связи с том, что эффективность оценок, лак оказалось, очень чувствительна к пару(лепили исходной предпосылки — нормальности распределения. ХХо оценкам, с которо(мп соглашается Тычки (38), экспериментальные данные содержат до 10«ссо аномальных значений. Практически разумно полагать, что мы чаще всего имеем дело со смешанными распредолепиями, задаваемыми суммой по крайней мере двух функций распределения с несколько различалощимнся параметрами. Такие «загрязненные» выборки мопспо задави(го ссшжем, моделяэпл типа 0,0(1" ((с; а') + 0,1 у' (р .— ),а; сгз) н т. д.
Моделирование поведения выборок подобного типа на ЗВМ позволило полсазать, что центр рассеяппл лучлпо оценивать по медиане, а пе по с'родному арифмотическому, осли мы имеем де.то с сильно загрязнепной выборкой. Выло устапов,дено такгке, что загрязнение меньше влияет на оценку рассеянич по размаху варьмрованлщ, чем на оценку дисперсии, хотя ранее, ис:содл из традициоияого ионн- мания эффекпгвности, всегда рекомендовалось оценивать дисперсии. Можно, копечпо, «о лишать» загрлзпопяые выборки, отбрасывая с помощью того 1(лп гпого критерия грубые (аномальные) наблгодения. )Хо эта проц дура также ведет к пониясенпю эффективности — ведь при .о;ится отбрасывать до 10",е набл(одений, а иногда, вероятно, н 62 мктодологи 1еские концянции ГГЛ. 11 значительно болыпе.
1(рогш того, эпсперимеггтатор далеко пе всегда согласится с такой процедурой усечения выборок — неродко может представлпться вполне естественным иметь дело со смегпанньпг распределением. Подробнее затронутые здесь вопросы рассмотрены в обзорах (39, 40!. Наконец, третья трудность связана с тем, что оценке параметров часто должен предгпествовать статистический анализ данных, прп выполнении которого мы сталкиваемся с проблемой чувствительности критериев анализа к нарушению исходных продпосылок.
Допустим, например, гго исслодователь получил ряд выборочных дисперсий 2 2 з„зм..., з„. Прегкде чем приступить к вьгчислениго сводной (усредненной) дисперсии, нужно проверить гипотезу о том, что выборочные дисперсии однородны, т. е, подсчитаны по выборкам, взятым из одной и той же генеральной совокупности. Такуго проверку обычно рекомендугот делать по критерию 1(ггхрона или (если выоорки разного обьема) по критергпо Бартлета. Но критерий Бартлста крайне чувствителен к нарушеннго нормальности распределения.
Самым удивительным здесь оказывается то, что для некоторых типов распределений расхождение становится тем больше, чем болыио выборка. С ростом числа наб.подений действительное значение вероятности, связанное с каким-то заданным ненормальным распределогплем, стремится к некоторой фиксированной величине, зависящей только от значения эксцесса ') 72 1'.слп перейти от нормального распределения („ == 0) ь распределениям с,, =- — 1 и,з= 2,то 5-прог)ентный уровень значимости сиещаетсп до величин, соответственно раиных 0,56- и 16,6-процентному, прн числе наблюдений п выборке и: — — 2. При числе наблюдений п = 20 для тех жо днух значений 72 5-процентный уровень становится равным 0,0004- и 71,8-процеитному соответственно.
Вместе с тем, есть критерии, очень мало чувствительные к наругпению нормальности. Так, с'-критеригг (отногпение дисперсий) оказываетсп совсем нечувствительным к нарупгепиго нормальности цри сравнении межгрупповой дисперсии ') Вапомнпм здесь, что эксцесс определяется соотношением у — -- ра/о4 -- 3, где |44 — чотзортый момент. г з] концепция Рвдукцшг гсвегткги инФОРИАции 66 с внутрнгругшовой. Если, например, перейти от нормального распределения с асимметрией ') ~'г =-.
0 и эксцессом 72 = О к РаспРоделегыпо с 71 = 2 и 72 = 2, то 5-пРоцентпый уровень зпачимостп превр;ыигся лишь в 4,72-процентный, если измерения были сдолаггы соответственно с 4 и 20 степенями свободы. Во многих руководствах по матоматическоп статистике даются слодующие рекомендации при проведения диспорсиоппого анализа: сначала проверить по крмтерглго Бартлота гипотезу однородности дисперсий и лишь затеи обратиться к Г-критерию, Один из статистиков остроумно замечает, что такая рекомендацич папоминаот поведение капитана, который, прежде чем выводптг лайнер из бухты, поехал бы в ш:пошге в океан проверить состояние погодьг. Интересные данные о чувствительности статистических критериев к нарупгениго нормальности приводепы в рабоге (34), откуда мы и заимствовали два приводенных выше примера. Здесь следовало бы заметить, что исследователь практически никогда не приоегает к оценке степени отклонения от нормальности путем вычисления асимметрии и эксцесса.
Нуягно учитывачгч что оцешга этих волишн, основанная на вычислении третьего и четвертого момонгов, сопряжена с болыпиьги ошибками. Чтобы оценить надежным образом иаменение гг и „на одну-две единицы, надо располагать уже сотней или сотнями паблюдопий. И все же исследователь всегда должен иметь четкое представление о чувствительности используемых критериев и исходпьнг предпосылкам. Нужно отметить, что все сущестпующие сейчас руководства по мпгсматической статистике написаны несколько догматично — в пнх, как правило, приводятся реьомендации, не у штывающие чувствительность 2) статистических процедур к нарушениягг исходных предпосьглок, хотч в журнальных публикациях зти вопросы обстоятельно обсуждаютсп, причем обычно приводятся многочисленные результаты моделирования на ЭВ|И поведения различных ') ггсггьгзгетРггп опРсДолоотсп соогношзнном У, =.