Дж. Тейлор - Введение в теорию ошибок (1108329), страница 32
Текст из файла (страница 32)
7.2). а. Дза измерения скорости звука и дают результаты 334-~-1 н 336-~-2 (оба з м/с). Считаете ли аы зти измерения непротпноречиаыми? Если да, то вычислите наилучшую оценку для и и ее погрешность. я. Повторите задание «а» для результатов 334 ш 1 и 338 ~ 5.
Стоит ли использовать и расчстак второй реаультат? »7.2 (разд. 7.2). Даа студента измеряют сопротивление различными методами. Каждый делает по десять измерений и аычисляет среднее и его стандартное отклонение и получает студент А: /? = 72 ~ 8 Ом, студент Бс /? = 78 ~ 5 Ом. Взвешенные средние 159 а. Рассматривая оба измерения, найдите, чему равны наалучшая оценка )г и ее погрешность. б, Оцените приблизительно, сколько измеРений должен сделать студент А (используя свой метод измерений), чтобы вес его результата был бы такой же, как и у студента Б.
7.3 (равд. 7.2). Найдите наилучшую оценку и ее погрешность, основаннгяе на следующих четырех измерениях одной н той же величины: 14 ь 0,5; 1,2 ~ 0,2; 1,0-ь 0,25; 1,3~ 0,2 7.4(равд. 7.2). Предположим, что все Ж измерений одной и той же величины х имеют одинаковую погрешность. Покал<ите четко, что в атом случае взвешенное среднее (7.10) сводится к обычному среднему значению, нли среднему, х = (Ч~~~ хг)1'Аг, и что выражение (7.12) для погреш. ности сводится к знакомому стандартному отклонени|о среднего. *7.5 (равд. 7.2).
Если даны результаты гр измерений х,, хх одной и той же величины х с погрешностями оь ..., пл, то наилучшая оценка дчя х определяется выражением (7.10), как х„„,л =(~ шгхг)/(~~~ шг), где веса шг = 1/ог. Это выражение определяет х„.„как функцию хь ., хю Используя формулу (3.47) для расчета ошибок в косвенных измерениях, покажите, что погрешность в х„„, дается (7.12) как ...=(Х"'1) " Глава 8 Аппроксимация методом наименьших квадратов Наше обсуждение статистической обработки данных до сих пор было сосредоточено исключительно на многократных измерениях одной и той же величины не потому, что такой анализ многократных измерений одной величины является наиболее важной задачей статистики, а потому, что эта простая задача должна быть хорошо понята, прежде чем мы сможем перейтн к более общим проблемам.
Теперь мы наконец обсудим нашу первую, очень важную более общую проблему. 8.1. Данные, которые должны ложиться на прямую линию Один из наиболее общих и интересных типов экспериментов состоит в измерении нескольких значений двух различных физических переменных для исследования математической связи этих двух переменных'). Например, можно бросать камень с разных высот Иь ...„ йн и измерять соответствующие времена падения ~ь ..., 1и, чтобы проверить, связаны ли эти значения высот и времен ожидаемым соотношением й = '/здР. Вероятно, наиболее важными экспериментами такого типа являются те, где ожидаемая связь линейно, как это реализуется в случае, который мы рассмотрим первым. Например, если мы допускаем, что тело падает с постоянным ускорением свободного падения д, то его скорость о должна быть линейной функцией времени П о=ве+а1 В общем случае мы будем рассматривать любые две физические переменные х и у, которые, как мы считаем, связаны ') В литературе на русском языке такие измерения двух или более разных величин принято называть совместными.
— Прим. перев. Аппроксимапия методом наименьших квадратов 18! линейной зависимостью вида д=А+Вх, (8.1) где А и  — постояннные. К сожалению, для линейной зависимости используется много разных обозначений; остерегайтесь спутать (8.1) со столь же часто встречающейся записью у= ах+Ь. Если две переменные у н х связаны линейной зависимостью вида (8.1), то график у от х должен быть прямой линией с наклоном В, которая пересекает ось у в точке у = А. Если бы мы измерили )т' различных значений хь ..., х„и соответствующих значений уь ..., дх и если бы результаты наших измерений не содержали погрешностей, то каждая точка (хну;) легла бы точно на линию у = А+ Вх, как показано на рнс. 8.1, а. На практике же всегда имеются погрешности, и большее, что мы можем ожидать,— это то, что расстояние каждой точки (хну;) от линии должно быть сравнимо в разумных пределах с погрешностями, как показано на рис.
8.1, б. При выполнении ряда измерений описанного типа возникают два вопроса. Во-первых, если мы примем как факт, что у и х действительно связаны линейно, то придем к интересной задаче определения прямой линии у = А+ Вх, которая наилучшим образом аппроксимирует результаты измерений, т, е. к задаче определения наилучших оценок постоянных А н В, основанных на данных (хь у|), ..., (хх, ух). Эта задача может быть решена графически, как кратко рассматривалось в равд. 2.6.
Ее можно решать также аналитически при помощи метода максимального правдоподобия. Этот аналитический Рис. 81. а — если две переменные у и х связаны линейной зависимостью, как в формуле (8.1), и если нет экспериментальных погрешностей, то измеренные точки (хь у,) точно лягут на линию у = А+ Вх. б — на практике всегда имеются погрешности которые можно изобразить черточками ошибок, и точки (хь уб в этом случае, как следует ожидать, будут располагаться на разумно близких расстояниях от линии. В данном случае показано, что только значения у подвержены влиянию заметных погрешностей. 162 Глава 8 метод определения наилучшей прямой линии, которая аппраксимирует серию экспериментальных точек, называется линейной регрессией или аппроксимаиией прямой методом наименьших квадратов и является главной темой этой главы.
Второй вопрос, который можно задать,— это действительно ли измеренные значения (хи у1), ..., (хю ух) оправдывают наши ожидания, что функция у линейна по х. Сначала мы можем определить линию, которая наилучшим образом аппроксимирует данные, но затем мы должны предложить некоторую меру, которая показала бы, насколько хорошо эта линия аппраксимирует данные. Этот вопрос мы рассмотрим в гл.
9. 8.2. Расчет постоянных А и В Вернемся теперь к задаче определения наилучшей прямой линии у = А+ Вх, аппроксимирующей набор эксперимен. тальных точек (хи у1), ..., (хш ух). Для упрощения будем предполагать, что, хотя результаты наших измерений х и у содержат некоторые погрешности, погрешность в измерениях х пренебрежимо мала. Это — разумное допущение, так как погрешности в одной переменной часто намного больше, чем погрешности в другой, которые мы, следовательно, можем без всякого опасения игнорировать. Далее мы будем предполагать, что все погрешности в у одинаковы по величине. (Это также разумное допущение для многих экспериментов, но если погрешности различны, то наше рассмотрение может быть обобщено с помощью соответствующего учета весов этих измерений; см.
задачу 8А). Если говорить точнее, мы предположим, что результат измерения каждого у~ подчиняется распределению Гаусса с одинаковой шириной о„во всех измерениях. Зная постоянные А и В, мы могли бы для любого данного значения х; (которое, по нашим предположениям, не содержит погрешности) вычислить истинное значение соответствующей величнны у,: (истинное значение у;) = А+ Вхь (8. 2) Результат измерения у, подчиняется нормальному распределению с центром на истинном значении и с шириной о„.
Сле довательно, вероятность получения значения у~ равна (8.3) ое где нижние индексы А и В указывают, что эта вероятность зависит от (неизвестных) значений А и В. Вероятность полу. йппроксвмапвя методом вавмевьшвя квадратов !63 чения всего набора результатов измерений у!, ..., Ув равна произведению Рл.в (У!ю ' УФ) Рл,в(у!) ' ' ' ' ' Рл,в(ум) — е- х'а, ! (8.4) ов у где показатель дается формулой и (у! — А — дх8! о ! ! а Теперь уже нам известно, что наилучшие оценки для неизвестных постоянных А и В, основанные на данных измерениях,— это такие значения А и В, для которых вероятность Рл, а(у!, ..., Ув) максимальна или для которых сумма квадратов уа (8.5) минимальна (вот почему этот метод известен как аппроксимация методом наименьших квадратов).
Чтобы найти эти значения, продиффереицируем уа по А и В и приравняем эти производные нулю: я дл ( %д) ) (у, — А — Вх,)=0, (8.6) ! ! (8.5) дх! + = ( — 2о'„) ~~~ х, (у! — А — Вх,) = О. (8.7) Эти два выражения можно переписать как систему уравнений для А иВ: А!т'+ В ~ х, = ~, у! (8.8) (8.10) н(Х !у!)-(Х')(Еу!) л (8.11) А ') х, + В )' х', = ~' х,.у! (8.9) (В дальнейшем мы опускаем границы суммирования от !'= 1 до М у знака суммирования ~.)Эти два уравнения, известные как нормальные уравнения, легко решаются и дают оценки х!етода наименьших квадратов для постоянных А и В: Глава 8 где мы использовали принятое обозначение (8.12) Формулы (8.10) и (8.11) дают наилучшие оценки постоянных А и В для прямой линии у = А + Вх, основанные на измеренных точках (хь у1), ..., (хн,ун). Получившаяся линия называется линией аппроксимации л1етодом наименьших квадратов этих данных, нли линией регрессии у от х.