Дж. Тейлор - Введение в теорию ошибок (1108329), страница 34
Текст из файла (страница 34)
(8.!9) Например, можно ожидать, что высота у, которую пролетает падающее тело, квадратично зависит от времени П У вЂ” Ув+ М вЂ” ТФ где ув и пв — начальные высота и скорость, а а — ускорение свободного падения. Если дана совокупность наблюдений двух переменных, то можно определить наилучшие оценки постоянных А, В, ..., Н в (8.19) с помощью выкладок„которые производятся, как в равд. 8.2, что мы теперь и проделаем. Для упрощения предположим, что полипом (8.19) в действительности только квадратичный: у = А + Вх + Сх', (Заинтересованный читатель легко распространит доказательство на общий случай.) Предположим, как и прежде, что у нас есть серия измерений (хну;), 1= 1, ..., М, где у всех у~ одинаковые погрешности и все х~ точны.
Для каждого х; соответствующее истинное значение у~ дается (8.20), где параметры А, В и С пока неизвестны. Иы примем, что результаты измерений у; подчиняются нормальным распределениям, каждое с центром на соответствующем истинном значении и все с одной н той же шириной о„. Это позволяет представить вероятность получения наблюденных значений уь ..., ух в уже привычном виде: (8.21) Р (У~ ° ° ° Уу) где теперь х=7 х-~ (у; — А — Пх, — Сх';) (8. 22) 1=! у (Это соответствует выражению (8.5) в линейном случае.) Наилучшие оценки А, В и С вЂ” такие, для которых вероятность Р(уь ..., Уу) максимальна или величина у' минимальна.
Дифференцируя 7„' по А, В и С и приравнивая зтн производные нулю, мы получим три уравнения (которые вам следует проверить): АМ+В ~ х~+С 2,'х;= ~, уь А 2 х~ + В ~ х~ + С ~ х; = )' х~уь (8.23) А ~х~+В~ х)+С~ х1=~ х~уь слиироиеимаиия методом наименьших квадратов нн Для любого данного набора результатов измерений (хс,у;)' эта система уравнений для А, В и С (известная как система нормальных уравнений) может быть решена и, таким образом, могут быть найдены наилучшие оценки для А, В и С. С найденными таким путем значениями А, В, С выражение у = А + Вх+ Сх' называется полиномиальной аппроксимацией, полученной методом наименьших квадратов, или полиномиальной регрессией для данных результатов измерений. Метод полиномиальяой регрессии легко обобщается для полиномов любой степени, хотя получающиеся нормальные уравнения становятся очень громоздкими в случае полиномов высокой степени.
В принципе аналогичный метод может быть применен к любой функции у = 1(х), которая зависит от различных неизвестных параметров А, В .... К сожалению, получающиеся нормальные уравнения, которые определяют наилучшие оценки для А, В, ..., трудно, а порой н невозможно решить. Однако имеется один класс задач, которые всегда лсожно решить, а именно задачи, в которых функция у = 1(х) линейно зависит от параметров А, В, .... Этот класс включает все полиномы (очевидно, что полином (8.!9) линейно зависит от коэффициентов А, В ...), а также многие другие функции. Например, в случае некоторых задач у представляется суммой тригонометрических функций: у= Аз(пх+ В сок х.
(8.24) Для этой функции и фактически для любой функции, которая линейна относительно параметров А, В, ..., нормальныеуравнения, которые определчют наилучшие оценки для А, В ...,— это система линейных уравнений, которая всегда может быть решена (см. задачи 8.(2 и 8.!3). Экспоненциальные функции Одна из наиболее важных функций в физике — экспоненциальная функция у Аез', (8.25) где А и  — постоянные.
Интенсивность 1 излучения после прохождения расстояния х через защиту спадает экспоненциально: 1=1ае '"', где 1, — начальная интенсивность и р характеризует поглосцение в защите. Заряд на замкнутом через сопротивление конденсаторе спадает экспоненциально: г) ст е-лс 172 Глава 8 где !",1в — начальный заряд и Х = 1/(РС), а )с и С вЂ” сопротивление и емкость. Если постоянные А и В в (8.25) неизвестны, то естественно искать их оценки, основываясь на измерениях х и у. К сожалению, прямое применение изложенных выше методов приводит к таким уравнениям для А и В, которые не имеют простого решения. Однако можно преобразовать нелинейную связь (8.25) между у и х в линейное соотношение, к которому мы уже можем применить наш способ аппроксимации методом наименьших квадратов.
Достигнуть желаемой «линеаризации» можно, если просто взять логарифмы от обеих частей (8.25): !пу=!и А+ Вх. (8. 26) Мы видим, что, хотя у нелинейно зависит от х, !пу зависит линейно. Это преобразование нелинейного соотношения (8.25) в линейное (8.26) полезно во многих случаях помимо аппроксимации методом наименьших квадратов. Если бы мы захотели проверить соотношение (8.25) графически, то не смогли бы этого сделать, так как на обычном графике у от х получается кривая, которую трудно идентифицировать визуально.
С другой стороны, график зависимости !и у от х (или 1од у от х) — это прямая линия, которую легко можно идентифицировать. (Такой график особенно легко построить, если использовать «полулогарифмическую» миллиметровую бумагу, у которой деления на одной из осей расположены в соответствии со значениями логарифмов. Такая бумага позволяет строить графики 1оцу непосредственно, т.
е. даже не вычисляя значений логарифма переменной.) Польза в линейном представлении (8.26) для аппроксимации методом наименьших квадратов несомненна. Если мы полагаем, что у и х должны быть связаны зависимостью у = Ае'", то в новых переменных г =!и у и х должны быть связаны соотношением я =! п А + Вх.
(8.27) Если имеется серия измерений (хьу;), то для каждого у, мы можем вычислить г; = 1и уь Тогда точки (хь е,) должны лежать на линии (8.27). Эта линия может быть рассчитана методом наименьших квадратов, и таким образом будут получены наилучшие оценки для постоянных!пА (по которой мы можем найти А) и В. Пример Многие популяции (людей, бактерий, радиоактивных ядер и т. д.) изменяются со временем экспоненциально. Если ка- 173 Аппроксимация методом иаимеиыпих квадратов Таблица 8.2. Популяции бактерий лс-!п не Чяслепнасть папуляпяп НЕ Время Ер Лпп 11,94 11,83 11,76 153 000 137 000 128 000 кая-то популяция У уменьшается со временем экспоненциально, мы записываем У =- Уяе-"', (8.28) где т называется средним временем жизни популяции (которое тесно связано со временем полураепида 1„; действительно, 1,8 = О,б93т). Некоторый биолог считает, что популяция бактерий уменьшается со временем экспоненциально согласно (8.28); он измеряет численность популяции на каждый из трех последовательных дней и получает результаты, представленные в табл.
8.2. Какую наилучшую опенку среднего времени жизни т он получит на основании этих данныхр Если У изменяется согласно (8.28), то переменная г = !и У должна линейно зависеть от 1: г=!пУ=!пУ,— —. (8.29) Следовательно, наш биолог рассчитывает три числа еп = !и У; (1= О, 1, 2), приведенные в третьем столбце табл. 8.2. Используя эти три числа, он рассчитывает прямую линию (8.29) методом наименьших квадратов и получает следующие наилучшие оценки для коэффициентов 1пУо и ( — 1/т): !п У„=- 11,93 и ( — 1/т) = — 0,089 день '.
Из второго значения следует, что его наилучшая оценка для среднего времени жизни равна т=11,2 дней. Описанный выше метод привлекательно прост (особенно при наличии калькулятора, который автоматически выполняет операцию линейной регрессии) и часто используется. Тем не менее этот метод не вполне обоснован с логической точки зрения. Наш вывод аппроксимации прямой линией у = А + Вк методом наименьших квадратов основывался на допущении, что все измеренные значения уь ..., ун имеют одинаковые погрешности. В данном же случае мы реализуем эту аппроксимацию методом наименьших квадратов по отношению к пеРеменной г =!ну. Если все измеренные значения у, имеют Глава 8 174 одинаковую погрешность, то значения г; =1пу; — определенно не одинаковую.
Действительно, из простого расчета ошибок в случае косвенных измерений мы знаем, что ~йг1 в ~вд~ у у (8.30) Таким образом, если в„одинаковы для всех измерений, то в, отличаются (в, больше для меньших у). Очевидно, что переменная г = 1и у не удовлетворяет требованию, согласно которому погрешности должны быть одинаковы для всех результатов измерений, если переменная у удовлетворяет этому требованию.