Амосов А.А., Дубинский В.А., Копченова Н.В. Вычислительные методы для инженеров (1994) (1095853), страница 66
Текст из файла (страница 66)
Покажем, что эти ошибки имеют нулевое математическое ожидание. Действительно, из формулы (11.110) следует, что — (Г- Р е, Р е) = (РГ- Р а е). 1 1 и+ 1 ' и+ 1 Из определения операции умножения матриц следует, что элемент д; матрицы А = РГ Р' имеет вид а(~ — Е Е р((у(~, р~)~, где у~г~ -1 ( -1) т ( -1) 1*0 1*0 )т элементы матрицы Г 1, р~),. — элементы матрицы Р'. Поэтому и п 1 и М ~~г] — Е Е д((М Уе,.
е] — Е д,,, г и+1 (*о ~.о и+1 (=о " т ( -1) 1 ( -1) )Я+ 1 =.— Е Е (Е р~),.рц)у(), вг — Е Е у),)у,, -(тг — (тг и+1 1=0)=О (=О +11=0)=0 и+1 и Здесь у),1 = Е р~„.рп — элементы матрицы Г. 1нг )=О 3 а м е ч а н и е 1. Величина М (рг] представляет собой среднее по точкам 2( значение ДиспеРсии слУчайной ошибки ЬФп(2(). Из теоремы 11.12 следует, что М ~рг] ~ О при и ~ оо, т. е, при неограниченном росте числа наблюдений среднее значение дисперсии ошибки стремится к нулю.
3 а м е ч а н и е 2. Равенство (11.111) подтверждает представление о том, что статистические свойства метода наименьших квадратов проявляются при п > и), т. е. тогда, когда число наблюдений много больше числа параметров модели. Введем обозначения Б„= в (ФД, у), 4 = в (ФД, до), 4, = б (ФД, 1(о). Заметим, что величина д представляет собой среднеквадратичное уклонение многочлена наилучшего среднеквадратичного приближения мерой погрешности. Вычислим математические ожидания величин бт) и 2 д2 Т е о р е м а 11.13.
Справедливы равенства (,0)2+ ~+1,, МД (во)г+ и — ~ и(-1 (11.112) (11.113) Ф$ (построенного по вектору у исходных данных, содержащих случайные ошибки) от вектора но точных значений функции )"; которую мы и пытаемся оценить. Именно эту величину следует считать "истинной" а В силу леммы 11.1 имеет место равенство 8 (в у~) — о (ао «о) + ~ р~е~г которое в принятых выше обозначениях примет вид 4 = (б~а)г + рг. Вычислив математическое ожидание и использовав теорему 11.12, получим равенство (11,112). Заметим теперь, что в силу леммы 11.1 о (ао, «) = в (а, «) + ] РЬ а1г.
Преобразуем левую часть зтого равенства: а(ао «) — )(рао «о) + нгг — ~рво «о~г+ 2(рр «о з) + ]н~г Таким образом, ~г 1 ( ) (~о)г+ 1 ~ер г+ 2 (р о о Учитывая, что М (Иг] = Е И [4 = (в+ ц ~г И ~г] = '" + ',г ~-о и + 1 М~ЦР — «о, е)] = (Р — «о, М (е]) = О, получим равенство (11.113). ° О выборе степени обобщенного ыногочлеыа. Пусть функцию 'можно аппроксимировать с достаточно высокой точностью е обобщенным многочленом Ф (г) = Е а~у~(х) некоторой степени т. Если зта а=о степень заранее не известна, то возникает проблема выбора оптималь- ной степени аппроксимирующего многочлена Ф4 в условиях, когда исходные данные у, содержат случайные ошибки е,.
Пусть уо, р1, ..., р„— фиксированный набор базисных функций, линейно независимых в точках во, в1, ..., в„. Предположим, что а > ~в, а ошибки а, удовлетворяют условиям (11.105), (11.106). Будем решать задачу наименьших квадратов для пз = О, 1, 2, ..., постепенно увеличивая число параметров модели. Отметим, что значения среднеквадратичных уклонений бв и б„должны с ростом т убывать. Действительо но, множество всех многочленов Ф„~1 степени ш + 1 включает в себя множество всех многочленов степени Фв и позтому да,1 — ш1п о (Ф®,1, «) ~ ш1п 6 (Ф„„«) = Ьв, т > О, Ф Фа Ь,',„, = ш1п 6 (Ф„„, «о) ~ ш1п 6 (Ф„, «') = 4, т > О.
Фа+1 Фщ Заметим также, что в силу теоремы 11.13 и закона больших чисел (при и Ъ 1) справедливы следующие приближенные равенства: ~г — ~ (Ф У )г в (~о)г + а+ 1 ~12 ~ (ф~ уО)2 ц (~0)2 + пг (11.114) (11.115) Как нетрудно видеть, с ростом т первое слагаемое в правой части равенства (11.115) убывает, а второе возрастает. Поэтому следует ожидать, что величина 4„(именно она и характеризует уклонение вычис- ляемого многочлена Фй от функции Я с ростом т должна сначала убывать, а затем, достигнув своего минимума при некотором ш = ягой, начать возрастать. Итак, существует оптимальная (в смысле критерия 4,) степень аппроксимации то. Однако несмотря на то, что увеличивая т, можно получать все лучшее соответствие многочлена Ф~4 с экспериментальными данными, следует иметь в виду, что начиная с ~л = те, многочлен будет все хуже соответствовать приближаемой функции. Выбор оптимальной степени пго не представлял бы труда, если бы значения 4„можно было вычислять.
Однако в действительности прямому вычислению поддаются только значения среднеквадратичного уклонения 1~, анализируя которые мы и должны выбрать степень многочлена. Предположим, что дисперсия ~г (или ее оценка) случайных ошибок я; известна. Пусть также известно, что для некоторого значения вг < в возможно приближение, для которого б~ < е. Тогда, начиная с этого о значения тл, согласно формуле (11.114) с учетом того, что ю 1, будет иметь место приближенное равенство (11.116) Таким образом, за оптимальное значение степени многочлена следует принять то значение ш, при котором впервые будет выполнено приближенное равенство (11.116).
При имеющейся информации лучший . выбор вряд ли возможен. Пусть теперь значение сг дисперсии ошибок к, нам не известно. Зато известно, что функция ~ либо представляет собой обобщенный многочлен Ф„некоторой степени иао (и тогда б~ = со —— О для всех о 354 ти 1 тио), либо же, начиная с некоторого ти = тио, увеличение степени многочлена в широком диапозоне значений тио ~ ти ~ ти1 практически не влияет на качество приближения (т. е.
би и се = сопа1 для всех о тио ~ ти ~ ти1). Согласно формуле (11.114) справедливо приближенное равенство (11.117) и — т и — ти При ти 1 тио величина, стоящая в правой части этого равенства, приби+1г лиженно равна сс + Ф и не убываег по ит. Это наблюдение и — ти позволяет использовать в рассматриваемой ситуации следующее практическое правило выбора: за оптимальное значение степени многочле- на следует принять то значение ти, начиная с которого величина еи г стабилизируется или начинает возрастать. Пример 11.16. Найдем оптимальную степень алгебраического многочлена для аппроксимации функции, заданной табл.
11.13. Заметим, что фактически оптимальная степень ти = 1 уже была найдена при решении примера 11.16. Основанием для такого вывода послужило сравнение среднеквадратичных уклонений б1 и 0.0486 и 6г и 0.0481 с оценкой уровня "шума" таблицы — грубый аналог критерия (11.116). Попробуем получить тот же вывод, используя значения величин (11.117). 10 г Найдем дополнительно Р~(х) = 0.425 и бо и 0,162. Тогда сто~ = — 6е и 0.292, 9 ~т~~ = — 6т и 0.00295, сг —— — бг и 0.00381.
Так как о3 > тт~~ и <т1 < одг, то за 10 г г 10 г г 8 ' ' 7 оптимальное значение степени следует принять ти = 1. 6. Нелинейная задача наивтеньших квадратов. Часто из физических или каких-либо других соображений следует, что зависимость у = ~(х) между величинами у и г должна хорошо описываться моделью вида у = у (г, а), где функция у (г, а) = у (х, ао, ап ..., а,„) нелинейно зависит от параметров ас, а1> ..., а„. Пусть функция у = 1" (г) задана таблицей значений у; = ~(в1), 1 = О, 1, ..., и, где и > т.
Тогда применение критерия наименьших квадратов приводит к задаче определения искомых параметров ао, а1, ..., а„из условия минимума функции а (и, 1т) = Е (д (х,, а) — у;)г. ~ о Нелинейная задача наименьших квадратов (особенно при большом числе параметров) весьма трудна для решения. Обычно для вычисления параметров а применяются специальные методы минимизации [32]. В некоторых весьма специальных случаях решение нелинейной задачи наименьших квадратов можно свести к решению линейной задачи.
Пусть, например, зависимость у от х ищется в виде у = аевх, где а > О. Логарифмируя зто равенство, приходим к линейной зависимости 1п у = 1п а + $х величины У = 1п у от х. Теперь по таблице значений У; = 1п у; (~ = О, 1, ..., п) можно легко определить значения 1п а и 6. Подчеркнем все же, что найденные таким образом значения параметров а и в отличаются от тех значений, которые могут быть и ох.