Уидроу, Стирнз - Адаптивная обработка сигналов (1044225), страница 18
Текст из файла (страница 18)
Таким образом, в общем случае для метода Ньютона относительное среднее значение СКО меньше, поскольку 1/Лшап ~~ (1/Л)ср. (5.104) Рассмотрим следующий конкретный случай. Если собственные значения находятся в пределах от 1 до 10, то 1/Л щ=1, а (1/Л) „= =0,3. Поэтому относительное среднее значение СКО для метода наискорейшего спуска примерно в 3 раза больше, чем для метода Ньютона. В некоторых случаях при большем количестве собственных значений можно считать, что они равномерно распределены в интервале От Лш!и до Лшах. Тогда среднее значение 1/Л ! '), ~Л п(Лша,/Лш!о) (5 105) Лшах Лш!и а Л Лшах — Лш!и ш!и Если поло~~ть, что Лшаа=10Лш!и, то (1/Л)ар=0,26(1/Лш!.), и, следовательно„ относительное среднее значение СКО для метода наискорейшего спуска примерно в 4 раза больше, чем для метода Ньютона.
Аналогично этому при Л .„= 100Л ш это различие составляет 20 раз. Коэффициент, характеризующий относительную точность оценки параметра, и некоторые практические примеры Из уравнений (5.98) и (5.99) следует, что относительное среднее значение СКО обратно пропорционально относительному приращению Р. Поэтому может показаться, что увеличивая его, относительное среднее значение СКО можно сделать сколь угодно малым. Ниже показано, что неограниченное увеличение относительного приращения невозможно.
По определению относительное приращение является безразмерным параметром, отражающим степень влияния, которое оказывает неточность измерения компонентов градиента на СКО, Из равенства (5,16) следует, что относительное приращение представляет собой отклонение СКО, нормированное относительно ее минимального значения. Относительное приращение в большей степени аналогично относительному среднему значению СКО и фактически является его разновидностью, возникающей из-за измерения градиента адаптивной системы в автономном режиме.
По- 88 — + (5,106) Для обоих рассмотренных в этой главе методов с учетом (5.98) и (5.99) М = ( + ) Л'р( / )'р +Р для метода Ньютона, обш ВРТ око (и+ !) ()/токо)ср Р ля и Мобщ ВР (5, 107) (5. 108) наискорейшего спуска ОтМЕтИМ, ЧтО КаК (5.107), таК И (5.108) даЮт ЗНаЧЕНИЕ Мобщ и е Р+А!Р где А не является функцией Р.
Приравнивая нуению по пе„еменной Р, можно найти оптимальное значение Ро, мнним ру Ш ! имизи ующее Мобш. ля обоих случаев ! Ропт = А/Рост = Мобщ -1 опт - 2 общ. — М (5. 109) б а м, ассматриваемый коэффициент минимален, когда относительное приращение примерно рави е вести численный пример Предположим, что в нек р ном случае считают допустимым относи е р д ительное с еднее значение ошибки !0$, К оме того, предположим, что адаптивная система имеет адаптивный фильтр с десятью в и что все собственные значения матр т нцы К авны, поэтому отние значения ошибки для метода Ньютона н нанскорейшего спуска также равны.
тсюда оп ную времени адаптации находим нз соот- Р равно Очс, а постоянную ношения (Л+ !) Р ('О) + 0 05 0,1. Мобщ Врт ' В (0,05) тско око Следовате !ьно, Т„О=-5000 отсчетов (5.110) в емя сходимостн адаптивного процесса Если считать, что время авно п име но 4Тско, то пеРеходные пРоцессы, свкзанные с шем СКО 10$! такое количество данных тельным средним значением С , для адаптивной сисявляется слишком большим. Тем не менее, для аз фф щиент, характеризующий точность оценки параметра, для такой системы можно определить как сумму двух относительных средних значений ений СКО, одно из которых возникает из-за случайного отклонения, к онения, д„угое — из-за независимого неслучайного отклонения устано не я установившегося вектора весовых коэффициентов: темы в автономнолт режиме и заданного метода оценки градиента оно приводит к наилучшим достижимым результатам. Однако при проектировании системы с адаптивиымн свойствами существует, по крайней мере, одна возможность улучшения характеристик, Если позволяют условия, то можно добиться лучших характеристик, благодаря измерению градиента в дополнительной измерительной адаптивной системе, в которую можно вносить относительное приращение, не оказывая влияние на основную информационную адаптивную систему.
Схема, реализующая такой способ, представлена на рис. 5.5, а относительное среднее значение СКО определяется соотношением (5.98) для метода Ньютона и соотношением (5.99) для метода наискорейшего спуска. Рассмотренная выше система с десятью весовыми коэффициентами при относительном среднем значении СКО, равном 10$с, и относительном приращении 20с1с имеет постоянную времени адаптации, которую находим из соотношения М вЂ” 1+) — ( ) 01 6 ~~ско 3 (0,2) 7ско откуда Токо=625 отсчетов.
(5.111) В этом случае постоянная времени значительно меньше, но по- прежнему велика. Поскольку относительное приращение, вносимое в измерительную систему, не приводит к увеличению относительного среднего значения СКО информационной адаптивной системы, как это следует из рис. 5.5, то может показаться, что за счет произвольного увеличения относительного приращения можно достичь самой точной оценки градиента. Однако выбор очень большого значения Р приводит к нарушению условий, при которых соотношение (5.33) получено из (5.32). Этн условия состоят в том, что Вхслк ребуеммй ткекк Рнс.
5.5. Схема адаптации с измерительной адаптивной системой, предназначенной для уменьшения влияния относительного приращения, вносимого при оценке градиента. Здесь процесс оценивания градиента не сказывает влияния на выходной сигнал 90 значение Р мало, а вектор весовых коэффициентов системы после адаптации близок к оптимальному. Следовательно, выбор большого значения Р в конечном итоге приводит к увеличению относительного среднего значения СКО. Заканчивая рассуждения, связанные с практическими приложениями, можно упомянуть еще один способ повышения эффективности адаптивной системы на основе представленной на рнс.
5.5 структуры. Если возможно функционирование измерительной системы со скоростью, значительно превышающей скорость входного сигнала, то можно повторно вводить входные данные и для одних и тех же данных осуществлять на каждой итерации измерение всех компонентов вектора градиента. Хотя здесь не приводится анализ такой системы, можно показать, что в этом случае относительное среднее значение СКО растет пропорционально первой, а не второй степени числа весовых коэффициентов.
Еще одним способом, эквивалентным повторному вводу данных, является использование множества измерительных систем, каждая из которых предназначена для измерения одного компонента вектора градиента на каждой итерации. Упражнения 1. Объясните, почему формтлы !5.3) и (5.4) являются точными для квадратичных рабочих функций. 2.
Адаптивная система с одним весовым коэффициентом имеет рабочую функцию $ = бше — 20ш+23. Постройте график зависимости . сг ш п покажите на неч значения е„„к ш н Покажите также ошибку измерения у, возникающую при приращении весового коэффициента ш около значения ш=-25 с отклонением -+-6=-~-1, Чему равно значение ур 3. Возможно ли для квадратичной рабочей функции отрицательное значение ошибки измерения тй Почечуу Нарисуйте графнк рабочей функции с отрицательной ошибкой измерения 4. Каково значение относительного приращения для системы |ы упражнения 22 5.
Предположим, что имеется линейный сумматор с одним входом, рабочая функция которого "- =2гсеа+2ше,+2ше"3 — ! 4ше — 16ш,+42 а входной сигнал х является случайным стационарным процессом. Для отсчетов входного сигнала Е[хехл].- 2 и В [ел.тл ,] = 1. Чему равно Р, если отклонение весового коэффициента 67 6. Предположим, что в адаптивный линейный сумматор с одним плодом добавлен одни весовой коэффициент. Как и общем случае зто повлияет па Рэ 7 Прелположим, что ошибка ге является случайшей величиной, равномерно распределенной в интервале от 1 до 3.
Чему равен в этом случае четвертый момент аер 91 8. Предположим, что вь имеет норизльное распределение с такиин же средним значением и дисперсией, как в упражнении 7. Найдите четвертый момент а,. 9. Ошибка имеет нормальное распределение с нулевым средины знзчениеи и дисперсией, равной 3. Какова дисперсия оценки среднеквадратической ошибки, если эта оценка производится по десяти независимым отсчетам сигнала ошибки? 10. Покажите, используя равенство (5.25), что для нормально распределенной ошибки ед с ненулевым средним значением параметр К несколько мень.
ше 2. !!. Выведите формулы и неравенства, приведенные в табл. 5.1. 12. Каковы должны быть отношения а,/и для граничных значений параметра К=О и К=2 при нормальном распределении (см, табл. 5.1)? !3. Какое отношение а,/и соответствует верхней границе параметра К для каждого из трех (треугольного, равномерного и дискретного) распределений, представленных в табл. 5.1? 14. Предположим, что при условиях упражнения 2 оценка градиента осуществляется по пяти наблюдениям сигнала ошибки при каждом значении весового коэффициента с приращением. Какова дисперсия оценки градиента, если ошибка ь< распределена по нормальному закону? 15. Положим, что прн условиях упражнения 5 оценка градиента осуществляется по 50 наблюдениям сигнала ошибки при каждом значении весового коэффициента с приращением.
Найдите ковариациоиную матрацу оценки градиента при нормальном распределении ошибки ею 1б. Заданы временные последовательности х< и ую которые равны нулю при отрицательных значениях я и связаны соотношением х< =пхь-<+бум Пользуясь методом индукции, найдите выражение для хм не содержащее рекурсивного соотношения. 17. Чему равна дисперсия весового коэффициента и в смещенной системе координат для системы, в которой используется метод Ньютона? Что изменится, если перейти к методу наискорейшего спуска? 18.