Джакония В.Е., Гоголь А.А., Друзин Я.В. Телевидение (4-е издание, 2007) (1143036), страница 24
Текст из файла (страница 24)
Предсказа- 104 т4АСТВ В Физические основы телевидения тель, таким образом, представляет собой задержку на время кадра отсчетов, воспроизводимых на приемном конце системы. Первый кадр рассмотренной преобразуемой последовательности кадров называется опормыяк Из него устранена только пространственная избыточность. По сравнени1о с ним последующие кадры компрессированы зпачнтслыю сильнее.
14ак следствие, они менее помехоустойчивы. Для поддержания необходимой помехоустойчивости системы и сведения к минимуму возможных сбоев в ее работе в последовательность разяостных сигналов ДИКМ периодически вреза>отса опорные кадры. Их периодичность в стандарте МРЕС составляет около 0,5 с.
Разностный сигнал и сигнал опорного кадра после ДКП кванту- ется по разным алгоритмам. Если для опорного кадра используется рассмотренная в п. 5.2.2 матрица квантования для внутрикадрового кодирования (см. рис, 5.9), то для разностного сигнала применяется другая, более однородная матрица.
Это объясняется тем, что разностный сигнал в основном несет информацию о небольших изменениях в отдельных фрагментах изображения (в процессе их перемещения). И высокие частоты (коэффициенты ДКП правого нижнего угла), .ответственные за детализацию изображения, столь же важны, как и низкие. Конкретный вид матрицы в зависимости от сюжета могкет меняться, но по умолчанию используется однородная матрица квантования с постоянным значением 16 для всех частот, включая нулевую ~17). 5.2.5.
Компенсация движения в динамических изображениях Из принципа работы ДИКМ следует, что чем ближе по содержанию соседние кадры, тем меньше в разностном сигнале информации, а значит, тем эффективнее компрессия. Всякое изменение положения отдельных фрагментов изображения в результате их собстненного движения или перемещения передающей ТВ камеры снижает эффективность кодирования. Сохранить эффективность работы ДИКМ можно соответствующим анализом характера дни>кения. Целью анализа является возможность установления соответствия мегкду предыдущим по времени блоком изображения и блоком в текущелг кадре, смещенным в пространстве на координаты Ья, Ьу.
Под соответствием понимается достижение максимально точного равенства яркостей пикселей' некоторого блока в текущем кадре яркостям пнкселей блока, найденного в предшествующем кадре: Р7) 1>(»уа»,ус-ау,с<-Ь1) 5(»,у,1) 1 Пяксе ч — англоязычный сяяопвм терь1ява езлемевт», получивший сейчас широкое распространение в технической лвтературс (осабемво в области пяфровой обработке взображсввй) В дальнейшем изложении могут использоваться оба варианта ГЛАВА З. Основы цифрового телевидения 105 где Ь вЂ” - яркость пикселей; Л1 — время между сравниваемыми кадрами.
Разницу в координатах (|.'|х, |.'|у) этих двух блоков называют вектором движеяил. Нахождение вектора движения, другими словами, есть определение нового положения подвижного фрагмента изображения. Под компенсацией движения понимается использование в качестве предсказания блока из предшествующего (или последующего) кадра, но при этом смещенного в плоскости изображения на величину вектора двигкения. Такое предсказание позволяет значительно уменьшить ошибку предсказания по сравнению с обычной ДИКМ. Это иллюстрируется рис.
5.14, где представлена последовательность из трех кадров изображения с перемещающимся серым квадратом на фоне гладкого белого фона (рис. 5.14,а). Первый кадр Ь| в этой последовательности является опорным, Как отмечалось, предсказание для него не делается (сигнал предсказания равен нулю для всего изображения), и он подвергается только внутрикадровой компрессии. Предсказанием для второго кадра Ьз является реконструируемый по алгоритму ДКП и взвешенного квантования первый кадр Ь|. Ошибка предсказания для второго кадра в обычной ДИКМ равна Ьз — Ь„для третьего кадра — соответственно дз — Ьз и т.д. Для простоты следует пренебречь небольшой разницей между истинными значениями отсчетов Ь|, Ьз, Ьз,...
и их реконструируемыми значениями Ь|, Ьз, Ьз, .... Тогда ошибки предсказания для обычной ДИКМ будут иметь вид рис. 5.14,б, где черный фон соответствует нулевым значениям, а серый — остальному множеству отсчетов. Если бы в предложенном примере движение отсутствовало, то ошибка предсказания для второго и последующих кадров равнялась бы нулю для всего изображения. Именно такого результата для данного примера с движущимся фрагментом изображения, а не статическим удается добиться в ДИКМ с компенсацией движения. В этом случае предсказание для первого (опорного) кадра, как и при обычной ДИКМ, равно нулю, а для второго и последующих кадров соответственно — Ьг(х+|зхыу+|1д|), Ьз(я+|зхг,у+|1уз).
Здесь |злы |Хуы |вахт, |'.|уз и т.д. — изменение координат движущегося фрагмента (векторы движения) в последовательности кадров (рис. 5.14,в). В результате ошибка предсказания для приведенного примера с подвижным фрагментом изображения в ДИКМ с компенсацией движения обращается в нуль для всего множества отсчетов изобрюкения (рис. 5.14,г), что иллюстрирует более эффективную компрессию.
При реализации компрессии с компенсацией движения сигнал ошибки предсказания должен дополняться передачей данных о векгорах дви|кения. Последние, так гке как и коэффициенты ДКП, компрг|тируются использованием кодов переменной длины. Абсолютное равенство в (5.7) моясет быть достигнуто только при 1Об ЧАСТЫ. Физические основы телевидения а) Ьз- Ьа Ь вЂ” Ь, б) ЬНх-)-ахт,у-~-дра) Ьз(х+Гзхз,у+Зтуз) а) ьИх+гзхт, у+)ьуа)-ьз ьз(х+йхз у+луг) — ьз г) Рнс. 5.14. Сравнение обычнои ДИКМ и ДИКМ с компенсациеи движения; а — исходная последовательность изображений; б — ошибка предсказания при обычнои ДИКМ, в — предсказание с учетом вектора движения; г — ошибка пред- сказания с компенсацией движения выполнении следующих условий (16]: движение объекта в изображении исчерпывается только плоскопараллельным перемещением, его яркость постоянна, градиент яркости фона равен нулю, и все объекты в блоке движутся с постоянной скоростью.
Именно этим условиям отвечает пример изобрюкения, приведенный на рис. 5.14, и соответственно предельно достижимый результат компрессии (сигнал ощибки в системе с компенсацией движения равен нулю) Нарушение пе- ГЛАВА 5. Основы цифрового телевидения 167 речисленных выше условий уменьшает эффективность компрессии. К возможным факторам, влияющим на эффективность кодирования, следует отнести и осложнения глобального порядка, когда происходит резкое изменение сюжета (например, при коммутации одновременно работающих камер). При этом изменения в изображении охватывают все пространство в кадре, и блоков, соответствующих друг другу с удовлетворительной точностью, в смежных кадрах не существует.
Эффективность компрессии в таких экстремальных случаях может снижаться настолько, что целесообразно отказываться от процедуры ДИКМ, и для таких изображений данные передавать только на основе внутрикадровой компрессии. Решение о замене способа кодирования долткно приниматься в кодере автоматически, путем оперативного анализа возможных результатов компрессии. Самым трудоемким при реализации алгоритма компенсации движения является согласование блоков, т.е. нахождение блоков в разных кадрах, наилучшим образом соответствующих условию (5.7).
Для этого текущий блок сравнивается со всеми блоками предыдущего кадра в пределах некотороИ области поиска: ~128 шагов (пикселеИ) при точности определения вектора движения в один пиксель или х64 шага при точности 1/2 пикселя. Стандарт пе ограничивает методы согласования, но наиболее точным принято считать так называемый полныИ поиск (1п!1 зеагсЬ), которыИ сводится к расчету ошибки предсказания для всех возможных векторов и определению положения (т.е. нахождения Ьх и сзу) блока с минимальной ошибкоИ (например, по среднеквадратическому отклонению для всех отсчетов блока).
Существуют и другие методы, отличающиеся большей скоростью определения векторов движения, но несколько меньшей точностью. К ним, в частности, относятся логарифмический и телескопический методы [16, 17). На рис. 5.15 приведена структурная схема эффективного кодирования, в котором сочетаются методы внутрикадровой и межкадровоИ номпрессии с компенсацией движения. Эта схема в значительной степени упрощена, отражая последовательность выполнения только самых основных преобразованиИ.
От структурной схемы обыч- ноИ ДИКМ она отличается, во-первых, наличием устройства, производящего оценку движения и определяющего вектора движения подвижных фрагментов. Во-вторых, предсказатель в этоИ системе -- не просто память для хранения предшествующих кадров, как это было в обычноИ ДИКМ рис. 5.13. Это — устройство, которое при формировании предсказания отыскивает из всего массива данных, находящихся в его памяти, блок, согласован~ыИ с блоком текущего кадра. Для этого в предсказатель заводятся данные о векторах лннжепия. Последние, как уже отмечалось, подвергаются энтропийшниу кодированию и мультиплексируются в общий цифровой поток < ы ыфф и циепта м и Д1'П.