Диссертация (Методы и устройство формирования сигналов в цифровых видеоинформационных системах), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Методы и устройство формирования сигналов в цифровых видеоинформационных системах". PDF-файл из архива "Методы и устройство формирования сигналов в цифровых видеоинформационных системах", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Результаты сравнительных тестов по эффективностикодирования видео кодековДополнительно обратим внимание на результаты сравнения методовсжатия, основанных на ДВП и ДКП, которые были приведены в [24]. Сравнениепроводилось по критериям эффективности сжатия, сложности и скоростивычисления результата. Отсюда можно заметить, что лидером в эффективностисжатия статичных изображений является ДВП, но достигнутое им преимуществоперед ДКП крайне мало.
Однако, если рассмотреть результаты сжатия видео, томожно заметить, что в большинстве случаев преимущество в эффективностисжатия принадлежит ДКП. Выигрыш ДКП достигает за счет того, что он быстрее[25] и более эффективно справляется с преобразованием пространственныхсоставляющих изображений.Здесь отметим, что цель внедрения ДВП в обработку изображений быладостигнута.
Эта цель заключалась в устранении главного недостатка ДКП –отсутствиекачественногочастотно-временногопредставлениясигнала.62Дополнительный положительный эффект, который был получен в результатеиспользования ДВП – лучшее субъективное восприятие изображения, но онпроявляет себя в случае, если изображение преобразовывалось целиком, т.е. безиспользования методов, подразумевающих поблочную работу с изображениемкадра. Тем не менее, несмотря на положительные стороны, недостатки, присущиеДВП, до сих пор не позволяют ему заменить ДКП для применения в сжатиивидеоинформационного сигнала. В первую очередь, это связано с тем, что приреализации ДВП затрачивается на порядок больше вычислительных ресурсов ивремени, чем при реализации ДКП.
В случае, если преобразованию подвергаетсякадр видео высокой четкости, этот недостаток может стать крайне критичным. Кпримеру, наиболее эффективная, на сегодняшний момент, реализация ДКПтребует всего 54 операции умножения для блока 8Х8 пикселей [26], в то время,как количество операций в ДВП зависит от длины вейвлет фильтра и, в самомлучшем случае, имеет место одно умножение на коэффициент.
Соответственно,скорость реализации ДВП напрямую зависит от длины используемого вейвлета –короткий (компактный) или длинный (сглаживающий). Однако стоит учитывать,что при реализации более компактного вейвлета уменьшается степень размытостиизображения кадра [27], и это отрицательно влияет на его субъективноевосприятие и лишает ДВП одного из его положительных качеств. Впреобразовании Хаара, к примеру, используется короткий вейвлет [29] и по этойпричине реконструированное изображение, после сжатия, очень похоже на то,которое было преобразовано ДКП. Эти два изображения представлены, длясравнения, на рисунке 1.28.Кроме того, чтобы сохранить преимущества ДВП с гладкими фильтрами вотношенииулучшенногосубъективноговосприятия,придетсяусложнятьреализацию таких процедур, как компенсация движения, пространственное ивременное предсказания.
Отказ же от использования таких процедур сильноуменьшит степень сжатия видео.63Рисунок 1.28. Реконструированные изображения после сжатия.Слева – ДКП блоков 8Х8 пикселей, справа – ДВП ХаараОтметим также, что различия, которые появляются при применении ДКПили ДВП, заметны только при субъективной оценке качества и проявляются онипри высоких коэффициентах сжатия, использование которых зачастую невостребовано.В настоящее время для многих потребителей важен вопрос стоимости,которая для оборудования, аппаратно реализующего ДВП, сравнимо выше, чемдля ДКП и в большинстве таких случаях фаворитом становится ДКП.Таким образом, преобразования ДКП и ДВП имеют свои преимуществами инедостатками, поэтому выбирать вид преобразования необходимо под решаемуюзадачу. Следовательно, с учетом анализа преимуществ и недостатков обоих типовпреобразований, для реализации передачи видеоинформационного сигнала врежимереальноговременивцифровыхканалахпередачиданных,сиспользованием малого количества вычислительных ресурсов, оптимальнымбудет алгоритм, работа которого основана на ДКП.
Это связано с наличием всвойствах этого преобразования компромиссамежду количеством требуемыхвычислительных ресурсов, скорости обработки и качеством получаемыхрезультатов.641.3.3 Внутрикадровое предсказаниеПри анализе какой-либо части изображения кадра, с большой вероятностью,окажется, что соседние, с рассматриваемой частью, пиксели будут идентичнымиили похожими по характеристикам, что создает высокую степень избыточности.Такого рода избыточность устраняют путем замены пикселей рассматриваемойобласти, пикселями с теми же или похожими характеристиками из соседней, чащевсего смежной к ней, области. Этот подход позволяет закодировать лишь однуобласть, а затем вставлять её копированием в необходимые части кадра.
Однако, вслучае неполной идентичности пиксельных характеристик, происходит потерянекоторой доли информации. Такие случаи в работе алгоритма сжатия возникаюточень часто и для того, что бы избежать потери информации обычно передаютразность между текущей областью и областью, сформированной на основепримыкающих, к текущей области, пикселей. Минусом такой операции являетсяуменьшение степени сжатия из-за необходимости в передаче дополнительнойинформации в виде разности двух областей изображения [30].Описанный выше процесс поиска похожих частей в пределах кадраназывается пространственным или внутрикадровым предсказанием.
Такоепредсказание осуществляется на основе ряда примыкающих пикселей к областипредсказания в колонке слева, в строке сверху или, дополнительно, в строке,смещенной вправо относительно предсказываемой области. Область, в которойосуществляется предсказание, представляет собой блок, размеры которогообычно составляют 4x4, 8x8 или 16x16 пикселей. Для вычисления значенийпикселей блока существуют несколько режимов предсказания или, как еще ихназывают, направлений прогнозирования [30, 86].
Наиболее подходящим из этихнаправлений будет считаться то, что даст наименьшее значение разности междувычисленнымипредсказываемымблоком.Принципработырежимовпредсказания поясняется на рисунке 1.29.651 режим2 режим3 режим4 режимвертикальногогоризонтальногоусреднённогодиагональногопредсказанияпредсказания(DC)предсказания вниз,предсказаниявлево5 режим5 режим7 режим8 режимдиагональноговертикальногогоризонтальноговертикальногопредсказанияпредсказанияпредсказанияпредсказания влевовниз, вправовправовниз8 режим горизонтального предсказания вверхРисунок 1.29. Режимы внутрикадрового предсказанияТаким образом, внутрикадровое предсказание в стандарте, за счет своегопрогнозирования и на основе дальнейшей экстраполяции пикселей, позволяетсущественно, сократить объем пространственной избыточности и, как следствие,объем передаваемой информации.
Наличие различных режимов прогнозированияпозволяет кодеку гибко адаптироваться к различным текстурам кодируемогоизображения и достигать большей степени сжатия.1.3.4 Межкадровое предсказание и кодированиеВ случаи сжатия статичных изображений, фотографий или другой графикиограничиваются пространственным сжатием, но при сжатии видео, состоящего из66последовательности кадров и в условиях наличия зависимости между отдельнымипоследовательностями этих кадров, в дополнение к пространственному сжатиюприменяют временное сжатие.Основная идея такого сжатия основана на том, что последовательностикадров, как правило, представлены одним и тем же статичным фоновымизображением и меняющими свое положение, от кадра к кадру, объектами напереднем плане.
По этой причине в любом видеоинформационном сигналеприсутствует временная избыточность, представленная статичным фоном идругими,меняющимисвоихарактеристикииположениевпределахпоследовательности кадров, элементами. Такой вид избыточности устраняютследующим способом: передают содержание одного кадра целиком. Этот кадрназывается опорным. В содержании следующего кадра передают толькоинформацию о переместившихся объектах и их новых положениях. Примеромреализации этой идеи может служить разность двух соседних кадров(межкадроваяразность),передачакоторойдаётпростейшееустранениевременной избыточности. Пример описанной операции представлен на рисунке1.30.а) первый кадрб) второй кадрв) разница между первым и вторым кадрамиРисунок 1.30. Межкадровая разница двух последовательных кадров67Кроме межкадровой разницы дополнительное сжатие достигается сприменением процесса, называемого оценка и компенсация движения.
Этотпроцесс позволяет с более высокой точностью предсказать те части изображения,где присутствует движение, и устранить временную избыточность. Процессоценки и компенсации движения работает следующим образом: изображение втекущем кадре разбивается на блоки и для каждого блока ищется (оценивается)его наиболее вероятное положение в соседних и опорных кадрах, сопоставляя егосо всеми блоками такого же размера в заданной области поиска блоков. К концупоискаформируетсясовокупностьвекторовдвижения,указывающихнаправление смещения объектов от кадра к кадру.Найденные, с помощью оценки движения, сместившиеся части изображениямогут не полностью соответствовать частям на опорных кадрах по причине того,что форма блока поиска, прямоугольная область, не всегда совпадает с формойпереместившейся части изображения.
Кроме того, для лучшего результата поиска,сопоставляемые блоки могут отличаться по яркости или цветности на оченьмалую величину и при этом они будут считаться кодеком как одинаковые. Этидопущения добавляют погрешность в процесс восстановления кадра, котораяприводит к потере некоторой части информации.Для того, чтобы исключить погрешности, возникающие в описанной вышепроцедуре, вместе с векторами движения передается еще и разность междупредсказываемым блоком и найденным опорным блоком, которая называетсяошибкой предсказания. Передача ошибки предсказания позволяет избежатьпотери информации за счет передачи хоть и малой, но дополнительнойинформации, что ведет к уменьшению коэффициента сжатия и увеличениювремени работы кодера, как и в случае с внутрикадровым предсказанием.Следует отметить, что в процессе сжатия видеоинформационного сигнала,этапоценкиикомпенсациидвиженияявляетсянаиболеесложнымитребовательным к вычислительными ресурсам.