Диссертация (Методы и устройство формирования сигналов в цифровых видеоинформационных системах), страница 11
Описание файла
Файл "Диссертация" внутри архива находится в папке "Методы и устройство формирования сигналов в цифровых видеоинформационных системах". PDF-файл из архива "Методы и устройство формирования сигналов в цифровых видеоинформационных системах", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
Точность и объем вычисленийбудут зависеть от размера выбранного блока [31, 32]. Чем больше размер блока,тем быстрее будет осуществляться поиск, и меньше векторов движения будет68формироваться для передачи, при этом границы объектов часто будут несовпадать с границами блоков, что приведет к увеличению количествапередаваемой, корректирующей, информации [36]. Чем меньше размер блока, темдольше будет осуществляться поиск, и тем больше векторов движения будетформироваться для передачи, но вероятность соответствия опорного и искомогоблоков больше, соответственно, количество передаваемой корректирующейинформации – меньше.
При этом выбор слишком маленького размера блока ведетк слабой помехоустойчивости системы сжатия [37]. Реализация межкадровойразницы с компенсацией движения и влияние блоков поиска различных размеровна результат представлена на рисунке 1.31.а)б)Рисунок 1.31. Межкадровая разность с компенсацией движения – а) размерблока поиска 8x8 пикселей, б) размер блока поиска 16x16 пикселейВ силу сказанного выше, приходится балансировать между качествомпоиска совпадений между блоками и количеством векторов движения.Можно также отметить, что движущиеся объекты редко следуют строговдоль границ блоков пикселов, поэтому более эффективным может бытьиспользование переменных размеров блоков для оценки и компенсации движения[33].Если движение измерено достаточно точно (рисунок 1.31 а), то для каждогомакроблока элементов изображения можно передавать лишь относительно малыемежкадровые различия и, плюс, двумерный вектор движения.Вектор движения для блока выбирается из условия минимальностизначения функции, определяющей критерий совпадения блоков [38].
В настоящее69время доступен широкий набор таких функций (SSD, SAD, MAD, MSE и др.),отличающихся, в основном, уровнем сложности реализации и качествомполучаемого результата.Наиболеепопулярнойвсилусвоихминимальныхтребованийквычислительным ресурсам и простотой реализации считается функция суммыабсолютных разностей (SAD) между элементами текущего и опорного блоков:SAD V X ,VY F x, y , t F x VX , y VY , t 1 ,(1.11)X ,Yгде F – значение яркости, t – временной индекс кадра, (x, y) - пространственныекоординаты пикселей в кадре, VX, VY – координаты вектора движения.Оценка вектора движения должна реализовываться в условиях селективноговыделениясоставляющихвидеоинформационногосигнала,отличающихсядостаточно высоким градиентом изменения во внутрикадровом пространстве исравнительновысокимотношениемсигнал/шум.Восновном,этосреднечастотные составляющие, т.к.
добавление высокочастотных составляющихухудшаетотношение(пространственнаясигнал/шум,низкочастотнаяачрезмерноефильтрация)интегрированиеуменьшаетуровеньсоставляющих, отражающих пространственно-временные искажения сигналаизображения при передаче движения.Форма зоны поиска соответствия блоков может быть различной, нонеобходимо учитывать, что преимущественно движения осуществляются вгоризонтальном направлении.Поиск, при котором сканируются все блоки из зоны поиска, называетсяполным. Чем больше зона поиска, тем больше вероятность найти совпадающиеблоки.
При этом с увеличением размера зоны поиска увеличивается количествоблоков для сканирования, а это ведет к увеличению объема вычислений. Полныйпоиск может использоваться для оценки качества работы других алгоритмовпоиска. Для уменьшения требований к вычислительным ресурсам, присохраненииприемлемогокачествапоиска,существуютсубоптимальныеалгоритмы оценки движения [35, 38, 40-43].70Из таких алгоритмов можно отметить бинарный поиск, логарифмический(рисунок 1.32), трехшаговый (рисунок 1.33), четырехшаговый (рисунок 1.34),ортогональный (рисунок 1.35), спиральный, иерархический и другие.
Задачасубоптимальных алгоритмов сводится к сокращению числа точек поиска.Рисунок 1.32. ЛогарифмическийРисунок 1.33. Трехшаговый алгоритмалгоритм поискапоискаРисунок 1.34. ЧетырехшаговыйРисунок 1.35. Ортогональный алгоритмалгоритм поискапоискаТестирование многих субоптимальных алгоритмов позволило определитьпорог, в уменьшении порогового отношения сигнал/шум, при использованиисубоптимального алгоритма поиска по сравнению с полным поиском: потери вкачестве не должны опускаться ниже 0,1 дБ. При осуществлении полного поискав окне [-15, 15] требуется перебор 961 точки поиска.
Поиск трехшаговымалгоритмом требует перебора 33 точек поиска. Если сравнивать алгоритмы,71учитывая только эти два показателя, то экономия времени вычисления должнасоставить (961-33)/961=0,9657 или 97%. Однако экспериментальные результаты,проведенныесиспользованиемкодераJM14.0,показывают,чтовдействительности экономится только, лишь, 73,5% времени при одинаковыхусловиях кодирования (оценка производилась по занесенным в файл статистикивремени работы алгоритмов оценки движения).Поэтому эффективность работы алгоритмов поиска движения необходимоизмерять комплексной оценкой, включающей, помимо количества точек поиска,также время доступа к памяти, поиск за пределами видео окна, из-за спецификишаблона поиска, условия раннего останова и другие.
Следует учитывать и такойфактор,что еслиалгоритмработает быстро,но оценкапроизводитсянедостаточно точно, то возможно появление большого объема разностнойинформации, который далее подвергается энтропийному кодированию.Для того чтобы лучше понять весь процесс взаимодействия основныхчастей любого алгоритма кодирования, основанного на ДКП преобразованиивидеоинформационного сигнала, на рисунке 1.36 представлена схема видеокодера.Рисунок 1.36. Блок схема взаимодействия основных составляющих узловалгоритма кодирования видеоинформационного сигналаТаким образом, современные алгоритмы оценки движения являютсяадаптивными,чтопозволяетэффективноустранятьвременную72психофизиологическую избыточность.
Начало поиска связано, как правило, свычислением прогноза определяемого вектора движения, основываясь на ранееопределенных векторах, используя свойство высокой корреляции векторовдвижения между соседними макроблоками. В дополнение к этому используютсяэффективные шаблоны поиска и динамическая модификация размеров зоныпоиска, что позволяет значительно ускорить процесс оценки движения и, в своюочередь, упростить процесс межкадрового предсказания, снизив при этомнагрузку на вычислительные ресурсы.1.4 Перспективные направления совершенствования алгоритмов сжатиявидеоинформационных сигналовСегодня алгоритмы сжатия видеоинформационного сигнала достигли оченьхороших показателей по степени и скорости сжатия видео потока.
Тем не менее,этого недостаточно для того, чтобы полноценно справляться с задачами, гденеобходимы малые задержки в передаче данных, осуществлять кодирование сиспользованием малого количества вычислительных ресурсов [44], эффективноработать с видео высокой четкости и ультравысокой четкости.Как уже известно, сжатие видеоинформационного сигнала представляетсобой работу целого набора алгоритмов,взаимосвязанное функционированиекоторых обеспечивает устранение избыточности по различным направлениям.Таким образом, центральную роль играют алгоритмы, применяемые приортогональных преобразованиях сигнала видео изображения, квантованиипространственного спектра, пространственном и временном предсказания,энтропийном кодировании.
Так, новый формат сжатия видеоизображенияH.265/HEVC стал эффективным за счет принятых улучшений, именно, в этихнаправлениях [46, 47].Дискретно-косинусное преобразование - ортогональное преобразование,которое доказало свою наибольшую эффективность на сегодняшний день, тем неменее, добавление к работе ДКП еще одного вида ортогонального преобразования73положительно сказывается на процессе сжатия. Такой принцип используется вкодеке H.264 [86], где после процедуры ДКП, дополнительно применяетсяортогональное преобразование Уолша-Адамара, и получает продолжение в H.265,за исключением того, что вместо Уолша-Адамара, оказалось эффективнееиспользовать дискретно-синусное преобразование [45].По этой причинестановится востребован поиск наилучшей комбинации двух ортогональныхпреобразований.
Кроме того, к увеличению степени компрессии приводитприменение эффективных таблиц квантования. Повышение эффективности в этомнаправлении можно достичь за счет применения адаптивных таблиц квантования.За счет формирования уникальной таблицы для каждого блока или совокупностиблоков можно динамично подстраивать параметры, для исключения избыточнойинформации, под каждую область изображения.Значительная доля избыточности сокращается на этапах пространственногои временного предсказания.
Кроме того, применяемые на этих этапах алгоритмысложны и увеличивают время работы кодера. По этой причине улучшенияалгоритмов по этому направлению крайне важны. Как показали тесты [45] здесьувеличение степени сжатия достигается за счет применения блоков различногоразмера. Динамичность и адаптивность параметров блока дают возможностьточновыполнятькомпенсациюдвиженияпривнутри-имежкадровомпредсказании, позволяя, вследствие этого, передавать минимальный объемразностной информации. Стоит отметить, что очень положительно сказываетсяприменение блоков больших размеров, включая 64х64 пикселей и использованиеточности предсказания до 1/8 пикселя при выполнении компенсации движения.Это связано с тем, что, в сравнении с видео стандартной четкости, видео высокойи ультравысокой четкости содержат похожие области большого размера, которыекрайне неэффективно кодируются при помощи маленьких блоков.
Значительнуюроль, при сжатии видеоинформационного сигнала по пространственномунаправлению, играет количество доступных угловых направлений предсказания,основные из которых были перечислены в 1.3.3. Поэтому наличие 33 возможныхспособов направления предсказания помогло H.265/HEVC превзойти по степени74сжатия многие кодеки, обладающие значительно меньшими свободами привыборе направления предсказания.Алгоритмыэнтропийногопредсказанияобычноприменяютсяназавершающем этапе кодирования видео. Исключая статистическую избыточность,они также занимают не последнее место в компрессии видео. На данный момент,наиболее часто используемый алгоритм основывается на методе Хаффмана, аарифметическоекодирование,являющеесяболееэффективнымметодомкодирования, только начинает быть востребованным по причине недоступногоранее количества вычислительных ресурсов.