ВКР (1229297), страница 4
Текст из файла (страница 4)
– возможность развернуть сеть без прокладки кабеля, что может уменьшить стоимость развёртывания и/или расширения сети;
– возможность иметь доступ к сети для мобильных устройств пользователя;
– Wi -Fi устройства широко распространены на рынке, что гарантирует совместимость оборудования благодаря обязательной сертификации с логотипом Wi-Fi;
– мобильность;
– в пределах Wi-Fi зоны можно организовать подключение к сети Интернет для нескольких пользователей (с компьютерами, ноутбуками, телефонами и т. д.);
– излучение Wi-Fi устройств в момент передачи данных на порядок (в 10 раз) меньше, чем у сотового телефона.
Однако, протокол обладает и недостатками:
– в диапазоне 2,4 GHz работает множество устройств, что увеличивает вероятность помех и коллизий;
– скорость передачи данных на L2 (OSI) в Wi-Fi сети всегда ниже заявленной скорости на L1 (OSI);
– частотный диапазон и эксплуатационные ограничения в различных странах не одинаковы;
– в России точки беспроводного доступа, а также адаптеры Wi-Fi с ЭИИМ, превышающей 100 мВт (20 дБм), подлежат обязательной регистрации [6].
Некоторые страны, например, Россия, Белоруссия и Италия, требуют регистрации всех сетей Wi-Fi, работающих вне помещений, или требуют регистрации Wi-Fi-оператора [5].
2.3 Анализ алгоритмов кодирования видеопотока
Следующим вопросом является выбор метода кодирования видео-потока, который чаще рекомендуется делать на основе PSNR характеристики оценки качества. PSNR (Peak Signal-to-Noise Ratio, пиковое отношение сигнала к шуму) – может быть использована как метрика для сравнения двух изображений: чем больше попиксельная разница между ними (оригиналом и его преобразованной версией), тем меньше значение PSNR [11].
PSNR является наиболее часто рекомендуемым методом измерения качества системы обработки и передачи цифрового видео, измеряется в дБ. PSNR не позволяет учесть все специфические для видео параметры, поскольку точность представления изображения постоянно изменяется в зависимости от визуальной сложности изображения, доступной скорости передачи и даже метода сжатия. Таким образом, PSNR не может определить насколько заметными эти искажения будут для пользователя. Одним из основных преимуществ PSNR можно назвать невысокую вычислительную сложность. Поэтому часто именно этот метод берут за основу для создания различных моделей оценки качества передачи видео и дополняют его необходимыми показателями. Пиковое отношение сигнала к шуму проще всего определить через среднеквадратическую ошибку (СКО), которая для двух монохромных изображений R и Q размера i × j, одно из которых считается зашумлённым приближением другого [11].
Разработка большинства стандартов кодирования видео-потоков предназначена, в первую очередь, для достижения наибольшей эффективности кодирования, которая определяется способностью преобразовать информацию с скоростью передачи данных при сохранении заданного уровня качества изображения. Существует два стандартных способа измерения эффективности кодирования видео, один из которых заключается в использовании объективной метрики, такой как PSNR, а второй состоит в использовании субъективной оценки качества видео. При этом отмечается, что субъективная оценка качества изображения является наиболее важным параметром для оценки кодирования, так как зрители воспринимают качество видео субъективно.
Ниже приводятся результаты сравнительного анализа производительности наиболее распространенных методов кодирования видео-потоков: H.264, HEVC. При проведении оценки следует отметить, что вместо макроблоков, которые применялись в H.264, в HEVC используются блоки с древовидной структурой кодирования. Выигрыш HEVC – в применении блоков большего размера [12]. В результате тестов было показано, что по сравнению с кодированием блоков размером 64x64 пикселей, битрейт (количество бит, используемых для хранения одной секунды мультимедийного контента) увеличивается на 2,2 %, когда используются блоки размером 32x32 и увеличивается на 11,0 %, когда используется размер блоков 16х16. В тестах кодирования видео с разрешением 2560x1600 пикселей при использовании блоков с размером 32x32 пикселей битрейт увеличивается на 5,7 %, а при использовании блоков размером 16x16 пикселей – на 28,2 %, по сравнению с видео, где использованы блоки размером 64х64, при одинаковом пиковом отношении «сигнал-шум». Тесты показали, что применение блоков большего размера более эффективно при кодировании видео с высоким разрешением. Тесты также показали, что для декодирования видео, закодированного с размерами блоков 16х16, требуется на 60 % больше времени, чем при использовании блоков 64x64. То есть, применение блоков бо́льших размеров повышает эффективность кодирования при одновременном сокращении времени декодирования.
В результате экспериментальных исследований авторами [13] было проведено сравнение эффективности кодирования видео-потока алгоритмом Н.265 с H.264/MPEG-4 AVC High Profile (HP), MPEG-4 Advanced Simple Profile (ASP), H.263 High Profile Latency (HLP) и H .262/MPEG-2 Main Profile (MP). Были закодированы видео развлекательных программ и девять тестовых видеопоследовательностей с двенадцатью различными битрейтами с использованием тестовой модели HEVC HM-8.0, пять из них были с HD разрешением, а четыре были с разрешением WVGA (800 × 480). Уменьшение битрейта определялось на основе PSNR.
Для сравнения фильмов в качестве метрики выбрано среднее значение PSNR соответствующих кадров по всей последовательности. Т.е. чем выше характеристика метода находится на графике PSNR, тем лучше он справился со сжатием. Y-PSNR – разница между кадрами по яркости (Y-компонента), а U-PSNR и V-PSNR – разница по цветовым оттенкам (U- и V-компоненты) [13]. Результаты сопоставления характеристик и сравнительного анализа данных эксперимента приведены в таблице 2 и на рисунке 2.2.
Таблица 2 – Сравнение стандартов видеокодирования при равном PSNR
Стандарт видеокодирования | Среднее сокращение битрейта | |||
H.264/MPEG-4 AVC HP | MPEG-4 ASP | H.263 HLP | H.262/MPEG-2 MP | |
HEVC MP | 35.4 % | 63.7 % | 65.1 % | 70.8 % |
H.264/MPEG-4 AVC HP | - | 44.5 % | 46.6 % | 55.4 % |
MPEG-4 ASP | - | - | 3.9 % | 19.7 % |
H.263 HLP | - | - | - | 16.2 % |
Рисунок 2.2 – График зависимости PSNR от битрейта при использовании популярных программ кодирования видео
Значение PSNR, в большинстве случаев, адекватно характеризует качество сжатия, но иногда не отражает характер и величину визуальных артефактов. Поэтому, в качестве дополнения к графикам PSNR, приводятся отдельные кадры, сжатые различными алгоритмами программ, способных выполнять преобразование данных или сигнала, например, анлдогичные представенным на рисунке 2.3.
а) б)
Рисунок 2.3 – Результаты кодирования различными программами одного изображения: а) Ateme H.264; б) DivХ 5.1.1
На рисунке 2.3 видно, что при одинаковой степени сжатия Ateme H.265 намного лучше справляется с подавлением блочности, чем DivX.
2.4 Проектирование программного модуля
2.4.1 Схема обработки видеопотока
Программное обеспечение будет разрабатываться на языке высокого уровня С++, так как этот язык обладает необходимыми для реализации проекта возможностями. В качестве среды разработки будут использованы Code Blocks, Qt Creator, так эти две среды разработки являются кроссплатформенными, что позволяет экспортировать программу на микрокомпьютер. В дальнейшем планируется реализовать графический интерфейс в интегрированной среде разработки Qt Creator. Приложение будет иметь консольный интерфейс и работать под управлением операционной системы (ОС) Raspbian, установленной на микрокомпьютере Raspberry pi 2 и представляющей собой конфигурацию ОС Debian семейства Linux. Операционная система Raspbian специально разрабатывалась для микрокомпьютеров семейства Raspberry, т.е. она полностью использует возможности аппаратной архитектуры. Для работы программы будет необходима открытая библиотека компьютерного зрения OpenCV. До начала разработки программы необходимо описать схему ее работы с помощью блок-схемы, приведенной на рисунке 2.4.
Рисунок 2.4 – Блок-схема программы обнаружения пешеходов
Программа имеет консольный интерфейс, так как впоследствии она будет портирована на микрокомпьютер, где вычислительные мощности уступают настольному персональному компьютеру, и нет необходимости использовать графический интерфейс пользователя.
2.4.2 Алгоритмы распознавания пешеходов в видеопотоке
2.4.2.1 Каскадный алгоритм распознавания образов на основе признаков Хаара
Для обнаружения пешеходов используют каскадный алгоритм Виолы - Джонса, основанный на признаках Haar wavelet. Подробное описание этого метода приведено в работе [8].
В алгоритме поиск пешеходов осуществляется сканированием изображения скользящим окном (окном обнаружения), используя признаки Haar wavelet. Используются признаки различных типов, масштабов и положений. Внутри окна обнаружения генерируется более 100,000 признаков. Каждое окно обнаружения проходит через цепочку уровней, отсекающих большую долю негативных примеров. На следующие уровни поступают окна, не отсечённые на предыдущем. Критерии отсечения уровней задаются при обучении детектора.
2.2.1 Признаки Хаара
Признак является отображением
f: X => Df, | (2) |
где Df – множество допустимых значений признака.
Если заданы признаки , то вектор признаков
называется признаковым описанием объекта x ∈ X. Признаковые описания допустимо отождествлять с самими объектами. При этом множество
называют признаковым пространством [24].
Признаки делятся на следующие типы в зависимости от множества Df:
– бинарный признак, Df = {0,1};
– номинальный признак: Df – конечное множество;
– порядковый признак: Df – конечное упорядоченное множество;
– количественный признак: Df – множество действительных чисел.
Есть прикладные задачи с разнотипными признаками для их решения подходят далеко не все методы.
В стандартном методе Виолы-Джонса используются прямоугольные признаки, изображенные на рисунке 2.5 и называемые примитивами Хаара.
Рисунок 2.5– Примитивы Хаара
В расширенном методе Виолы-Джонса, использующемся в библиотеке OpenCV используются дополнительные признаки, изображенные на рисунке 2.6.
Рисунок 2.6 – Дополнительные признаки