Диплом ЦВЗ (1221233), страница 3
Текст из файла (страница 3)
Встраивание сообщения в контейнер может производиться при помощи ключа, одного или нескольких. Под ключом понимается псевдослучайная последовательность (ПСП) бит, порождаемая генератором, удовлетворяющим определенным требованиям [4]. Числа, порождаемые генератором ПСП, могут определять позиции модифицируемых пикселей в изображении.
Скрываемая информация встраивается в соответствии с ключом в те области контейнера, изменение которых не приводит к существенным искажениям. Эти биты образуют стегопуть. В зависимости от приложения, под существенным искажением можно понимать искажение, приводящее как к неприемлемости для адресата заполненного контейнера, так и к возможности выявления факта наличия скрытого сообщения в результате стегоанализа.
2.2 Классификация стеганографических систем на основе цифровых водяных знаков
Системы, использующие ЦВЗ, обычно делят на три класса: а) робастные; б) хрупкие; в) полухрупкие [5].
Робастные ЦВЗ устойчивы к различным воздействиям на заполненный контейнер: сжатию, аффинным преобразованиям, криптографическим атакам, атакам против используемых протоколов.
Хрупкие ЦВЗ разрушаются уже при незначительной модификации заполненного контейнера. Они применяются для аутентификации сигналов. В отличие от средств электронной цифровой подписи, хрупкие ЦВЗ все же допускают некоторую модификацию содержимого документа. Это важно для защиты мультимедийной информации, так как законный пользователь может, например, пожелать сжать изображение. Другим отличием является то, что хрупкие ЦВЗ должны не только отразить факт модификации контейнера, но также вид и местоположение этого изменения.
Полухрупкие ЦВЗ устойчивы по отношению только к некоторым воздействиям. Они специально создаются неустойчивыми по отношению к определенного рода операциям. Например, они могут позволять выполнять сжатие изображения, но запрещать вырезку из него фрагмента.
2.3 Математическая модель стегосистемы
Рассмотрим математическую модель стегосистемы. Алгоритм встраивания ЦВЗ состоит из трех основных этапов: а) генерации ЦВЗ, б) встраивания ЦВЗ в кодере и в) обнаружения ЦВЗ в детекторе.
а) За обозначим множества возможных ЦВЗ, ключей, контейнеров и скрываемых сообщений, соответственно. Тогда генерирование ЦВЗ может быть представлено в следующем виде:
, где
– представители соответствующих множеств. Вообще говоря, функция F может быть произвольной, но на практике требования робастности ЦВЗ накладывают на нее определенные ограничения. Так, в большинстве случаев,
, то есть незначительное изменение контейнера не приводит к изменению ЦВЗ. Функция F обычно является составной:
то есть цифровой водяной знак зависит от свойств контейнера.
Оператор T модифицирует кодовые слова , в результате чего получается ЦВЗ
. На эту функцию можно не накладывать ограничения.
Функция T должна быть выбрана так, чтобы исходный контейнер , заполненный контейнер
и незначительно модифицированный заполненный контейнер
порождали бы один и тот же ЦВЗ:
то есть она должна быть робастной к малым изменениям контейнера.
б) Процесс встраивания ЦВЗ в исходное изображение
, может быть описан как суперпозиция двух сигналов:
где
– маска встраивания ЦВЗ, учитывающая характеристики СЗЧ, служит для уменьшения заметности ЦВЗ;
проектирующая функция, зависящая от ключа; знаком
обозначен оператор суперпозиции.
Использование проектирующей функции может рассматриваться, как реализация разнесения информации по параллельным каналам. Кроме того, эта функция имеет определенную пространственную структуру и корреляционные свойства, использующиеся для противодействия геометрическим атакам [4].
в) В стегосистеме главным компонетом является стегодетектор. В зависимости от типа он может выдавать двоичные либо М-ичные решения о наличии/отсутствии ЦВЗ (в случае детектора с мягкими решениями).
Рассмотрим вначале более простой случай «жесткого» (бинарного) детектора стего. Обозначим операцию детектирования через . Тогда
Пусть у половины пикселей изображения значение яркости увеличено на 1, а у остальных – уменьшено на 1. Тогда , где
.
Сначала детектор ЦВЗ вычисляет величину . Так как W может принимать значения
, то
будет весьма мало, а
будет всегда положительно. Поэтому
будет очень близко к
. Тогда можно записать вероятность неверного обнаружения стего, как дополнительную функцию ошибок от корня квадратного из отношения
(«энергии сигнала») к дисперсии значений пикселей яркости («энергия шума»).
Для случая мягкого детектора и закрытой стегосистемы имеем две основные меры похожести:
– нормированный коэффициент взаимной корреляции и
расстояние по Хэммингу [4].
В детекторе возможно возникновение двух типов ошибок. Существует вероятность того, что детектор не обнаружит имеющийся ЦВЗ и вероятность ложного нахождения ЦВЗ в пустом контейнере (вероятность ложной тревоги). Снижение одной вероятности приводит к увеличению другой. Надежность работы детектора характеризуют вероятностью ложного обнаружения.
Система ЦВЗ должна быть построена так, чтобы минимизировать вероятности возникновения каждой из этих ошибок, так как любая из них может привести к отказу от обслуживания.
3.Обзор существующих алгоритмов генерирования и встраивания ЦВЗ в изображения
В данном разделе будут рассмотрены наиболее известные алгоритмы генерирования и встраивания ЦВЗ в изображения. Но перед этим рассмотрим некоторые параметры, которые должны учитываться данными алгоритмами. К ним относятся особенности системы человеческого зрения и алгоритмы сжатия изображений. Ниже будут рассмотрены свойства человеческого зрения, популярные растровые форматы и использующиеся в них методы сжатия.
3.1 Свойства человеческого зрения
Свойства системы человеческого зрения (СЧЗ) можно разделить на низкоуровневые и высокоуровневые. Вплоть до середины 90-х годов исследователи принимали во внимание, главным образом, низкоуровневые свойства зрения. Новейшие стегоалгоритмы учитывают основные высокоуровневые характеристики СЧЗ.
К наиболее важным низкоуровневыми свойствам относятся чувствительность к изменению яркости изображения, частотная чувствительность и эффект маскирования.
Чувствительность к изменению яркости определяется следующим образом. Испытуемому показывают некоторую однотонную картинку. После того, как глаз адаптировался к ее освещенности I, постепенно изменяют яркость вокруг центрального пятна. Изменение освещенности продолжают до тех пор, пока оно не будет обнаружено [6]. Результаты исследований показали, что при малых значениях яркости СЧЗ порог неразличимости уменьшается.
Частотная чувствительность СЧЗ проявляется в большей восприимчивости человека к низкочастотному (НЧ) шуму, что связывается с неравномерностью амплитудно-частотной характеристики системы человеческого зрения.
Элементы СЧЗ разделяют поступающий сигнал на отдельные компоненты. Каждая составляющая возбуждает нервные окончания глаза через ряд подканалов. Выделяемые глазом компоненты имеют различные пространственные и частотные характеристики. В случае одновременного воздействия на глаз двух компонентов со сходными характеристиками возбуждаются одни и те же подканалы. Это приводит к эффекту маскирования, заключающегося в увеличении порога обнаружения сигнала в присутствии другого сигнала, обладающего аналогичными характеристиками. Поэтому, аддитивный шум гораздо заметнее на гладких участках изображения, чем на высокочастотных, то есть в последнем случае наблюдается маскирование [4].
Но несмотря на внедрение новых алгоритмов, высокоуровневые свойства СЧЗ до сих пор довольно редко учитываются. К таким свойствам относятся:
а) Чувствительность к контрасту. Высококонтрастные участки изображения, перепады яркости обращают на себя значительное внимание.
б) Чувствительность к размеру. Большие участки изображения «заметнее» меньших размером. Причем существует порог насыщения, когда дальнейшее увеличение размера не существенно.
в) Чувствительность к цвету. Некоторые цвета «заметнее» других (особенно, если фон заднего плана отличается от цвета фигур на нем).
г) Чувствительность к местоположению. Человек склонен в первую очередь рассматривать центр изображения.
д) Люди внимательнее к изображениям переднего плана, чем заднего.
е) Чувствительность к внешним раздражителям. Движение глаз наблюдателя зависит от конкретной обстановки, от полученных им перед просмотром или во время него инструкций, дополнительной информации.
3.2. Растровые графические форматы
Форматов представления статических изображений в растровом виде существует много, однако наиболее популярными среди них являются следующие: форматы хранения информации без потерь: BMP, PNG; форматы хранения информации с возможными потерями: JPEG, TIFF.
Рассмотрим каждый из них подробнее.
3.2.1 Формат BMP (Bit MaP)
Этот формат является одним из самых простых способов представления растра. Кроме непосредственных данных по пикселям формат BMP фактически ничего не содержит. BMP использует цветовую схему RGB. Максимальные размеры растра по горизонтали и вертикали – до 216 - 1 пикселей. RGB-значения представляются в непосредственном виде, использование палитры не допускается (в расширенных модификациях допускается использование 256-цветной палитры). Диапазон значений по каждому из цветовых каналов – от 0 до 28- 1. Общее число цветов – 224 (режим TrueColor). Допустимы варианты кодирования цвета с 1, 4, 8, 16 бит на один пиксель [5]. Базовая версия данного формата не предусматривает компрессию изображения. Единственным допустимым режимом вывода изображения является вывод построчно слева направо, от верхних строк к нижним. Формат BMP обеспечивает максимальное качество изображения, так как в нем используется полноцветная (TrueColor) схема и изображение сохраняется без потерь качества, но в то же время, факт полного отсутствия компрессии обусловил крайне низкую эффективность данного формата с точки зрения сжатия. Кодирование и декодирование формата производится очень быстро по сравнению с другими популярными форматами. Поддерживается всеми известными средствами работы с графикой. Файлы формата BMP обычно имеют расширение .BMP; .ВМ; .RLE.
3.2.2 Формат PNG (Portable Network Graphics)
Формат PNG разрабатывался в качестве средства компактного представления «искусственной» и «естественной» графики в режиме среднего качества. Основной нишей применения PNG является представление графики в Интернете. В PNG используется цветовая схема RGB. Максимальные размеры растра по горизонтали и вертикали —до 232 - 1 пикселей. RGB-значения могут представляться либо в виде 256-цветной палитры (включая возможность представления в виде 256 оттенков серого), либо в виде полноцветного режима TrueColor. Современные расширения формата PNG поддерживают до 16 бит на каждый цветовой канал, что позволяет отображать до 248 различных цветов. При сжатии используется алгоритм LZ77, использующийся в программах-архиваторах [5]. Особенностью компрессии PNG является наличие сжатия последовательности данных о пикселях как по горизонтали, так и по вертикали. PNG при использовании полноцветного режима обеспечивает хорошее качество «естественных» изображений, но из-за отсутствия режима сжатия с потерями ему всё же сложно конкурировать с JPEG по степени их сжатия. Скорость декодирования сопоставима с соответствующими показателями формата BMP, а кодирование осуществляется заметно медленнее. Поддерживается большинством современных средств работы с графикой. Основным недостатком PNG является неудобство его использования для очень малых изображений (кнопок, иконок), так как палитра занимает в этом случае порядка 1 Кбайт, что соизмеримо с размером самого изображения. Файлы формата PNG обычно имеют расширение .PNG.
3.2.3 Формат TIFF (Tagged Image File Format)
Формат TIFF является одним из самых сложных растровых форматов. Изображение формата TIFF состоит из специализированных блоков данных, называемых тегами, каждый из которых определяется специфическим кодом тега. Теги хранят информацию об изображении. В спецификации формата файлов TIFF определено более 70 различных типов тегов. Изображение, закодированное в файле TIFF, полностью определяется его тегами, и этот формат файла легко расширяется, поскольку для придания файлу дополнительных свойств достаточно лишь определить дополнительные типы тегов. В большинстве программ для чтения файлов TIFF реализуется только подмножество тегов, именно поэтому созданный одной программой файл TIFF в ряде случаев не может быть корректно прочитан другой. TIFF использует различные цветовые схемы: RGB, LAB, CMYK и др. Максимальные размеры растра определяются из следующего соображения: произведение ширины на высоту (общее число пикселей в изображении) не должно превосходить 232. RGB-значения представляются как в непосредственном виде, так и с использованием палитры. Диапазон значений по каждому из цветовых каналов — от 0 до 28 - 1. Общее число цветов – 224 (режим TrueColor). Допустимы также варианты кодирования цвета с 1, 2, 4, 8, 16, 32 бит на один пиксель. Допускается компрессия с использованием ряда алгоритмов (самые распространенные – RLE и LZW, хотя могут быть и альтернативные –Deflate, JPEG и т.п.) [5]. Формат TIFF из-за своей открытости и расширяемости является популярным способом представления растровой графики. Эффективность кодирования и вычислительная сложность кодирования/декодирования зависит от выбора алгоритма компрессии и примерно совпадает с форматами, основанными на альтернативных алгоритмах компрессии. В этом формате поддерживаются такие чисто профессиональные возможности, как альфа-каналы и возможность сохранять несколько копий изображения с разным разрешением. Поддерживается большинством средств работы с графикой. Файлы формата TIFF обычно имеют расширение. TIF; .TIFF.
3.2.4 Формат JPEG (Joint Photographic Expert Group)
Этот формат, как и TIFF, также является довольно сложным способом представления растра и также состоит из отдельных блоков данных, именуемых маркерами, которые являются аналогами тегов TIFF. JPEG использует цветовую схему RGB. Максимальные размеры растра по горизонтали и вертикали – до 216 - 1 пикселей. RGB-значения представляются только в непосредственном виде, использование палитры не допускается. Диапазон значений по каждому из цветовых каналов – от 0 до 28-1. Общее число цветов –224 (режим TrueColor). Кроме полноцветного режима 24 бит/пиксел других видов кодирования не предусмотрено, за исключением изображения в оттенках серого (до 28 оттенков серого) [5]. Базовая версия предусматривает компрессию с потерями в сочетании с обычной компрессией. На этапе сжатия с потерями используется квантование, использующее дискретное косинусное преобразование, после которого применяется арифметическое кодирование или кодирование Хаффмана. Формат JPEG чаще всего используется для сохранения фотографий. В полноцветном режиме обеспечивается максимальная эффективность при незначительном ухудшении качества изображения по сравнению с оригиналом. Кодирование и декодирование JPEG производится медленнее всех других форматов, что обусловлено высокой сложностью компрессии/декомпрессии с потерями. Стандарт сжатия JPEG является самым распространённым и поддерживается всеми известными средствами работы с графикой. Полезной дополнительной возможностью является сохранении в теле JPEG-файла уменьшенной копии изображения, которая может быть выведена до получения основной части файла. При этом уменьшенная копия сама по себе может иметь практически любой формат (от BMP до JPEG). Стандарт JPEG хорошо пригоден для сжатия изображений в 30-40 раз. При более сильном сжатии качество резко падает. Файлы формата JPEG обычно имеют расширение .JPG; .JPEG; .JFIF.