Диссертация (1172947), страница 16
Текст из файла (страница 16)
Представимизображения лиц в качестве многомерных случайных величин x1 и x2 снормальным распределением. Рассмотрим две гипотезы:H1 = {центр кластера (x1) и входное изображение (x2) соответствуют одномучеловеку};H2 = {центр кластера (x1) и входное изображение (x2) соответствуют разнымлюдям}. Тогда воспользовавшись оценкой апостериорного максимума, можнорассматривать логарифм отношения функций правдоподобия как меру сходствадвух изображений:r(x1,x2) = log(P(x1 - x2/ H1)/ P(x1 - x2/ H2)).(3.1)Синхронизацию данных в центральных и локальных системах предлагаетсяосуществлять следующим образом. В заданные промежутки времени необходимосинхронизировать: информацию о фактах регистрации физических лиц, в частности центркластера из ЛБД, который лучшим образом отображает лицо человека; общий каталог, т.е.
общий вектор пребываний.В ЛБД содержится информация о распознавании лиц и значения случайныхвеличин пребываний. Информация о распознавании сгруппирована в кластеры(один человек – один кластер). Таким образом, синхронизация будет выглядетьследующим образом:1. ЦБД не заполнена. Тогда из любой ЛБД:a. копируются информация об идентификационных документах и центровкластеров. Таким образом, будет скопирована информация которая лучшимобразом отображает лицо человека;b. для каждого кластера из ЛБД копируются значения общего векторапребывания в ЦБД.2. ЦБД заполнена.
Тогда для ЛБД, которые не синхронизированы на вход ядруидентификации ЦБД подаются центры кластеров из ЛОП. Центры кластеров изЛОП сравниваются с центрами кластеров из ЦОП:102a. если уровень доверия выше заданного порога, то считается, что двакластера представляют одно физическое лицо. Согласно идентификатору этогофизического лица, сохраняются значения общего вектора пребывания;b. если уровень доверия ниже заданного порога, то считается, чтофизическое лицо, которое характеризует кластер из ЛБД, не представлен в ЦБД.Тогда копируется среднее значение кластера и значение общего векторапребываний в ЦОП и ЦБД соответственно.ПриводимыеархитектураИАСиалгоритмхраненияинформациисоответствует выводам второй главы.
Число записей на обработку будетсокращено в десятки раз, следовательно, время обработки изображениясократится.Одним из перспективных направлений является проведение расчѐтов попоиску средних значений для каждого из кластеров не в момент поступлениянового изображения, а в тот момент, когда ИАС не «занята». Такой момент можетнаступить во время визуальной обработки данных оператором, либо поокончании выдачи данных из ЦБД в локальные БД.3.2 Структура и организация хранилища системы поддержкиуправленияДалее представлена модель хранения информации в базах данных ИАС.Хранилище ИАС построено на распределенной сетевой архитектуре, состоящейиз центральных БД (ЦБД) и локальных БД (ЛБД). Хранилище ИАС позволяетсвоевременно оповещать оператора о личности человека на объекте и его степениопасности.Предметной областью является объект с достаточно высокой плотностьючеловеческого потока.Сохраняемая информация об интересантах включает в себя следующиекатегории самостоятельных материалов:1) запись с видеокамер;2) изображение и математический шаблон лица;1033) информацияобэмоциональномсостоянии,поведении,уровнепсихологической напряженности и других психофизиологических показателяхинтересанта;4) данные о дате и времени регистрации интересанта;5) информация об адресе и месте установки видеокамер;6) идентификационная информация об интересанте;7) информация о запрашиваемых оператором данных об интересанте.Приведенные категории информации составляют основу информационнойединицы хранения (далее - ИЕХ).ИЕХ используют в практике построения БД в случаях, когда необходимоустановить соответствие с объектами хранения, имеющими сложную структуру.База данных должна быть ориентирована на высокую скорость записизначительного количества информации.
Поэтому к ней необходимо предъявлятьследующие требования:1) ориентированность на высокую скорость записи в БД;2) высокая скорость решения аналитических задач;3) масштабируемость;4) запрет изменения данных после обработки и сохранения.Рассмотрим подходы к построению архитектуры хранилища:1) централизованноехранениевсехданных.Единственноеобщеехранилище данных о людях, их местах пребывания и метаданных, используемыхпри распознавании;2) распределенное хранение данных.
Данные олюдях, ихместахпребывания и служебная информация хранятся в наборе ЛБД.Каждыйподходимеетопределѐнныепреимуществаинедостатки,рассмотрим их.Централизованное хранение предусматривает, что данные хранятся на одномузле. Главное преимущество заключается в простоте архитектуры.
Пользователюкомплексадляполученияинформацииинициировать запрос в одну БД.офизическомлицедостаточно104Преимущества данного метода:1) минимизировано использование сетей при запросах оператора комплекса.Благодаря такой архитектуре, время пересылки информации о видеофиксациифизических лиц минимизировано;2) простота запросов на предоставление информации о видеофиксациифизических лиц. Запросы упрощаются за счѐт того, что нет необходимостизапрашивать информацию из различных источников;3) отсутствует необходимость хранения информации о ЛБД, в которойсодержится информация о месте видеофиксации физического лица. При запросеинформации о местах видеофиксации по фотографии отсутствует необходимостьобращения в различные ЛБД, например, аэропорта или вокзала.Недостатки:1) высокое использование сетей при запросах ЯИ различных мест массовогоскопления людей;2) большая нагрузка на одну БД.
В результате ЯИ различных мест массовогоскопления людей будет сохранять информацию в одной БД. Безусловно, сбольшим количеством мест массового скопления это приведет к превышениюверхнего порога числа записей;3) критическая зависимость от одной БД. Комплекс полностью зависим отодной БД. В случае сбоя ее функционирования, комплекс становится полностьюнеработоспособен.Распределенное хранение данных предусматривает, что данные хранятся вбазах данных разных узлов. Очевидным недостатком такого подхода являетсясложность построения и реализации.Преимущества:1) независимостьработоспособностиЛБДодногоузлаотработоспособности ЛБД другого узла;2) минимизировано использование сетей при запросах ЯИ. ЯИ будетобращаться и сохранять информацию в своей собственной БД. Эта БД можетнаходиться на том же сервере, что и ЯИ.105Кроме хранения метаданных, используемых при распознавании, возникаетзадача хранения значений случайной величины пребываний ξ в адресномпространстве, то есть информации о времени и месте видеофиксации, а такжецентрализованного доступа к этой информации с целью эффективного решенияаналитических задач.
Для хранения значений случайной величины, необходимосохранять следующую информацию: идентификатор физического лица; адрес видеофиксации физического лица; время видеофиксации.Значения случайных величин будут храниться в каталоге (далее − каталог).Рассмотрим полный каталог. В данном каталоге будут храниться значения всехслучайных величин со всех узлов (далее − полный каталог).Рассмотрим возможные варианты хранения каталога:1) центральное хранение. Единственный полный каталог хранится наотдельном центральном узле. Данный метод хранения данных упрощает запросыоператора комплекса к БД. Для запроса информации о местах видеофиксациипользователю достаточно создать запрос на обращение к каталогу в некой ЦБД.Однако появляется зависимость от центрального узла;2) полная репликация.
Полный каталог хранится на каждом узле. Длязапроса информации о местах видеофиксации пользователь комплекса можетобратиться к любому узлу с ЛБД. Однако будут использоваться дополнительныересурсы сети и сервера на синхронизацию данных во всех узлах;3) частичное секционирование. Каждый узел поддерживает собственныйкаталог.Полныйкаталогпредставляетсобойобъединениевсехэтихнепересекающихся локальных каталогов.
Такая структура неэффективная с точкизрения того, что оператору комплекса при запросе мест видеофиксацийнеобходимо будет производить опрос ЛБД всех мест массового скопления людей.В случае большого количества ЛБД, этот запрос будет выполняться за достаточнобольшой промежуток времени. Кроме того, запрос будет создавать лишнюю106нагрузку на ЛБД, в которых нет информации, удовлетворяющей критериямзапроса;4) комбинированное хранение.
На каждом узле поддерживается свойлокальный каталог. Кроме того, отдельный центральный узел хранит каталогподвекторов случайной величины пребываний.Рассмотримболееподробнокомбинированнуюструктурухранениякаталога. В локальных базах данных хранится каталог значений случайныхвеличин пребываний ξj = ξj (a, t), а именно следующие значения: идентификатор физического лица (значение параметра j); адрес видеофиксации физического лица в рамках локального местамассового скопления людей (значение параметра а); время видеофиксации (значение параметра t).На ЦБД в общем каталоге хранится округленные значения начальных иконечных координатподвектора ξjk = ((ajk1,tjk1),.. (ajkv,tjkv)) вектора случайнойвеличины пребываний ξj, (далее − общий вектор пребываний), а именно: идентификатор физического лица (значение параметра j); адрес места массового скопления людей (Аэропорт «Домодедово»,«Савеловский вокзал»), в котором состоялась видеофиксация физического лица(округленное значение параметра ajk = (ajk1≈… ≈ajkv)); время первой видеофиксации (значение параметра tjk1); время последней видеофиксации (значение параметра tjkv).На основании вышеизложенного, предлагается распределенная архитектурахранения данных с комбинированной структурой хранения каталога случайнойвеличины пребываний.Рассмотрим особенности предложенной системы:1)простота аналитических запросов на предоставление информации овидеофиксации физических лиц.
Запросы упрощаются за счѐт того, что нетнеобходимости запрашивать информацию из различных источников;1072)аналитические запросы пользователей комплекса не создают нагрузкуна ЛБД;3)минимизировано использование сетей при запросах операторакомплекса. Благодаря такой архитектуре, время пересылки информации означениях случайной величины присутствия минимизировано;4)ЯИ не запрашивает информацию из центрального сервера и неиспользует сеть, как в случае с централизованным хранением всех данных;5)комплекс устойчив к неработоспособности серверов с общимкаталогом, а именно в случае сбоя на центральном сервере с общим каталогом,запрос может быть выполнен параллельно на удаленных серверах с локальнымикаталогами;6)отсутствует необходимость хранения информации о ЛБД, в которойсодержится информация о месте видеофиксации физического лица.Таким образом, сохраняются все преимущества централизованного храненияданных и нивелируются недостатки.Далее рассматривается реализация заявленных характеристик храненияинформации в виде структур БД.