Лесных (1219169), страница 2
Текст из файла (страница 2)
Исходя из этого, можно сказать, что образ - это описание объекта или процесса, позволяющее выделять его из окружающей среды и группировать с другими объектами или процессами для принятия необходимых решений.
Те категории объектов, которые мы хотим выделить или на которые хотим разделить все множество образов в процессе распознавания, обычно называют классами. Понятие класса в распознавании появилось существенно раньше, чем в объектных информационных моделях. И способ задания классов здесь определяется не столько сущностью предмета исследования, сколько особенностями имеющейся информации об объектах и способами ее представления [4].
Формальная постановка задачи распознавания выглядит так:
Дано множество M объектов ω. Объекты задаются значениями некоторых признаков , наборы которых одинаковы для всех объектов. Совокупность признаков объектов ω определяет некоторым образом его описание
. Признаки могут выражаться в терминах да/нет, да/нет/неизвестно, числовыми значениями, значениями из набора возможных вариантов и т.д.
На всём множестве M существует разбиение на подмножества:
Разбиение на классы может быть задано полностью (т.е. полной совокупностью информации, однозначно описывающей каждый класс) или определяться некоторой априорной информацией о классах
- например, характеристическим описанием входящих в них объектов.
Задача распознавания состоит в том, чтобы для каждого данного объекта ω по его описанию и априорной (обучающей) информации
вычислить значения предикатов
,
каждый из которых принимает истинное значение в том и только в том случае, когда объект ω принадлежит классу с номером i.
Для описания невозможности распознавания объектов предикаты заменяются величинами
.
Таким образом, для рассматриваемого объекта ω необходимо вычислить его информационный вектор
,
описывающий принадлежность данного объекта каждому из известных классов предметной области.
Процедура, строящая информационный вектор в данном случае выражает алгоритм принятия решения об отнесении объекта ω к тому или иному классу и называется «решающей функцией» [5].
1.4 Методы распознавания образов
Разбиение рассматриваемого множества объектов на классы может быть задано следующими способами.
Перечисление. Каждый класс задаётся путём прямого указания его членов. Такой подход используется в том случае, если доступна полная априорная информация о всех возможных объектах распознавания. Предъявляемые системе образы сравниваются с заданными описаниями представителей классов и относятся к тому классу, которому принадлежат наиболее сходные с ними образцы. Такой подход называют методом сравнения с эталоном. Его недостатком является слабая устойчивость к шумам и искажениям в распознаваемых образах.
Задание общих свойств. Класс задаётся указанием некоторых признаков, присущих всем его членам. Распознаваемый объект в таком случае не сравнивается напрямую с группой эталонных объектов. В его первичном описании выделяются значения определённого набора признаков, которые затем сравниваются с заданными признаками классов. При этом для каждого признака может задаваться требование либо к его наличию/отсутствию, либо к нахождению его числового значения в установленных пределах. Такой подход называется сопоставлением по признакам. Он экономичнее метода сравнения с эталоном в вопросе количества памяти, необходимой для хранения описаний классов. Кроме того, он допускает некоторую вариативность распознаваемых образов. Главной сложностью является определение полного набора признаков, точно отличающих членов одного класса от членов всех остальных.
Кластеризация. В случае, когда объекты описываются векторами признаков или измерений, класс можно рассматривать как кластер. Распознавание осуществляется на основе расчёта расстояния описания объекта до каждого из имеющихся кластеров. Если кластеры достаточно разнесены в пространстве, при распознавании хорошо работает метод оценки расстояний от рассматриваемого объекта до каждого из кластеров. Сложность распознавания возрастает, если кластеры перекрываются. Обычно это является следствием недостаточности исходной информации и может быть разрешено увеличением количества измерений объектов. Для задания исходных кластеров целесообразно использовать процедуру обучения [4].
1.5 Постановка задачи
Дан короткий звуковой образец. Проанализировав его, требуется определить фрагментом какого аудиофайла в базе данных он является.
В результате анализа звукового образца формируется "отпечаток". Руководящими принципами для атрибутов для использования в качестве отпечатков являются такие, которые должны быть локализованы во времени, не подвергаться преобразованиям, быть надежными и иметь достаточно хорошее распределение (энтропию). Были выбраны пики спектрограммы из-за их надёжности в присутствии шума и приблизительно линейной совпадаемости. "Отпечаток" представляет собой последовательность частот, соответствующим пикам спектрограммы аудиофайла через равные промежутки времени. Отпечаток от неизвестного образца сравнивается с большим набором отпечатков в базе данных. Кандидаты на соответствие впоследствии оцениваются на точное совпадение.
Для реализации метода применим данный алгоритм к небольшой базе музыкальных произведений – 100 аудиофайлов. В качестве инструмента анализа воспользуемся дискретным преобразованием Фурье. Главные требования к реализации:
а) надежность;
б) быстродействие.
Также требуется определить минимальную длину звукового образца, необходимого для распознавания, а также выбрать частоту дискретизации. Для этого создадим тестовую выборку и подберем оптимальные значения.
2 Цифровая обработка сигналов
2.1 Дискретные и цифровые сигналы
Цифровая обработка сигналов, т. е. обработка сигналов с помощью средств электронной вычислительной техники, стала известна около 50 лет назад. Электронные вычислительные машины тогда были дороги и несовершенны и поэтому их применяли лишь в сложных радиокомплексах, например, при расчете координат и траекторий объектов в радионавигационных системах и станциях слежения за космическими объектами, при расчете координат цели в радиолокационных станциях. Это были первые области применения цифровых устройств для обработки сигналов. В последующие годы благодаря широкому применению транзисторов, а затем и развитию микроэлектроники электронные вычислительные машины стали совершеннее, дешевле, а главное, компактнее. Появилась возможность использования вычислительной техники не только в крупных радиокомплексах, но и в сравнительно простой аппаратуре, например специальных радиоприемниках, системах фазовой автоподстройки частоты, системах телеметрии и т. д. Были разработаны устройства для цифровой обработки сигналов, заменяющие практически любые аналоговые устройства: полосовые радиофильтры, системы автоматической подстройки частоты и фазы, амплитудные, частотные и фазовые детекторы, преобразователи частоты и др. Разработаны радиоприемники, в которых осуществляется полная цифровая обработка сигналов. Обработку сигналов с помощью цифровой вычислительной техники теперь используют при автоматическом регулировании процессов в промышленности, на транспорте и даже в бытовой аппаратуре. Такое широкое распространение цифровых методов обработки сигналов определяется большими возможностями цифровой техники. С помощью цифровых устройств можно реализовать очень сложные алгоритмы обработки сигналов, которые трудно, а часто даже невозможно реализовать, используя обычную аналоговую технику. Алгоритм обработки сигналов можно изменять в зависимости от характера входного сигнала [6].
Следовательно, легко построить самонастраивающуюся (адаптивную) систему. Цифровые фильтры могут анализировать параметры сигнала и принимать те или иные решения, например, вырабатывать управляющие команды. Иными словами, с помощью цифровых методов можно реализовать любой алгоритм обработки сигнала, который может быть описан совокупностью арифметических и логических операций.
Любая система цифровой обработки сигналов независимо от ее сложности содержит цифровое вычислительное устройство – универсальную цифровую вычислительную машину, микропроцессор или специально разработанное для решения конкретной задачи вычислительное устройство.
Сигнал, поступающий на вход вычислительного устройства, должен быть преобразован к виду, пригодному для обработки на ЭЦВМ. Он должен иметь вид последовательности чисел, представленных в коде машины.
В некоторых случаях задача представления входного сигнала в цифровой форме решается сравнительно просто. Например, если нужно передать словесный текст, то каждому символу (букве) этого текста нужно поставить в соответствие некоторое число и, таким образом, представить передаваемый сигнал в виде числовой последовательности. Легкость решения задачи в этом случае объясняется тем, что словесный текст по своей природе дискретен. Однако большинство сигналов, с которыми приходится иметь дело в радиотехнике, являются непрерывными. Это связано с тем, что сигнал является отображением некоторого физического процесса, а почти все физические процессы непрерывны по своей природе [7].
Рассмотрим процесс дискретизации непрерывного сигнала на конкретном примере. Допустим, на борту некоторого космического аппарата производится измерение температуры воздуха; результаты измерения должны передаваться на Землю в центр обработки данных. Температура воздуха измеряется непрерывно; показания датчика температуры также являются непрерывной функцией времени (рисунок 1, а). Но температура изменяется медленно, достаточно передавать ее значения один раз в минуту. Кроме того, нет необходимости измерять ее с точностью выше чем 0,1 градуса. Таким образом, вместо непрерывной функции
можно с интервалом в 1 мин передавать последовательность числовых значений (рисунок 1, г), а в промежутках между этими значениями можно передавать сведения о давлении, влажности воздуха и другую научную информацию.
Рисунок 1 – Виды сигналов
Рассмотренный пример показывает, что процесс дискретизации непрерывных сигналов состоит из двух этапов: дискретизации по времени и дискретизации по уровню (квантования). Сигнал, дискретизированный только по времени, называют дискретным; он еще не пригоден для обработки в цифровом устройстве.
2.2 Выбор частоты дискретизации
В результате первого этапа непрерывный сигнал заменяется дискретными отсчетными значениями, взятыми через определенные интервалы времени. Очень важен правильный выбор интервала дискретизации. Если отсчеты сигнала брать слишком редко, то быстрые изменения, скачки дискретизируемого сигнала могут остаться незамеченными. Если отсчеты брать слишком часто, то это исключит ошибки, но будет неэкономно, так как придется передавать слишком много значений сигнала. Задача о выборе интервала дискретизации наиболее просто решается для сигналов с ограниченным спектром на основании теоремы Котельникова, или теоремы отсчетов. В соответствии с теоремой Котельникова непрерывный сигнал , в спектре которого не содержится частот выше
, полностью описывается выборочными значениями
, отсчитанными через интервалы времени
. Аналитически это выражается в виде ряда Котельникова [8]