Круг П.Г. Моделирование искусственных нейронных сетей (1088802), страница 3
Текст из файла (страница 3)
Распознавание речи
Распознавание речи – одна из наиболее популярных областей применений нейронных сетей.
Демонстрационная система для дикторо-независимого речевого управления встроенным калькулятором Microsoft Windows (Российская компания Нейропроект) способна распознавать 36 команд, сказанных в стандартный микрофон. Для классификации слов используется двухкаскадная иерархическая нейронная сеть, где первый каскад состоит из одного персептрона (1000 входов, 24 нейрона в скрытом слое, 6 выходов), а второй каскад – из 6 персептронов с различными параметрами слоев.
При этом первый персептрон осуществляет грубое распознавание слова, относя его к одному из шести классов. Роль второго каскада – точно классифицировать команду внутри класса. Для построения данной нейронной сети используется библиотека NeuroWindows, а также специальный алгоритм иерархического обучения. В обучении сети принимали участие 19 дикторов.
1.3. Распознавание символов
Распознавания букв и символов, с одной стороны – одна из наиболее разработанных и освещенных в специальной литературе проблем, а с другой – не смотря на кажущуюся простоту, чрезвычайно трудно реализуемая на практике задача.
Рассмотрим особенности применения нейронной сети (компания AT&T Bell Laboratories) при сортировке писем на почте в г.Буффало, США.
Задача состоит в применении нейросетевых методов при разработке системы распознавания рукописных цифр, которые отправители писем указывали на конвертах в качестве индекса. Исследовались две строчки индексов: первые – написанные быстро и, как правило, неразборчиво, и вторые – написанные более тщательно печатными буквами. Разработчики наполнили базу данных более 9000 символами, переведенных с конвертов, которые прошли через почтовую службу г.Буффало в 1988 (рис.1.2).
Рис.1.2. Рукописные индексы, обрабатываемые почтовой службой г. Буффало (сверху) и взятые из них отдельные изолированные цифры (снизу)
Показаны некоторые почтовые индексы (вверху) и уже изолированные цифры, подготовленные для распознавания (внизу). Видно, что индексы пишутся крайне неразборчиво, так, что сотрудники почты считают, что некоторые отправители в действительности не желают, чтобы их письма доходили по назначению. В связи с этим, к сожалению, большинство подобных систем распознавания имеют точность 95%, что является едва приемлемым показателем.
В целом ряде случаев, наиболее трудная проблема при распознавании символов – не собственно распознавание, а обнаружение символов и выяснение их местоположения, т.е. – верная интерпретация индекса, состоящего из известного количества позиций, изолирование и подготовка к распознаванию отдельных цифр индекса. Поэтому для простоты будем полагать далее, что процесс распознавания начинается уже после изолирования цифры. Для каждой цифры разработчики строили решетку (сетку) размерностью 16×16 пикселей. В ходе исследований в 1988 г. было выяснено, что применение стандартного подхода, основанного на применении обученной ИНС обратного распространения к сырому массиву пикселей и чисел, приемлемого результата не дает.
В 1988–1990 гг. был предложен метод локализации информативных участков, вокруг которых строились решетки 5×5 и 7×7 пикселей, после чего на вход ИНС обратного распространения поступал 180-мерный вектор. Конечная нейросетевая система распознавания представляет собой аппаратный модуль, реализованный на базе ПЦОС и соединенный с ПК. Обучение нейронной сети системы проводится единожды, однако, достаточно медленно с использованием 167693 представительских выборок. Ошибка системы в процессе распознавания символов – 0,14% при предъявлении обучающей пары из набора представительских выборок, использованной при обучении, и 5% при распознавании «новых» символов. Таким образом, разработчики и пользователи приняли решение о приемлемости результатов и необходимости использования системы для предварительной сортировки конвертов.
1.4. Искусственный нос
Принцип действия искусственного носа
Среди пяти чувств, чувство запаха наиболее загадочное.
Человеческий нос стал объектом исследования ученых и инженеров, специализирующихся в области высоких технологий и пытающихся понять, как нос функционирует. Такой повышенный интерес к обонятельной системе человека возник в связи с последними достижениями в области проектирования электронного (искусственного) носа. В классическом понимании электронный нос представляет собой мультисенсорное цифровое устройство, предназначенное для анализа содержимого воздушной среды путем классификации запахов.
Несмотря на то, что электронный нос сегодня не способен заменить человеческую обонятельную систему, сфера применения данной технологии достаточно широка.
В производственных целях возможности обонятельной системы человека широко используется во многих странах, например, для проверки различных продовольственных продуктов. Тренированный человеческий нос, детально изучив запахи продовольственных продуктов, таких, например, как зерно, сыр, вино, водка, рыба, способен в последствие определять их качество и свежесть. Аналогичным образом «нюхачи» оценивают перспективность того или иного парфюмерного запаха, обнаруживают фальсифицированные духи и дезодоранты. Запахи учитываются также и докторами при выявлении общих заболеваний: такие болезни, как пневмония или диабет, вызывающие специфическое дыхание или жидкие выделения с характерными запахами, могут быть замечены квалифицированными врачами.
Если искусственный интеллект электронного носа окажется способен классифицировать запахи подобным образом, то тогда электронный нос смог бы справится с той же работой, причем гораздо лучшим образом. Проблема в том, что человеческая обонятельная система чрезвычайно субъективная: зачастую, разные люди по-разному реагируют на запахи. Электронный нос решает эту проблему, наверняка устанавливая «стандарт» для каждого требуемого запаха, например, строго определяя запах испорченного зерна.
В настоящее время различные прототипы электронного носа уже широко используются в промышленности. В частности, в агрокомплексе Швеции электронный нос применяется для независимого контроля качества зерна путем автоматической классификации проб зерна на кондиционное и испорченное (достоверность – 90 %).
Другие проблемно-ориентированные разновидности электронного носа позволяют контролировать испарения вредных для здоровья химических, в том числе аллергических, веществ.
Привлекательность использования электронного носа в этих целях заключается в следующем:
-
обнаружение тех или иных компонент носит объективный, а не субъективный характер;
-
собственно процесс обнаружения токсичных веществ путем вдыхания воздуха через нос может быть вреден;
-
некоторые химические вещества и комбинации веществ, которые легко обнаруживаются электронным носом, в традиционном понимании могут не иметь запаха;
-
электронный нос способен функционировать в местах, где не может функционировать человеческий, например, в условиях крайне высоких и низких температур, внутри тела человека, в масляных или бензиновых резервуарах, в сточных трубах, на космических спутниках и т.д.
Для понимания принципа действия электронного носа, уточним, каким образом возникает запах: иногда его создает какое-либо одно химическое вещество, но чаще – комбинация множества различных химических компонент. Например, запах кофе формируют сотни различных молекул. Электронный нос должен реагировать на определенную концентрацию требуемых молекул и их комбинаций.
Существуют два принципиально разных подхода к реализации электронного носа:
-
с использованием методов газовой хроматографии и масс-спектрометрии;
-
с использованием ИНС.
Однако применение методов хроматографии и масс-спектрометрии, в отличие от нейросетевых методов, не позволяет регистрировать запахи, а лишь присутствие тех или иных отдельных химических компонент. Поэтому, хроматографы и масс-спектрометры могут называться электронным носом лишь условно.
Достоинства использования нейросетевого подхода следующие:
-
Применение ИНС позволяет отказаться от использования редких и дорогостоящих сенсоров. Используется, как правило, мультисенсорная комбинация («головка» или матрица), состоящая из набора (от 5 до 15) слабоселективных доступных по цене химических сенсоров.
-
ИНС способны обнаруживать большее количество химических компонент, чем количество сенсоров нейросетевой системы.
-
Продолжительность измерений существенно короче. Следует отметить, что временные затраты меньше как на собственно регистрацию, так и на этапы подготовки и обработки измерений.
Говоря о недостатках использования нейросетевого подхода, можно упомянуть о необходимости предварительной настройки электронного носа на требуемые запахи (подготовки базы данных «стандартов» запахов), выражающейся, в частности, в предварительном обучении ИНС.
Далее, под электронным носом будем подразумевать интеллектуальные системы, реализованные на основе ИНС.
Аппаратура искусственного носа
Электронный нос состоит из двух основных функциональных частей (рис.1.3): мультисенсорного измерительного модуля и интеллектуального цифрового блока.
Содержание кислорода в воздушной среде изменяется из-за присутствия в ней определенных химических веществ. Содержание кислорода, в свою очередь, изменяет выходное напряжение сенсора, которое измеряется как разность между текущим значением и нормальным (или стандартным) уровнем. Аналоговый сигнал затем преобразовывается АЦП в цифровой код, готовый для дальнейшей цифровой обработки. Измерительный модуль содержит аналоговый или цифровой препроцессор агрегирующий, а также усиливающий измерительный сигнал для уменьшения шума и «повышения» чувствительности сенсора.
Интеллектуальный цифровой блок (в частности ПК) регистрирует сигналы, поступившие от всех сенсоров, и формирует исследуемый вектор.
На этапе предварительной настройки электронного носа производится обучение ИНС путем установления «стандартов» для каждого требуемого запаха. Процесс обучения производится путем предъявления ИНС представительских выборок, состоящих из входного и выходного вектора нейронной сети. Роль входного вектора играет исследуемый вектор, сформированный из результатов измерений. Размерность выходного вектора соответствует количеству запахов, которые электронный нос должен распознать.
На этапе тестирования определяется насколько ИНС качественно обучилась, а электронный нос способен достоверно распознавать предъявляемые ему запахи.
Рис.1.3. Принцип действия искусственного носа
Этапы предварительной настройки и тестирования, как правило, итерационные – если результат предварительной настройки не устраивает потребителя, то осуществляются необходимые изменения и настройка повторяется заново.
Пример реализации искусственного носа
Рассмотрим в качестве примера один из зарубежных прототипов электронного носа (рис. 2.3). Данная система, реализованная в одном из университетов Великобритании в учебных целях, предназначена для автоматического определения запахов ряда изделий пищевой, бытовой и офисной химии, таких как ацетон, аммиак, изопропанол, белый «штрих» и уксус.
Мультисенсорная «головка» сформирована из девяти недорогих газовых сенсоров компании Figaro Co. Ltd. (сенсор 1 – TGS 109; сенсоры 2 и 3 – TGS 822; сенсор 4 – TGS 813; сенсор 5 – TGS 821; сенсор 6 – TGS 824; сенсор 7 – TGS 825; сенсор 8 – TGS 842; сенсор 9 – TGS 880), а также датчика влажности (сенсор 10 – NH-02) и двух датчиков температуры (сенсоры 11 и 12 – 5KD-5).
Датчики влажности и температуры встроены в «головку» для контроля условий проведения измерительных экспериментов, и их показания также включены в исследуемый вектор.
Хотя каждый из газовых сенсоров изначально был задуман и создан как моноселективный (т.е. для реагирования на вполне конкретный химический компонент), каждый из них, в силу своей конструкции, реагирует на широкий ряд химических веществ.
При этом, те или иные комбинации показаний всех сенсоров «головки» являются уникальными, и, следовательно, могут указывать на присутствие самых разных химических веществ и их комбинаций.
На этапе предварительной настройки ИНС предъявляются показания сенсоров (входной слой) и указываются химические вещества, которые этим показаниям соответствуют (выходной слой).
Таким образом, на данных представительских выборках ИНС обучается обнаруживать предъявленные настройщиком химические вещества.
Интеллектуальный цифровой блок данного прототипа реализован на основе ПК (рис.1.4).
Следует отметить, что быстродействие электронного носа ограничивается практически лишь временем отклика химических сенсоров, что соответствует единицам секунд.
Рис.1.4. Внешний вид прототипа искусственного носа
Рис. 1.5. Структура нейронной сети обратного распространения, используемой в искусственном носе