на печать лифт (1189714), страница 5
Текст из файла (страница 5)
Развитие информационного пространства и коммуникаций приносит позитивные изменения в повышении доступности для людей, имеющим ограничения в здоровье, инженерной, транспортной и социальной инфраструктуры, более толерантное отношение общества к проблемам инвалидов в приоритетных сферах жизнедеятельности и их постепенное решение.
Понимая социальную значимость вопроса, в данной работе предлагается разработать лифтовое оборудование с совершенно новой системой управления учитывающей имеющиеся у инвалидов нарушения функций организма. Например, в настоящее время для слабовидящих и незрячих в лифтах на панели управления применяются кнопки со шрифтом Брайля. Однако сейчас по прежнему ориентация слепых и слабовидящих людей в лифтах затруднена, а иногда и вовсе невозможна без помощи посторонних. Современная наука достигла вершин прогресса в области голосовых систем управления. Если в функции управления добавить возможность использования голосовых команд для управления лифтом, то это сделает подъем на нужный этаж для инвалидов по зрению более комфортным, простым и быстрым. Инвалидные подъемники, оборудованные модулем распознавания речи с безупречно работающей с технической точки зрения системой голосового контроля движением, даст им дополнительную возможность вести независимый образ жизни.
При этом для снижения затрат при проведении возможных мероприятий по модернизации существующих лифтовых систем управления и при разработке новых систем управления лифтов и подъемников для инвалидов оборудованных модулями и интерфейсом с голосовым управлением требуется определить, в условиях поставленной задачи, комплектующие элементы с максимально низкой стоимостью аппаратно-программного технического решения.
3 РАЗРАБОТКА СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
3.1 Схема системы управления
В информационных технологиях конечный пользователь может работать с различными видами интерфейса, который в свою очередь играет важную роль в процессе эксплуатации технических объектов. Интерфейс пользователя (UI/userinterface) — интерфейс, обеспечивающий передачу информации между пользователем-человеком и программно-аппаратными компонентами компьютерной системы. Пользовательский интерфейс – это совокупность элементов, которые позволяют управлять работой технической системы и получать требуемые результаты. Другими словами это канал, по которому осуществляется взаимодействие пользователя с автоматической системой управления, посредством элементов взаимодействия. Элемент взаимодействия – это элемент пользовательского интерфейса, с помощью которого пользователь непосредственно взаимодействует с программным и аппаратным обеспечением системы. Различают активные и пассивные элементы взаимодействия. Пассивный элемент взаимодействия – это элемент пользовательского интерфейса, через который пользователь не имеет прямого доступа к системным или программным ресурсам, т. е. не может управлять или изменять эти ресурсы напрямую и непосредственно. К пассивным элементам взаимодействия относятся, например информационные сообщения и подсказки. Активный элемент взаимодействия – это элемент пользовательского интерфейса, через который пользователь имеет прямой доступ к системным и программным ресурсам с возможностью непосредственного управления и изменения их.
К активным элементам взаимодействия относятся команды управления системными настройками и программными ресурсами, средства конфигурации системы, команды работы с файловыми системами.
Согласно общепринятой классификации, существующие на практике интерфейсы можно разделить на следующие виды:
– командный интерфейс;
– графический интерфейс;
– SILK-интерфейс.
Интерфейс командной строки является одним из первых. Командный (командно-строчный) интерфейс получил наибольшее развитие во времена расцвета больших многопользовательских систем с алфавитно-цифровыми дисплеями. Он характеризуется тем, что пользователь осуществляет взаимодействие с ЭВМ посредством командной строки, в которую вводятся команды определенного формата, а затем передаются к исполнению. В настоящее время данный тип взаимодействия человека и вычислительной машины применяется редко.
Графический интерфейс является обязательным компонентом большинства современных программных продуктов, ориентированных на работу конечного пользователя. Основными преимуществами графического интерфейса являются наглядность и интуитивная понятность, а также общность интерфейса прикладных программ, написанных специально для функционирования в графической среде, т. е. пользователь, который освоил одно приложение, может легко и просто научиться работать с другими.
Наиболее часто графический интерфейс реализуется в интерактивном режиме работы пользователя. Работа пользователя осуществляется с экранными формами, содержащими объекты управления, панели инструментов с пиктограммами режимов и команд обработки. Графический интерфейс позволяет пользователю поддерживать различные виды диалога, который в данном случае представляет собой обмен информационными сообщениями между участниками процесса, когда прием, обработка и выдача сообщений происходит в реальном масштабе времени. Наиболее распространенными видами организации диалога являются:
– меню;
– шаблон;
– команда;
– естественный язык.
SILK-интерфейс (Speech, Image, Language, Knowledge — речь, образ, язык, знание).Это очень перспективное направление так как вводить информацию с помощью голоса – это самый быстрый и удобный способ. Его практическая реализация уже почти стала доминирующей в сфере коммуникаций, но еще не применяется повсеместно в бытовых устройствах. В этой технологии машина/устройство определяет для себя команды, анализируя человеческое поведение. При речевой технологии ввод данных производится голосом, путем произнесения специальных зарезервированных слов - команд. В биометрической технологии человек предстаёт как совокупность признаков поведения. При использовании так называемых систем машинного (компьютерного) зрения с помощью цифровой видеокамеры считывается картинка, а затем посредством специализированных программ распознавания образов из этого изображения выделяются команды. Также существует семантический интерфейс. Эта технология тесно связана с искусственным интеллектом и сходна со всеми подтипами SILK-интерфейса. Однако об этой технологии известно очень мало, в связи с важным военным значением этих разработок эти направления засекречены.
С развитием технологий и вычислительной микропроцессорной техники голосовое управление стало всё более распространённым, человек всё чаще пользуется преимуществами этой бесконтактной технологии. Использование ГИ имеет свои особенности и сложности. Система с голосовым управлением должна работать почти безошибочно, и стабильно реагировать на входные сигналы. Чтобы разработать автоматизированнцю систему управления с голосовым интерфейсом, необходимы междисциплинарные знания в информатике, лингвистике и психологии. Даже при наличии продвинутых средств разработки, создавая эффективный ГИ, нужно учитывать: какие задачи будет выполнять система, и на какую целевую аудиторию он ориентирован. Чем лучше ГИ будет подходить под когнитивную модель задания пользователя, тем легче будет его использовать без обучения или с минимальным обучением, что повысит его эффективность и степень удовлетворённости пользователей.
Наиболее важны особенности целевой аудитории. Создавая ГИ для широкой публики, требуется уделить особое внимание простоте использования и большому количеству инструкций/подсказок. Для определенной/специальной группы, следует больше думать о производительности, а не о вспомогательной информации. Такие приложения должны систематизировать обработку вызовов, минимизировать количество подсказок, устранить ненужные повторения. Таким образом, ГИ должен быть специально создан для конкретных технологических процессов, которые нужно автоматизировать. Разносторонние и многогранные запросы и операции сложнее автоматизировать. Голосовой интерфейс подойдёт не для каждого технологического процесса. Функции голосового управления хорошо подходят для обработки быстрых и однообразных операций.
Существуют два основных способа распознавания голосовых команд. Первый – это технология распознавание речи, не зависящая от разработчика. Такая система способна распознать любую речь любого пользователя. Это самые сложные в разработке и самые дорогостоящие системы. Их основным преимуществом является гибкость и адаптивность: способность приспосабливаются к характеристикам каждого нового пользователя. Уровень их сложности обусловлен разработками в области искусственного интеллекта. Системы распознавания непрерывного речевого сигнала работают с речевым потоком, в котором слова сливаются, т.е. не разделены паузой. Непрерывную речь обрабатывать гораздо сложней. На звучание каждой фонемы влияет звучание соседних фонем, а на начало и конец слов влияют предыдущие и последующие слова и скорость речи (с быстрой речью работать сложнее).
Второй способ – это распознавание устной речи, зависящее от разработчика, который должен сначала обучить систему командам, после чего она может функционировать. Такой способ в процессе идентификации команды находит в известном множестве контрольных фраз экземпляр, соответствующий текущей команде. Системы определения «изолированных» команд работают с дискретными словами. Это более простая форма распознавания, в этом случае легко определяется конец речевого сигнала, и произношение команды не затрагивает и не искажает другие слова. Поскольку в базе этих систем количество слов постоянно, то их проще проектировать. Размер базы/словаря в системе распознавания голосовых команд влияет на степень сложности и на требования, предъявляемые к процедурам обработки. Некоторые системы для работы используют всего несколько слов (например, только числа), а другие работают с очень большими словарями.
Голос является идеальным решением для реализации функций управления лифтом. Отсутствие различных кнопок и необходимости их нажимать существенно повышает удобство пользования как пассажирским, так и грузовым лифтом.
При построении автоматизированной системы управления лифтом с применением голосового интерфейса центральным и наиболее важным элементом является устройство регистрации и первичной обработки звукового сигнала. В результате процесса распознавания определяются команды пользователя, которые посредством цифрового интерфейса передаются на микропроцессорную платформу для последующей обработки. Программой выполняемой на микропроцессорном устройстве формируются информационные сообщения о полученных командах от пользователя для платы центрального контроллера ЦПУ. Далее в соответствии с алгоритмом взаимодействия голосового интерфейса и микропроцессорной системой управления лифтом определяются режимы работы лифта, и производится выполнение команд пользователя. Функциональная схема разработанной системы управления лифтом с применением голосового интерфейса представлена на рисунке 3.1.
Рисунок 3.1 – Функциональная схема автоматизированной системы управления пассажирским лифтом с голосовым интерфейсом.
Также дополнительно в системе может присутствовать, в качестве устройства отображения графического интерфейса, сенсорная панель (планшетный компьютер) для представления пользовательской информации и выполнения функций управления. Также компьютер может быть использован для реализации более сложных алгоритмов обработки голосовых команд и формирования соответствующих информационных сообщений для платы центрального контроллера ЦПУ. Связь и передача данных между модулем распознавания голоса, микропроцессором и компьютером осуществляется посредством цифрового интерфейса RS-485.
3.2 Определение состава системы управления
Основными элементами в составе системы управления являются микроконтроллер и устройство распознавания голоса.
В данной работе система управления голосовыми командами выполнена на базе модуля распознавания речи FZ0475 (Voicerecognitionmodule V3.1). Чип поддерживает голосозависимое распознавание на базе словаря, хранимого в постоянном запоминающем устройстве чипа (ROM, readonlymemory). Модуль с помощью методов цифровой обработки сигнала осуществляет преобразование, очистку и трансформацию аудио сигнала в цифровой формат данных и другие представления, выполняет фильтрацию шумовых сигналов, которые примешиваются к звуку при передаче акустических сигналов от воспринимающих устройств (микрофонов) или по сети[5]. Процесс распознавания голоса проходит в несколько этапов. На каждом из этапов для обработки речевого сигнала используется целый ряд различных методов. Процесс распознавания голоса можно разбить на три этапа:
- получение голосового сигнала и предварительная обработка речи;