Адаптивная обработка каллиграфической информации, представленной в виде рукописных символов (1025037), страница 2
Текст из файла (страница 2)
Н.И. Пирогова Минздравсоцразвития Россиибыло отмечено ускорение восстановления мелкой моторики и улучшениепоказателей высших психических функций пациентов. Вынесено заключение оцелесообразностиприменениясистемывкомплекснойпрограммереабилитационных мероприятий пациентов с острым нарушением мозговогокровообращения.По результатам опытной эксплуатации обучающей системы в учрежденияхдошкольного и среднего образования г.
Москвы для обучения письму младшихшкольников было сделано заключение о ее эффективности при обучении письмуи тренировке почерка учеников. Экспертные оценки на основании проведенныхисследований с использованием экспертных панелей и метода среднихарифметических рангов составили от 8,5 до 10 баллов по десятибалльной шкале.Полученные результаты использованы в учебном процессе по перспективнымпедагогическим технологиям в Калужском государственном университете им.К.Э. Циолковского, что позволило разработать перспективные методикипостановки руки в процессе обучения письму посредством комплексныхупражнений с элементами развития почерка и мелкой моторики рук.Апробация работы была проведена на научных семинарах кафедрыпроектирования и технологии производства электронной аппаратуры ФГБОУВПО МГТУ им. Н.Э.
Баумана (Москва, 2010-2014 гг.), IV Всероссийскомконкурсе молодых ученых (Москва, 2012 г.), Третьей международной научнотехнической конференции Аэрокосмические технологии (Москва, 2014 г.), Перваямеждународная научная конференция «Научное развитие в европейских странах:новые концепции и современные решения» (Штутгарт, 2013 г.), десятоммеждународном симпозиуме INTELS'2012 (Вологда, 2012 г.), Молодежнойнаучно-технической конференции «Наукоемкие технологии и интеллектуальныесистемы» (Москва, 2010 г.).Система«Электроннаяпропись»зарегистрированавРоспатенте(Свидетельство о регистрации программ для ЭВМ №2008611676).Публикации.
Основные результаты работы опубликованы в 11 научныхработах в ведущих рецензируемых журналах, из них 3 в журналах,рекомендованных ВАК при Министерстве образования и науки РФ дляпубликации результатов диссертаций.Структура и объем работы. Диссертационная работа состоит из введения,четырех глав, заключения и списка литературы.
Общий объем работы 150страниц, включая 76 иллюстраций, список литературы и приложения.Библиография содержит 67 наименований, из них 4 из иностранных источников.4КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИВо введении обосновывается актуальность решения поставленных вдиссертации задач, сформулирована цель и задачи исследования процессовраспознавания рукописных данных и методик улучшения качества письма,обоснована научная новизна, показана практическая значимость реализациисистем анализа каллиграфии рукописных символов.В первой главе исследованы принципы и особенности построения системраспознавания образов и методики обработки каллиграфической информации ианализа почерка.
Проведена постановка задачи. Рассмотрены методыпредставления рукописных символов в электронном виде. Введено точноепонятие образа и математическое представление образа.В общей структуре системы распознавания рукописных данных можновыделить три подсистемы (Рисунок 1): подсистема извлечения признаков,подсистема распознавания и подсистема принятия решения о принадлежностиобъекта к определенному классу.Рисунок 1. Система распознавания рукописной информацииРазработка системы ввода текста, её тестирование и отладка, невозможна безсоздания базы данных символов, в общем случае состоящей из:- графического описания символов с учетом направления движения пера и егоотрывов;- графического описания символов с учетом только направления движенияпера;- графического описания символов с учетом только внешнего вида и величиныотклонения от эталона.Открытых баз описания символов (букв) русского алфавита не существует,поэтому при разработке системы ввода рукописного текста приходится создаватьи наполнять собственную базу символов.В основе методов распознавания символов лежат способы их описания.
Срединих можно выделить две группы:5- описание базовых форм символов в виде структурных компонентов (отрезки,дуги, выпуклости, вогнутости, пересечения, концы и т.п.) и их соотношений;- описание диапазона изменений структурных компонентов.Описание базовой формы символа в виде списка структурных компонентов сописанием таблицы диапазонов изменений составляет эталон этого символа.Таким образом, каждый входной символ представляется базовыми формами, азатем находится наилучшее совпадение входного символа и эталона из базыданных.Система ввода рукописной символьной информации обычно реализуется ввиде программно-аппаратного комплекса, выполняющего следующие функции:считывание рукописного текста; распознавание вводимых символов; формальнологический и словарный автоматический контроль распознанной информации;выдача распознанной информации; предоставление возможности ручнойверификации данных; запись обработанной информации в необходимом форматеи ее хранение.
Для решения задачи коррекции письма в системе должен бытьпредусмотрен анализ качества письма и выдача рекомендаций по его повышению.Классификация методов распознавания может базироваться на разныхпринципах. На Рисунке 2 показана классификация, выделяющая методыраспознавания отдельных символов и их упорядоченных наборов.Рисунок 2.
Методы распознавания рукописных данныхПроведенный анализ алгоритмов и методов обработки рукописных текстовпоказал, что для обработки каллиграфической информации рукописных текстовможет быть использован рандомизированный алгоритм стохастическойоптимизации (РАСА), предложенный в работах О.Н. Граничина, Б.Т. Поляка и др.в 80-х годах XX века. Метод применяется для оперативного распознаваниярукописных символов, представленных в форме вектора признаков; являетсясамообучающимся алгоритмом, отличающимся свойством адаптивности ивысокой помехоустойчивостью.Алгоритм РАСА был положен в основу математической модели дляобучающей системы, позволяющей проводить обработку, визуализацию ипреобразование каллиграфической информации и формировать навыкикаллиграфии на основе адаптивных методов обучения с применениемспециальной библиотеки упражнений.6Современные системы оптического распознавания имеют более низкуюточность распознавания символов для рукописных текстов по сравнению спечатными текстами, из-за сложности их структурных характеристик, включаякаллиграфию.
Поэтому актуальной задачей, решенной в работе, было повышениеточности обработки рукописных текстов при одновременном снижении потерькачества и данных.Во второй главе разработаны математические методы и моделираспознавания рукописных образов.Исследованы алгоритмы распознавания почерка в автономном и оперативномметодах распознавания. Выполнена реализация алгоритма распознаваниярукописного текста в рамках оперативного метода распознавания наперсональном компьютере с использованием сенсорного устройства вводаграфической информации (планшет).
Разработан алгоритм векторизациирукописных данных на основе преобразования группы точек, лежащих на однойпрямой в вектора.Определен круг задач, которые необходимо выполнить для реализацииобучающейсистемы,позволяющейобрабатыватькаллиграфическуюинформацию:- исследование методов получения образов почерка в реальном времени: приполучении образов почерка в реальном времени можно напрямую считыватьтраекторию движения пера, его скорость, остается только векторизовать кривую исравнить с эталоном для распознания и анализа;- разработка алгоритмов для проведения распознавания образов;- разработка программного обеспечения для обработки рукописных символов,включающая следующие этапы: разработку удобного для пользователяинтерфейса, обеспечение совместимости со всеми устройствами ввода; написаниепараллельной версии, удобной и понятной для детей;- введение эталонов написания букв различных языков – для этого необходиморазработать эталоны написания прописных букв для различных языков;- разработка алгоритмов определения причин неправильного письма, подборнеобходимых рекомендаций для улучшения навыков письма;- внедрение разработанных устройств в уже существующие системыобразования и дистанционного обучения.Были реализованы следующие алгоритмы для автономного методараспознавания рукописного текста:- приведение изображения к серой шкале.- приведение изображения к черно-белому виду;- анализ и удаление не относящихся к тексту шумов на изображении;- скелетизация черно-белого изображения;- векторизация изображения;- выделение слов в образе рукописного текста;- выделение строк в образе рукописного текста;- определение угла наклона букв;- исправление погрешности скелетизации.Представление изображения в виде серой шкалы означает, что каждый пиксельизображения будет представлен в форме числа, лежащего в интервале [0…255].
В7ходе поведенного исследования было определено, что этого диапазона достаточнодля того, чтобы сохранить необходимые данные с наименьшей их потерей припереходе к серой шкале.Шумоподавление – это удаление возможного зашумления изображения,являющегося следствием погрешности устройства ввода изображение (например,сканера). Реализован алгоритм сглаживания с использованием функции Гаусса(Рисунок 3).абРисунок 3. Двумерное нормальное распределение цвета символа с разнымивесовыми коэффициентами. а – неоптимальное распределение сосливающимися границами, б – оптимальное распределение сраздельными ярко выраженными границамиДискретное гауссово ядро сглаживания (апертуру фильтра) можно получить,построив массив размером (2k+1)×(2k+1), значение элемента (i,j) которого равно:H ij =⎛ ((i − k − 1) 2 + ( j − k − 1) 2 ) ⎞exp⎜−⎟2θσ 22σ 2⎝⎠1(1)где σ – это среднеквадратическое отклонение гауссиана,k – коэффициент апертуры фильтра.Название ядра объясняется тем, что именно такой вид имеет плотностьвероятности для двумерной нормальной (или гауссовой) случайной переменной сзаданной ковариантностью.










