Адаптивная обработка каллиграфической информации, представленной в виде рукописных символов (1025037), страница 3
Текст из файла (страница 3)
Данное ядро сглаживания образует такое взвешенноесреднее, для которого в центре ядра весовые коэффициенты пикселей намногобольше, чем на его границах. Этот подход можно обосновать качественно:сглаживание подавляет шум, поддерживая требование, чтобы пиксели былипохожи на своих соседей.
Уменьшая весовые коэффициенты для отдалённыхпикселей, можно быть уверенным, что для них это требование будет не такимжёстким.Выделения контуров изображения может быть проведено методами Кирша,Лапласа, Робертса, Собела, Уоллеса, статистическим методом и др. Например,статистический метод является двухпроходовым и применим для любойапертуры, даже для прямоугольной. На первом этапе вычисляется среднеезначение яркости по текущему рабочему окну:µ=81 m n∑∑ F (i, j )mn i =1 j =1(2)Затем рассчитывается значение среднеквадратичного отклонения значенийэлементов рабочего окна от среднеарифметического значения:σ=1 m∑∑ ( F (i, j ) − µ )mn i =1 j =12(3)Значения всех элементов рабочего окна умножаются на полученноеотклонение:F '(i, j ) = σ F (i, j )(4)Для обеспечения наблюдаемости может потребоваться повышение порогаяркости путем сложения с числом 100.Статистический метод – единственный изперечисленных выше, у которого изменяются значения сразу всех элементоврабочего окна;Скелет текста, получаемый из растрового черно-белого изображения,представляет собой наборы линий толщиной в один пиксель.
В общем случае,суть скелетизации – это приведение данных к такому виду, чтобы затем можнобыло получить скелет изображения в его векторном представлении и привеститем самым объем данных к тому минимуму, который необходим для процессараспознавания (Рисунок 4).Послевекторизацииизображенияпроисходитаппроксимациявекторизованных данных, которая необходима для того, чтобы избавиться отизбыточности ранее полученных данных.
Эта избыточность состоит в том, чтонекоторые точки кривых не являются существенными. Это те точки, избавившисьот которых, можно при необходимости вновь легко их вычислить и восстановить.Для аппроксимации векторизированного изображения применен методпоследовательных приближений.Изображение представляется как набор точек, образующих некоторую связнуюкривую. Нужно найти набор прямых, аппроксимирующих эту кривую.
Черезлюбые две соседние точки можно провести только одну прямую. Если каждаяследующая соседняя точка лежит достаточно близко к уже проведенной прямой,то прямая корректируется с учетом этой точки. В противном случае новая точка иследующая за ней считаются началом следующей прямой (Рисунок 5).Рисунок 4. Алгоритм составленияскелета рукописныхданныхРисунок 5. Алгоритм векторизацииизображения9Алгоритм заканчивает свою работу, когда все точки будут приписаны той илииной прямой (Рисунок 6).Рисунок 6.
Работа итерационногоалгоритмаРисунок 7. Алгоритм векторизациитонкого контураСхема алгоритма векторизации контура методом последовательныхприближений приведена на рисунке 7. Предложенный способ позволяетразложить тонкий контур только на набор связанных прямых, что являетсяединственным существенным недостатком метода.Среди преимуществ метода можно выделить небольшие вычислительныезатраты и простоту реализации. Однако описанный метод векторизации оченьчувствителен к дефектам и шумам на изображении, что крайне нежелательно.Для организации распознавания и оценки каллиграфии непосредственно впроцессе письма с использованием сенсорного экрана или планшета, применяетсяоперативный метод распознавания.
Для распознавания рукописного текстаоперативным методом был разработан алгоритм, в котором можно выделитьследующие основные этапы распознавания:- получение тонкого контура изображения;- приведение изображения к векторному виду;- определение угла наклона;- выделение псевдослов из образа;- определение особых точек (вершины и узлы);- построение карты особых точек.В результате анализа популярных алгоритмов сегментации и классификацииштрихов при распознавании образов почерка в работе сформулированы методыопределения элементов рукописного текста и их признаков, по которымформируется методика корректировки каллиграфии. Условно такие признакиможно разделить на три группы: общесистемные, частно-системные ипространственно-топографические признаки.
На рисунке 8 проиллюстрированыосновные пространственно-топографические признаки элементов рукописного, ккоторым относят отступы от краев листа, красную строку, интервалы междустроками и словами и форму линии строки.10Рисунок 8. Пространственные топографические признаки.Разработанная и исследованная математическая модель оперативного методараспознавания рукописных символов и обработки заключенной в нихкаллиграфической информации построена на основе самообучающегосярандомизированного алгоритма стохастической оптимизации. Основноеуравнение модели определяет функционал качества классификации илифункционал среднего риска, равныйF (ρ ) =∫XJ ( x, ρ ), Q( x, ρ ) P(dx) =m∫ ∑ LX k ρ ( x ) qX k =1( )k( x, ρ ) P(dx)(5)Он представляет собой функцию набора ψ центров классов.
Вокруг каждоготакого центра класса ψk группируются все точки х класса Xk(ρ). В геометрическомсмысле задача автоматической классификации, к которой можно свести задачираспознавания рукописных образов и обработки каллиграфической информации,состоит в определении набора центров классов {ψk, k = 1,2,…,m}, при которыхсуммарное рассеивание минимально.
Входная информация поступает в видевекторов признаков обрабатываемых рукописных символов. Последовательностьоценок { ρˆ } входных векторов ρ* формируется при помощи рандомизированногоалгоритмастохастическойаппроксимации.Алгоритмпостроенияпоследовательности оценок описывается уравнениями:⎧ ρ% n± = ρˆ n −1 ± µ n ∆ n J T ( xn ρˆ n −1 )⎪⎪⎡Y ( xn ρ% n+ ) − Y ( xn ρ% n− )∆ n J T ( xn ρˆ n −1 ) ⎤ .⎨Tˆˆˆ(ρρλJxρP=−⎥⎪ nnn n −1ѓ ⎢ µ n −12µn⎪⎩⎣⎢⎦⎥(6)Здесь J T ( xn ρˆ n ) – m-мерный вектор, состоящий из значений характеристическихфункций LXk( ρˆn ), k=1,2,…,m, определяющих принадлежность xn кластеру k.Выражение Y ( xn ρ% n± ) = Q( xn ρ% n± ) + Vn± описывает m-мерные векторы, состоящие иззначений функций потерь, измеренных с помехами в соответствующих точках, Vn±– вектора ошибок наблюдений, в данной задаче они равны квадратам расстоянийдо центров кластеров; P ѓ – проектор во множество Ψ.Численное решение задачи распознавания рукописного текста и обработкикаллиграфии с применением описанной выше модели было выполнено сиспользованием реализованных программных алгоритмов.
Проведена оценкакачества каллиграфии двух наборов символов. Результаты моделированияпоказали эффективность построенной модели и применяемого алгоритма дляраспознавания рукописного текста и обработки каллиграфической информации.В третье главе содержатся результаты разработки системы распознаваниярукописныхсимволовиобработкикаллиграфическойинформации,11представленной совокупностью рукописных образов. Приведены результатыисследования методами системного анализа процессов формирования навыковкаллиграфии при реабилитации функции мелкой моторики рук. В разделе былипроанализированы функциональные требования к этой системе.Функциональные возможности рассмотрены на примере интеллектуальнойинтерактивной обучающей системы (программно-аппаратного комплекса) дляформирования навыков каллиграфии (Рисунок 9).Рисунок 9.
Первый уровень декомпозиции работы программно-аппаратногокомплексаПроведен анализ системных связей и закономерностей функционированияданной интерактивной системы при выполнении ею процессов распознавания,анализа и обработки рукописных образов. Выполнен системный анализвзаимодействияразработанногопрограммно-аппаратногокомплексаспользователем при применении комплекса как средства технической поддержкидля обучения письму и тренировки функции рук.Основные функции рассматриваемой обучающей системы таковы: создание ипросмотр материала (текстового, графического, аудио-, видео- и т.д.); созданиеинтерактивных заданий; назначение последовательности выполнения заданий;назначение критериев оценки правильности выполнения заданий; выбор ипрохождение отдельных упражнений из курса; создание и поддержкаиндивидуальных профилей пользователя; работа со статистикой обучения.Разработанная система способна проводить комплексную многоуровневуюадаптивную обработку каллиграфической информации.
В основе этой обработкилежит принцип автоподстройки системы с учетом характеристик входныхсигналов. Этот принцип определяет функционирование всех уровней и модулейсистемы.На самом глубоком уровне – на уровне математической модели – в системеприменен адаптивный алгоритм тренировки навыка каллиграфии, благодарякоторому в системе в ходе распознавания рукописного текста и обработкиструктурной информации символов, осуществляется подбор необходимыхобучающих упражнений. Адаптивный характер этого уровня работы системы, т.е.способность самоподстраиваться под уровень развития навыка каллиграфииобучаемого с учетом вводной информации, определяет помехоустойчивость12системы, отсутствие необходимости в ее переобучении и переборе вариантов привыборе обучающих упражнений.Использование адаптивного алгоритма упрощает аппаратную реализациюсистемы, позволяя применять для создания программно-аппаратного комплексамобильные устройства и ноутбуки.
Устойчивость адаптивной модели к ростуразмерности пространства состояний позволяет увеличивать набор признаковвектора, добавляя дополнительные характеристики символа. Таким образом,более высокие уровни организации системы – конструктивно-функциональныйуровень модулей, организация и работа базы эталонов, аппаратные особенности идр. – также определяются принципом многоуровневой адаптации.На самом высоком уровне системы – на этапе взаимодействия системы спользователем или стадии формирования навыка каллиграфии – используетсяадаптивная методика обучения.
Она построена на изменении сложности заданий взависимости от результатов, полученных на уровнях, описанных выше. Дляформирования навыка каллиграфии применяется библиотека упражнений, вкоторой сложность каждого последующего задания адаптивно меняется взависимости от правильности выполнения предыдущих. Если обучаемыйправильно выполняет задания, сложность последующих заданий повышается,если неправильно – понижается. Также есть возможность дополнительнойтренировки тех навыков, которыми учащийся владеет недостаточно.Библиотека упражнений строится в виде сценария, для которого подбираютсяследующие параметры:- количество заданий по каждой теме, которые должны быть включено в тест;- количество заданий каждого уровня сложности, которые должны бытьвключено в тест;- количество заданий каждой формы, которые должны быть включено в тест;- время прохождения теста.В системе применены три уровня оценки: предварительный (до началаобучения), текущий (во время обучения) и итоговый (после окончания обучения).Такая структура оценок повышает эффективность управляющего воздействиясистемы.Таким образом, адаптивный характер работы интеллектуальной системы науровне формирования навыка каллиграфии соответствует хорошо разработаннымпринципам преподавания.
Рассмотрение процесса обучения с точки зрениясистемного анализа позволило выявить его основные противоречия. Они могутвозникать при формировании прямых и обратных связей вида «преподаватель –обучаемый». В случае использования для поддержки этого процессаинтеллектуальной интерактивной системы, последняя облегчает и упрощаетпроцесс обучения как по прямой связи «от преподавателя к обучаемому», так и пообратной связи «от обучаемого к преподавателю».









