Отзыв на автореферат 4 (1090458)
Текст из файла
ОЗЗЫВ к.т.н. Ромашкина Юрия Николаевича на автореферат диссертации Ле Мань Ха на тему «Вычислительный комплехс-классификатор текстов с использованием морфологического анализа и нейро-семантических сетей», представленной на соискание ученой степени кандидата технических наук по специальности 05Л 3.15 — «Вычислительные машины, комплексы и компьютерные сети — по техническим наукамв Значительный рост текстовых сообщений в социальных сетях, блогах, форумах и мессенджерах сети Интернет н различных приложениях мобильной связи привел к необходимости разработки средств их компьютерного анализа в первую очередь с целью семантического поиска, оценки тональности и тематической классификации.
К настоящему времени предложены многочисленные методы компьютерного анализа текстов по разным критериям, однако все они требуют дальнейшего развития как в части обеспечения более высокой точности классификации, так и скорости обработки при большом объеме текстов. Поэтому тему диссертационной работы Ле Мань Ха следует считать актуальной. В автареферате четко определены задачи, объект, предмет, научная новизна и практическая значимость проводимого исследования. На основе изучения существующих методов классификации текстов обсонована целесообразность применения морфологического анализа словоформ, технически грамотно изложена сущность такого анализа Справделиво отмечено, что для русского языка количество параметров морфологического словаря существенно больше, чем для английского.
Для классификации текстов соискатель использует искусственную нейронную сеть, последовательно выполняющую векторное представление грамматических структур предложений текста, оценку распределения вероятностей для множественной классификации каждого предложения текста и оценку распределения вероятностей текста по заданным категориям. Преимущество такого подхода в первую очередь связано с формированием нзких векторных представлений для семантически атических структур. Для уменьшения количества производимых операций при классификации текстов соискателем предложена модификация известного алгоритма «К ближайших соседей» с использованием двоичного дерева, при которой сравнению подлежат только тексты, имеющие общие термины. Соискателем осуществлена программная реализация предложенного алгоритма классификации текстов н получены экспериментальные оценки точности и скорости его работы по сравнению с рядом других наиболее широко известных апгоритмов классификации.
В качестве экспериментальной базы текстов использованы достаточно представительные базы на русском н английском языках с количеством категорий от 2 (позитивная и негативная) до 11. Установлено, что предложенный и реализованный соискателем алгоритм обеспечивает в ряде случаев дополнительное повышение точности классификации (от 2 до 10 %) при увеличении скорости обработки в 1,9-3,5 раза. Основные результаты работы достаточно полно представлены в рецензируемых научно-технических журналах, рекомендованных ВАК Министерства образования и науки Российской Федерации, а также в виде тезисов докладов на ряде конференций. Материал авгореферата подается соискателем в логичесхой последовательности, продиктованной поставленной целью диссертационной работы н раскрывающей решаемые в ней научно-технические задачи.
В нем содержится достаточное для понимания количество иллюстраций и экспериментальных данных. Обоснованность сформулированных научных положений и достоверность полученных результатов подтверждается корректным использованием математического аппарата и результатами проведенных экспериментов. Вместе с тем автореферат имеет следующие недостатки. 1. Из тексга автореферата неясно, на основании каких принципов осуществляется выбор векторного представления грамматических структур предложений текста.
2. Поскольку экспериментальная база текстов содержала преимущественно стилистически правильные тексты новостных программ, неясно насколько устойчив реализованный алгоритм классификации к изменению стиля текста, в частности при спонтанном написании текстов, а также использовании текстовых сообщений малого объема.
В целом, несмотря на указанные замечания, судя по автореферагу, диссертационная работа Ле Мань Ха представляет собой законченное научное исследование н по научной новизне и практической значимости удовлетворяет требованиям, предъявляемым к кандидатским диссертациям. В соответствии с требованиями п.9 Положения о порядке присуждении ученых степеней в диссертации Ле Мань Ха изложены научно обоснованные решения, имеюпще существенное значение для развития отрасли компьютерной обработки информации н обеспечивающие совершенствование методов н средств автоматического семантического анализа н классификации текстов.
Считаю, что Ле Мань Ха заслуживает присуждения ученой степени кандидата технических наук по специальности 05.13.15 — «Вычислительные машины, комплексы н компьютерные сети — по техническим наукам». Ведущий научный сотрудник Федерального государственного казенн учреждения «Войсковая часть 35533» кандидат технических наук Е-ша1: плпауп®уаш1ех гп Ю.Н. Ромашкин «/5» ноября2017г. Подпись Ромашкина Ю.Н. удостовер Ученый секретарь диссертационного Н.В. Боровик « ~~ » ноября 2017 г. .
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.















