Заключение диссертационного совета (Вычислительный комплекс- классификатор текстов с использованием морфологического анализа и нейро-семантических сетей)
Описание файла
Файл "Заключение диссертационного совета" внутри архива находится в следующих папках: Вычислительный комплекс- классификатор текстов с использованием морфологического анализа и нейро-семантических сетей, Документы. PDF-файл из архива "Вычислительный комплекс- классификатор текстов с использованием морфологического анализа и нейро-семантических сетей", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве РТУ МИРЭА. Не смотря на прямую связь этого архива с РТУ МИРЭА, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст из PDF
Аттестационное дело №____07.12.2017 г. протокол № 59Заключение диссертационного совета Д 212.131.05, созданного на базефедерального государственного бюджетного образовательного учреждениявысшегообразования«Московскийтехнологическийуниверситет»(МИРЭА), Министерства образования и науки Российской Федерации,находящейся по адресу 119454, Москва, проспект Вернадского, д.78, номерприказа № 2651-687 от 19 ноября 2010 г., по диссертации Ле Мань Ха насоискание ученой степени кандидата технических наук по специальности05.13.15 – Вычислительные машины, комплексы и компьютерные сети.Диссертация «Вычислительный комплекс-классификатор текстов сиспользованием морфологического анализа и нейро-семантических сетей» ввиде рукописи по специальности 05.13.15 – «Вычислительные машины,комплексыикомпьютерныесети»выполненавфедеральномгосударственном образовательном учреждении высшего профессиональногообразования «Московский физико-технический институт (государственныйуниверситет)» (МФТИ) на кафедре интеллектуальных информационныхсистем и технологий.Диссертация принята к защите 28 сентября 2017 года протокол 8-17/П.Соискатель Ле Мань Ха, 1986 года рождения, в 2013 г.
окончил магистратуруМФТИ. В октябре 2013 года он поступил в аспирантуру МФТИ.Кандидатские экзамены сдал. Научный руководитель д.т.н. ХарламовАлександр Александрович, основное место работы – Институт ВысшейНервной Деятельности и Нейрофизиологии РАН.Официальные оппоненты: Толчеев Владимир Олегович, гражданинРФ, доцент, профессор кафедры управления и информатики, Федеральноегосударственноебюджетноеобразовательноеучреждениевысшегообразования «Национальный исследовательский университет Московский2энергетический институт», г. Москва, Киселев Михаил Витальевич,гражданин РФ, кандидат технических наук, доцент кафедры актуарной ифинансовой математики факультета прикладной математики, физики иинформационных технологий федерального государственного бюджетногообразовательногоучреждениявысшегообразования«Чувашскийгосударственный университет имени И.Н.
Ульянова», Приволжский ФО,Чувашская Республика, г. Чебоксары – дали положительные отзывы надиссертацию. Ведущая организация – Федеральный исследовательский центр"Информатикаиуправление"положительноезаключениеисполняющимобязанностисотрудником,кандидатоРоссийскойАкадемиидиссертациизаведующегоНаук,(заключениесектора,физико-математическихдаласоставленоведущимнаукнаучнымЧучупаломВладимиром Яковлевичем и утверждено директором, доктор техническихнаук, академиком РАН Соколовым Игорем Анатольевичем).Выборофициальныхоппонентовиведущейорганизацииобосновывается их компетентностью в рассматриваемой отрасли, наличиемпубликаций и способностью определить научную и практическую ценностьдиссертации в технической отрасли науки.На диссертацию и автореферат поступило 6 положительных отзывов:От кандидата физико-математических наук, директора ТОО1."Русс"РыжоваВ.А.,замечания:вработенедостаточноподробнорассмотрены математические основы алгоритмов векторного представлениятекста; не изучены возможности распараллеливания вычислений.2.Отдокторатехническихнаук,профессора,заведующеголабораторией 40 «Интеллектуальных систем управления и моделирования»Института проблем управления им.
В.А. Трапезникова РАН Пащенко Ф.Ф.,замечания:вработенедостаточноподробнорассмотреныусловиясходимости при обучения векторного представления текста; отсутствует3описания методы хранения данных для обучения и обученных параметров.3.От доктора технических наук, профессора кафедры управленияинформационными системами и цифровой инфраструктурой НИУ «Высшаяшкола экономики» Гостева И.М., замечания: недостаточно подробнорассмотрены применения предложенных методов для классификации текстовна других языках; нет пояснений к используемым форматам данных вэкспериментах; в тексте работы имеются опечатки и грамматическиеошибки.4.От кандидата технических наук, ведущего научного сотрудникафедерального государственного казенного учреждения "Войсковая часть35533" Ромашкина Юрия Николаевича, замечания: из текста авторефератанеясно, на основании каких принципов осуществляется выбор векторногопредставления грамматических структур предложений текста; посколькуэкспериментальнаябазатекстовсодержалапреимущественностилистические правильные тексты новостных программ, неясно насколькоустойчив реализованный алгоритм классификации к изменению стиля текста,в частности при спонтанном написании текстов, а также использованиитекстовых сообщений малого объема.5.От кандидата технических наук, руководителя группы речевыхтехнологий ООО "ДСС-Лаб" Кушнир Д.А., замечания: целесообразно былобы более подробно в автореферате описать каким образом снимаетсямногозначность морфологического разбора при помощи марковской модели;также из текста автореферата невозможно понять, как получены вектора дляотдельных слов (вектора лемм), какова их размерность и учитывают ли этивектора морфологию сами по себе; также текст автореферата не лишенстилистических недостатков, что влияет на восприятие содержания.6.Отдокторатехническихнаук,профессорадепартаментамеханики и мехатроники Инженерной академии Российского университета4дружбы народов Пупкова К.А., замечания: отсутствие сравнения работы ссуществующими решениями известных российских и зарубежных компаний;в тексте работы имеются грамматические ошибки.Соискатель имеет 11 опубликованных работ по теме диссертации, 5 изкоторых, опубликованы в журналах, входящих в Перечень рецензируемыхнаучных журналов и изданий ВАК:1.
Ле Мань Ха Прогнозирование настроения человека по анализутекста // Информатизация и связь. 2012. № 8. С.97-98.2. Нгуен Нгок Зиеп, Ле Мань Ха Нейросетевой метод снятияомонимии // Труды МФТИ. 2015. Т.7, № 3. С.174-182. Вклад соискателя:описание алгоритмов обучения нейронных сетей.3. Ле Мань Ха Оптимизация алгоритма KNN для классификациитекстов // Труды МФТИ. 2015. Т. 7, № 3. С. 92-94.4. Ле Мань Ха Свёрточная нейронная сеть для решения задачиклассификации // Труды МФТИ.
2016. Т.8, № 3. С.91-97.5.ХарламовА.А.,ЛеМаньХаНейросетевыеподходыкклассификации текстов на основе морфологического анализа // ТрудыМФТИ. 2017. Т. 9, №2. С. 143-150. Вклад соискателя: Описание методовклассификации текстов и проведение экспериментов.Диссертационный совет отмечает, что на основании выполненныхсоискателем исследований: разработан метод морфологического анализа дляпредварительнойобработкитекстов,морфологическиехарактеристикипозволяющийсловоформдляполучитьпоследующейклассификации; разработаны математическое и программное обеспечениявычислительного комплекса на основе нейро-семантической сети дляопределенияадекватноговекторногопредставленияграмматическихструктур текстов, которая позволяет повысить точность классификациитекстов на 5-12% по сравнению с другими методами классификации;разработаны алгоритмическое и программное обеспечения вычислительногокомплекса на основе рекурсивного автоэнкодера с объединением векторов5лемм и векторов морфологических характеристик, который позволяетповысить точность классификации текстов на 7-13% по сравнению с другимиметодами классификации; разработан метод К-ближайших соседей сиспользованием структуры данных двоичного дерева для уменьшенияколичества вычислительных операций, который позволяет увеличитьскоростьклассификациитекстовв2-4раза;разработанныевдиссертационном исследовании модели, алгоритмы и программные средствабыли текстированы в разных условиях; по результатам апробации можносделать вывод о том, что они эффективны для классификации текстов.Теоретическая значимость исследования заключается в изложении иобосновании предложенного в диссертации подхода векторизации текстовдля дальнейшей обработки и классификации, разработке оригинальногометода морфологического анализа для предварительной обработки текстов,позволяющий строить морфологические характеристики для всех развитыхсловоформ; разработке математического и программного обеспечениявычислительного комплекса классификации на основе нейро-семантическойсети; разработке метода «К» ближайших соседей, позволяющего повыситьбыстродействие классификатора текстов.Значение полученных соискателем результатов исследования дляпрактики подтверждается следующими актами о внедрении: в технологияхавтоматического анализа текстов научно-производственного инновационногоцентра МИКРОСИСТЕМЫ и в исследовании системы голосового управленияв Институте военных автоматизированных технологий, в Академии военныхнаук и технологий Министерства обороны Вьетнама.
Кроме того, автору былвыдан патент на изобретение «Голосовая связь на естественном языке междучеловеком и устройством» (RU 2583150).Достоверность полученных результатов подтверждается корректновыстроенной методологией исследования. В диссертации прослеживаетсячеткая и корректно выстроенная связь между представленными главами.
Все6представленные в работе положения, выводы и рекомендации основаны начеткомиспользованииаппаратов, а такжепонятийного,математическогоподтверждаютсяилогическоготеоретической обоснованностьюпредложенных средств и методов, которые подкреплены экспериментами.Достоверность также подтверждается апробацией результатов исследованияна научных конференциях и семинарах.Личный вклад соискателя состоит в непосредственном участии вовсех этапах исследования, а именно: анализе существующих методовобработки и классификации текстов, разработке метода морфологическогоанализа текстов, разработке математического и программного обеспечениявычислительного комплекса классификации на основе нейро-семантическойсети и рекурсивного автоэнкодера с использованием морфологическихсловарей, а также рзработке метода К-ближайших соседей с использованиемструктуры данных двоичного дерева.Диссертация(«Теоретическийсоответствуетанализип.2паспортаспециальностиэкспериментальноеисследованиефункционирования вычислительных комплексов с целью улучшения ихтехнико-экономическихиэксплуатационныххарактеристик»);п.3(«Разработка научных методов и алгоритмов организации специальнойобработки данных, хранения и ввода-вывода информации»).