Заключение диссертационного совета (1090445)
Текст из файла
Аттестационное дело №____07.12.2017 г. протокол № 59Заключение диссертационного совета Д 212.131.05, созданного на базефедерального государственного бюджетного образовательного учреждениявысшегообразования«Московскийтехнологическийуниверситет»(МИРЭА), Министерства образования и науки Российской Федерации,находящейся по адресу 119454, Москва, проспект Вернадского, д.78, номерприказа № 2651-687 от 19 ноября 2010 г., по диссертации Ле Мань Ха насоискание ученой степени кандидата технических наук по специальности05.13.15 – Вычислительные машины, комплексы и компьютерные сети.Диссертация «Вычислительный комплекс-классификатор текстов сиспользованием морфологического анализа и нейро-семантических сетей» ввиде рукописи по специальности 05.13.15 – «Вычислительные машины,комплексыикомпьютерныесети»выполненавфедеральномгосударственном образовательном учреждении высшего профессиональногообразования «Московский физико-технический институт (государственныйуниверситет)» (МФТИ) на кафедре интеллектуальных информационныхсистем и технологий.Диссертация принята к защите 28 сентября 2017 года протокол 8-17/П.Соискатель Ле Мань Ха, 1986 года рождения, в 2013 г.
окончил магистратуруМФТИ. В октябре 2013 года он поступил в аспирантуру МФТИ.Кандидатские экзамены сдал. Научный руководитель д.т.н. ХарламовАлександр Александрович, основное место работы – Институт ВысшейНервной Деятельности и Нейрофизиологии РАН.Официальные оппоненты: Толчеев Владимир Олегович, гражданинРФ, доцент, профессор кафедры управления и информатики, Федеральноегосударственноебюджетноеобразовательноеучреждениевысшегообразования «Национальный исследовательский университет Московский2энергетический институт», г. Москва, Киселев Михаил Витальевич,гражданин РФ, кандидат технических наук, доцент кафедры актуарной ифинансовой математики факультета прикладной математики, физики иинформационных технологий федерального государственного бюджетногообразовательногоучреждениявысшегообразования«Чувашскийгосударственный университет имени И.Н.
Ульянова», Приволжский ФО,Чувашская Республика, г. Чебоксары – дали положительные отзывы надиссертацию. Ведущая организация – Федеральный исследовательский центр"Информатикаиуправление"положительноезаключениеисполняющимобязанностисотрудником,кандидатоРоссийскойАкадемиидиссертациизаведующегоНаук,(заключениесектора,физико-математическихдаласоставленоведущимнаукнаучнымЧучупаломВладимиром Яковлевичем и утверждено директором, доктор техническихнаук, академиком РАН Соколовым Игорем Анатольевичем).Выборофициальныхоппонентовиведущейорганизацииобосновывается их компетентностью в рассматриваемой отрасли, наличиемпубликаций и способностью определить научную и практическую ценностьдиссертации в технической отрасли науки.На диссертацию и автореферат поступило 6 положительных отзывов:От кандидата физико-математических наук, директора ТОО1."Русс"РыжоваВ.А.,замечания:вработенедостаточноподробнорассмотрены математические основы алгоритмов векторного представлениятекста; не изучены возможности распараллеливания вычислений.2.Отдокторатехническихнаук,профессора,заведующеголабораторией 40 «Интеллектуальных систем управления и моделирования»Института проблем управления им.
В.А. Трапезникова РАН Пащенко Ф.Ф.,замечания:вработенедостаточноподробнорассмотреныусловиясходимости при обучения векторного представления текста; отсутствует3описания методы хранения данных для обучения и обученных параметров.3.От доктора технических наук, профессора кафедры управленияинформационными системами и цифровой инфраструктурой НИУ «Высшаяшкола экономики» Гостева И.М., замечания: недостаточно подробнорассмотрены применения предложенных методов для классификации текстовна других языках; нет пояснений к используемым форматам данных вэкспериментах; в тексте работы имеются опечатки и грамматическиеошибки.4.От кандидата технических наук, ведущего научного сотрудникафедерального государственного казенного учреждения "Войсковая часть35533" Ромашкина Юрия Николаевича, замечания: из текста авторефератанеясно, на основании каких принципов осуществляется выбор векторногопредставления грамматических структур предложений текста; посколькуэкспериментальнаябазатекстовсодержалапреимущественностилистические правильные тексты новостных программ, неясно насколькоустойчив реализованный алгоритм классификации к изменению стиля текста,в частности при спонтанном написании текстов, а также использованиитекстовых сообщений малого объема.5.От кандидата технических наук, руководителя группы речевыхтехнологий ООО "ДСС-Лаб" Кушнир Д.А., замечания: целесообразно былобы более подробно в автореферате описать каким образом снимаетсямногозначность морфологического разбора при помощи марковской модели;также из текста автореферата невозможно понять, как получены вектора дляотдельных слов (вектора лемм), какова их размерность и учитывают ли этивектора морфологию сами по себе; также текст автореферата не лишенстилистических недостатков, что влияет на восприятие содержания.6.Отдокторатехническихнаук,профессорадепартаментамеханики и мехатроники Инженерной академии Российского университета4дружбы народов Пупкова К.А., замечания: отсутствие сравнения работы ссуществующими решениями известных российских и зарубежных компаний;в тексте работы имеются грамматические ошибки.Соискатель имеет 11 опубликованных работ по теме диссертации, 5 изкоторых, опубликованы в журналах, входящих в Перечень рецензируемыхнаучных журналов и изданий ВАК:1.
Ле Мань Ха Прогнозирование настроения человека по анализутекста // Информатизация и связь. 2012. № 8. С.97-98.2. Нгуен Нгок Зиеп, Ле Мань Ха Нейросетевой метод снятияомонимии // Труды МФТИ. 2015. Т.7, № 3. С.174-182. Вклад соискателя:описание алгоритмов обучения нейронных сетей.3. Ле Мань Ха Оптимизация алгоритма KNN для классификациитекстов // Труды МФТИ. 2015. Т. 7, № 3. С. 92-94.4. Ле Мань Ха Свёрточная нейронная сеть для решения задачиклассификации // Труды МФТИ.
2016. Т.8, № 3. С.91-97.5.ХарламовА.А.,ЛеМаньХаНейросетевыеподходыкклассификации текстов на основе морфологического анализа // ТрудыМФТИ. 2017. Т. 9, №2. С. 143-150. Вклад соискателя: Описание методовклассификации текстов и проведение экспериментов.Диссертационный совет отмечает, что на основании выполненныхсоискателем исследований: разработан метод морфологического анализа дляпредварительнойобработкитекстов,морфологическиехарактеристикипозволяющийсловоформдляполучитьпоследующейклассификации; разработаны математическое и программное обеспечениявычислительного комплекса на основе нейро-семантической сети дляопределенияадекватноговекторногопредставленияграмматическихструктур текстов, которая позволяет повысить точность классификациитекстов на 5-12% по сравнению с другими методами классификации;разработаны алгоритмическое и программное обеспечения вычислительногокомплекса на основе рекурсивного автоэнкодера с объединением векторов5лемм и векторов морфологических характеристик, который позволяетповысить точность классификации текстов на 7-13% по сравнению с другимиметодами классификации; разработан метод К-ближайших соседей сиспользованием структуры данных двоичного дерева для уменьшенияколичества вычислительных операций, который позволяет увеличитьскоростьклассификациитекстовв2-4раза;разработанныевдиссертационном исследовании модели, алгоритмы и программные средствабыли текстированы в разных условиях; по результатам апробации можносделать вывод о том, что они эффективны для классификации текстов.Теоретическая значимость исследования заключается в изложении иобосновании предложенного в диссертации подхода векторизации текстовдля дальнейшей обработки и классификации, разработке оригинальногометода морфологического анализа для предварительной обработки текстов,позволяющий строить морфологические характеристики для всех развитыхсловоформ; разработке математического и программного обеспечениявычислительного комплекса классификации на основе нейро-семантическойсети; разработке метода «К» ближайших соседей, позволяющего повыситьбыстродействие классификатора текстов.Значение полученных соискателем результатов исследования дляпрактики подтверждается следующими актами о внедрении: в технологияхавтоматического анализа текстов научно-производственного инновационногоцентра МИКРОСИСТЕМЫ и в исследовании системы голосового управленияв Институте военных автоматизированных технологий, в Академии военныхнаук и технологий Министерства обороны Вьетнама.
Кроме того, автору былвыдан патент на изобретение «Голосовая связь на естественном языке междучеловеком и устройством» (RU 2583150).Достоверность полученных результатов подтверждается корректновыстроенной методологией исследования. В диссертации прослеживаетсячеткая и корректно выстроенная связь между представленными главами.
Все6представленные в работе положения, выводы и рекомендации основаны начеткомиспользованииаппаратов, а такжепонятийного,математическогоподтверждаютсяилогическоготеоретической обоснованностьюпредложенных средств и методов, которые подкреплены экспериментами.Достоверность также подтверждается апробацией результатов исследованияна научных конференциях и семинарах.Личный вклад соискателя состоит в непосредственном участии вовсех этапах исследования, а именно: анализе существующих методовобработки и классификации текстов, разработке метода морфологическогоанализа текстов, разработке математического и программного обеспечениявычислительного комплекса классификации на основе нейро-семантическойсети и рекурсивного автоэнкодера с использованием морфологическихсловарей, а также рзработке метода К-ближайших соседей с использованиемструктуры данных двоичного дерева.Диссертация(«Теоретическийсоответствуетанализип.2паспортаспециальностиэкспериментальноеисследованиефункционирования вычислительных комплексов с целью улучшения ихтехнико-экономическихиэксплуатационныххарактеристик»);п.3(«Разработка научных методов и алгоритмов организации специальнойобработки данных, хранения и ввода-вывода информации»).
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.















