Главная » Просмотр файлов » Диссертация

Диссертация (1090484), страница 6

Файл №1090484 Диссертация (Вычислительный комплекс- классификатор текстов с использованием морфологического анализа и нейро-семантических сетей) 6 страницаДиссертация (1090484) страница 62018-01-18СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 6)

Существующие методы векторного представления текстов не учитываютморфологические признаки слов. Метод TF-IDF не учитывает порядок слов втексте.2. Существующие методы классификации текстов не учитывают взаимноерасположение слов, а словосочетания являются одним из лучших признаков.Морфологические признаки слов так же не учитываются при классификации.3. Метод «К» ближайших соседей работает медленно и требует большоеколичество вычислений, для классификации нового текста, нужно вычислятьрасстояния между этим текстом со всеми текстами в корпусе, а их количествоможет достигать миллионов.4. На основе анализа существующих методов представления и классифика54ции текстов гипотезируется, что создание вычислительного комплекса-классификатортекстов с использованием морфологического анализа и нейро-семантических сетей может обеспечить высокое качество классификации текстов.55Глава 2Анализ методов глубокогообучения посредствомискусственных нейронныхсетей для обработки иклассификации текстовВ настоящее время теория нейронных сетей является одним из важнейших направлений науки, которое играет очень важную роль в технологиях обработке цифровых сигналов, машинного обучения [111].

При помощи искусственныхнейронных сетей решаются сложные практические задачи [112].Главной целю искусственных нейронных сетей нейронной сети является решение проблем таким же образом, что люди, хотя несколько категорий искусственных нейронных сетей являются более абстрактными [113]. Новые исследования мозга человека часто стимулирует новые модели нейронных сетей.

Динамические нейронные сети являются самыми передовыми, в том, что они, основываясь на правилах, могут динамически формировать новые нейроны и новыесвязи, в то время и отключать другие существующие нейроны и связи [114].Обычно, нейроны объединены в слои, и сигнал распространяет с первого56(входного) до последнего (выходного) слоя. Современные искусственные нейронные сети могут иметь несколько тысяч до несколько миллионов нейронови миллионов связей. Сигналы и состояние искусственных нейронов являютсяреальными цифрами, как правило, ограниченными между 0 и 1 (или -1 и 1,зависит от типа функции активации) [115]. Обратное распространение является методом для изменения веса связи, чтобы обучить сеть, используя известныеправильные выходы (обучение с учителем).

Обучение обычно требует несколькотысяч циклов [116].На основе искусственных нейронных сетей развиваются области науки: компьютерные технологии, обработка сигналов, медицинские технологии, управление и т.п. [117] Одним из важнейших свойств искусственных нейронных сетей является способность обучения на основе примеров, обучение может бытьс учителем, без учителя или гибридным (частично с учителем) [91]. Благодарявозможности обучаться искусственные нейронные сети имеют применения в таких технологиях, как моделирование, анализ временных рядов, распознаваниеобразов и т.п.

[118]Искусственная нейронная сеть состоит из слоев, а каждый слой состоит изнейронов с различными типами связей между ними [119]. Число слоев и числонейронов каждого слоя зависят от конкретной задачи, чем больше число нейронов и число слоев, тем больше времени нужно для обучения. Искусственныенейронные сети имеют очень важное свойство - возможность распараллеливания вычислений при обучение, таким образом обучение сети можно производить на многоядерных, в том числе и графических процессорах, это свойствопозволяет эффективно обучать нейронные сети на компьютерах и существенносократить время обучения[19].При помощи искусственных нейронных сетей входное пространства преобразуется в выходное, и это преобразование можно легко регулировать изменениями числа слоев искусственной нейронной сети, числа нейронов на слоях итипа связей по требованям задачи [120].Нейронные сети можно настроить и их функционирование можно контролировать в процессе решения задачи.

Структура и конфигурация нейронной сетизависят от сложности конкретной задачи. Очень важное свойство нейронных57сетей - возможность адаптации, их настройка можно изменять даже во времяобучения по требованиям задач [121].Основные преимущества искусственных нейронных сетей [122]:• Адаптивное обучение: возможность научиться выполнять задания на основе данных для обучения;• Самоорганизация: Искусственные нейронные сети могут создавать своиструктуры и представления информации, которую он получает во времяобучения;• Возможность работы в режиме реального времени : Вычисления в искусственных нейронных сетях могут осуществляться параллельно, и специальные технические устройства реализуются, чтобы использовать такуювозможность;• Отказоустойчивость: частичное разрушение сети приводит к соответствующему снижению производительности.

Однако состояния искусственныхнейронных сетей могут быть сохранены даже при их серьезных повреждениях. Это свойство позволяет восстанавливать сетей и продолжатьобучение;• Возможность масштабировать: для проверки правильность работы нейронной сети можно использовать небольшую сеть и тестировать на небольшие выборки данных, а при решении реальных задач можно увеличитьколичество слоев и нейронов, и размер выборки данных;• Возможность распараллеливания вычислений и реализации алгоритмовобучения сети на компьютерах с многоядерными процессорами или намножестве компьютеров;Чем отличаются искусственные нейронные сети от обычных компьютеров врешении задач. Обычные компьютеры используют алгоритмический подход, т.е.

компьютер следует набор инструкций для того, чтобы решить проблему. Компьютер может решить эту проблему только при условии, что известны конкретные шаги, которые он должен следовать. Но компьютеры были бы намного более58полезно, если они могли бы сделать вещи, которые мы не знаем, как это сделать. Эта возможность есть у искусственных нейронных сетей. Нейронные сетиобрабатывают информации каким образцом, таким как человеческий мозг.

Нейронные сети состоят из взаимосвязанных нейронов, работающих параллельно,чтобы решить конкретную проблему. Нейронные сети обучаются на примерах.Они не могут быть запрограммированы для выполнения определенных задач.Примеры должны быть тщательно подобраны, в противном случае полезноговремени тратится впустую, или еще хуже нейронные сети могут неправильнофункционировать.

Недостатком нейронных сетей является то, что, так как нейронные сети сами решают задачу, его работа может быть непредсказуемой [123].Теория нейронных сетей зародилась в 40-х годах прошлого века и до сих порпостоянно развивалась. Прошло более 60 лет, но теория нейронных сетей ещедалека от завершения. Существует огромное количество нерешенных проблемтеории нейронных сетей, которые возникают при решении различных сложныхзадач [124].В самой теории нейронных сетей развиваются много разных направленийисследования, для решения конкретных задач (распознавание образов, криптография, анализ характеристик сигналов, логистические системы) придуманыразличные архитектуры нейронных сетей (такие как сверточные нейронные сети, рекуррентные нейронные сети т.п.) [125]. Эти исследования с одной стороны позволят эффективно продвигаться в части , а с другой стороны позволятиспользовать заранее заданные свойства.

Такие исследования в полной меретребуют огромное количество вычислений, и могут быть проведены только сиспользованием высокопроизводительных систем, можно сказать, что развитиекомпьютерных технологий является основой для развития теории нейронныхсетей [126].2.1Многослойные нейронные сетиМногослойные нейронные сети - это модель искусственной нейронной сети, которая принимает на входе наборы входных данных и выдает на выходе множество соответствующих данных. Многослойные нейронные сети состоят из слоев,59при этом каждый слой состоит из множества узлов (нейронов) и подключается кследующему.

Кроме входных узлов, каждый узел является нейрон с нелинейнойфункцией активации. Для обучения многослойных нейронных сетей используется алгоритм обратного распространения ошибки, который основан на методеградиентного спуска. Алгоритм обратного распространения ошибки был впервые описан А.И. Галушкиным [127], и Полом Дж. Вербосом [128] независимо иодновременно в 1974 г. Многослойные нейронные сети были популярным решением машинного обучения в 1980-е годы, их применения широко исползовалисьи до сих пор используются в различных областях, таких как распознавание речи, распознавание образов и машинный перевод, но уже с 1990-х годов столкнулись с сильной конкуренцией со стороны опорных векторов.

В последнее времянаблюдается некоторое возрождение интереса к многослойной нейронной сетиобратного распространения в связи с успехами технологий глубокого обучения.Рис. 2.1: Многослойная нейронная сеть.Выходное значение нейрона yj вычисляется как функция активации от линейной комбинации [41]:60yj = σ(zj ),(2.1)X(2.2)где:zj =wij yi .Часто используемые функции активации и их производные [129]:Сигмоида:σ(z) = S(z) = (1 + e−z )−1 ,(2.3)∂σ∂S== S(z)(1 − S(z)).∂z∂z(2.4)ez − e−zσ(z) = tanh(z) = z,e + e−z(2.5)∂σ∂ tanh(z)== 1 − tanh2 (z).∂z∂z(2.6)σ(z) = ReLU (z) = max(0, z),(2.7)∂σ∂ReLU (z) 0 если z ≤ 0==.1 если z > 0∂z∂z(2.8)Tanh:ReLU:612.2Метод обратного распространения ошибкиМетод обратного распространения ошибки является распространенным методом обучения искусственных нейронных сетей и используется в сочетании сметодами оптимизации, такие как метод градиентного спуска [130].

Характеристики

Список файлов диссертации

Вычислительный комплекс- классификатор текстов с использованием морфологического анализа и нейро-семантических сетей
Документы
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
7021
Авторов
на СтудИзбе
260
Средний доход
с одного платного файла
Обучение Подробнее