Курсовая работа: Применение методов машинного обучения в области обработки естественного языка
Описание
Оглавление
2
Если взглянуть на нынешний уровень доступа к информации, то можно обнаружить, что найти нужную информацию без каких-либо специальных средств почти невозможно.
Во многих случаях, чтобы как-то работать с этими данными, прихо-дится сначала их классифицировать или кластеризовывать. У читателя может возникнуть вопрос, что это такое и зачем вообще это нужно?
Определение. Кластеризация (или кластерный анализ) — задача раз-биения множества объектов на группы, называемые кластерами. Внут-ри каждого кластера должны оказаться похожие объекты, а объекты различных групп должны быть как можно более отличны.
Цели кластеризации
| 1. Введение | 3 | |
| 1.1. | Формализация и постановка задачи . . . . . . . . . . . . | 5 |
| 1.2. | Обработкатекста ....................... | 6 |
| 1.3. | Выделениепризнаков..................... | 7 |
| 1.4. | Методы оценки результата алгоритма . . . . . . . . . . . | 11 |
| 2. Наивные алгоритмы | 13 | |
| 2.1. | Шар............................... | 15 |
| 2.2. | Максимальное отклонение по координатам . . . . . . . . | 19 |
| 2.3. | Эвристики ........................... | 22 |
| 2.4. | Метод k-ближайших соседей . . . . . . . . . . . . . . . . . | 23 |
| 3. Метод опорных векторов | 26 | |
| 3.1. | Описание............................ | 26 |
| 3.2. | Формализация......................... | 27 |
| 3.3. | Ядра............................... | 30 |
| 3.4. | Оценкарезультатов...................... | 33 |
| 4. Наивный байесовский классификатор | 34 | |
| 4.1. | Описание............................ | 34 |
| 4.2. | Формализация......................... | 34 |
| 4.3. | Применениекзадаче ..................... | 36 |
| 4.4. | Оценкарезультатов...................... | 38 |
| Заключение | 39 | |
| Список литературы | 40 | |
2
- Введение
Если взглянуть на нынешний уровень доступа к информации, то можно обнаружить, что найти нужную информацию без каких-либо специальных средств почти невозможно.
Во многих случаях, чтобы как-то работать с этими данными, прихо-дится сначала их классифицировать или кластеризовывать. У читателя может возникнуть вопрос, что это такое и зачем вообще это нужно?
Определение. Кластеризация (или кластерный анализ) — задача раз-биения множества объектов на группы, называемые кластерами. Внут-ри каждого кластера должны оказаться похожие объекты, а объекты различных групп должны быть как можно более отличны.
Цели кластеризации
- Понимание структуры данных. Разбиение множества объектов на группы позволяет упростить их дальнейшую обработку, напри-мер, зная структуру данных, можно применять какой-то конкрет-ный алгоритм для каждого кластера.
- Обнаружение новизны. Можно найти объект, который невозмож-но отнести ни к одной из групп.
Характеристики курсовой работы
Учебное заведение
Семестр
Просмотров
1
Размер
681,5 Kb
Список файлов
Применение методов машинного обучения в области обработки естественного языка.doc
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
МГИМО
Tortuga











