Для студентов МГИМО по предмету ДругиеМетоды обучения с подкреплением в задачах управления механическими системамиМетоды обучения с подкреплением в задачах управления механическими системами
2024-07-142024-07-14СтудИзба
Курсовая работа: Методы обучения с подкреплением в задачах управления механическими системами
Описание
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ……………………………………………………………....4
ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ…………………………………7
1.1. Задача управления «роботом-велосипедистом»….. ……..7
1.2. Проблемы практического применения теоретических результатов……………………………………...……………………8
1.3. Математическая постановка задачи ……………………..10
ГЛАВА 2. ИССЛЕДОВАНИЕ ЗАДАЧИ………………………..…..14
2.1. Моделирование неуправляемой системы……..…………14
2.2. Графики моделирования неуправляемой системой …….16
2.3. Моделирование управляемой системы и оценка коэффициента 2 ……………………………….…………………20
2.4. Графики моделирование управляемой системы и оценка коэффициента 2 …………………..……………………………...24
Заключение……..……………………….……..………………………..31
Список литературы……..……………………….……..……………….33
Приложения……..……………………….……..……………………….34
4
Введение
Одним из популярных направлений науки в настоящее время является искусственный интеллект. Одной из важных составляющих этого направления – это машинное обучение. Оно применяется во многих областях, например в информационной безопасности, робототехники, медицине. Почему его применяют? Дело в том, что системы машинного обучения позволяют быстро применять знания, полученные при обучении на больших наборах данных, что позволяет им преуспевать в таких задачах, как распознавание лиц, распознавание речи, распознавание объектов, автоматический перевод текстов, оно помогает в управлении самолетами, ракетами, в диагностировании заболеваний и многое другое. В отличие от программ с закодированными вручную инструкциями для выполнения конкретных задач, машинное обучение позволяет системе научиться самостоятельно, распознавать шаблоны и делать прогнозы. В некоторых случаях машина по сравнению с человеком способна принимать более правильные, быстрые, решения.[1] Но эта область имеет множество нерешенных проблем. В машинном обучении выделяют такие направления, как: обучение по дереву принятия решений, обучение по ассоциативным правилам, обучение с подкреплением, искусственные нейронные сети, глубокое обучение, обучение по характерным особенностям, обучение по подобию, обучение по избыточному словарю и многое другое. [2] Данная работа относится к области обучения с подкреплением, а точнее к адаптивным алгоритмам. Обучение с подкреплением используют там, где задачей стоит не анализ данных, а выживание
ВВЕДЕНИЕ……………………………………………………………....4
ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ…………………………………7
1.1. Задача управления «роботом-велосипедистом»….. ……..7
1.2. Проблемы практического применения теоретических результатов……………………………………...……………………8
1.3. Математическая постановка задачи ……………………..10
ГЛАВА 2. ИССЛЕДОВАНИЕ ЗАДАЧИ………………………..…..14
2.1. Моделирование неуправляемой системы……..…………14
2.2. Графики моделирования неуправляемой системой …….16
2.3. Моделирование управляемой системы и оценка коэффициента 2 ……………………………….…………………20
2.4. Графики моделирование управляемой системы и оценка коэффициента 2 …………………..……………………………...24
Заключение……..……………………….……..………………………..31
Список литературы……..……………………….……..……………….33
Приложения……..……………………….……..……………………….34
4
Введение
Одним из популярных направлений науки в настоящее время является искусственный интеллект. Одной из важных составляющих этого направления – это машинное обучение. Оно применяется во многих областях, например в информационной безопасности, робототехники, медицине. Почему его применяют? Дело в том, что системы машинного обучения позволяют быстро применять знания, полученные при обучении на больших наборах данных, что позволяет им преуспевать в таких задачах, как распознавание лиц, распознавание речи, распознавание объектов, автоматический перевод текстов, оно помогает в управлении самолетами, ракетами, в диагностировании заболеваний и многое другое. В отличие от программ с закодированными вручную инструкциями для выполнения конкретных задач, машинное обучение позволяет системе научиться самостоятельно, распознавать шаблоны и делать прогнозы. В некоторых случаях машина по сравнению с человеком способна принимать более правильные, быстрые, решения.[1] Но эта область имеет множество нерешенных проблем. В машинном обучении выделяют такие направления, как: обучение по дереву принятия решений, обучение по ассоциативным правилам, обучение с подкреплением, искусственные нейронные сети, глубокое обучение, обучение по характерным особенностям, обучение по подобию, обучение по избыточному словарю и многое другое. [2] Данная работа относится к области обучения с подкреплением, а точнее к адаптивным алгоритмам. Обучение с подкреплением используют там, где задачей стоит не анализ данных, а выживание
Характеристики курсовой работы
Список файлов
Методы обучения с подкреплением в задачах управления механическими системами.doc