Отчет 4 (Лаба 4)
Описание файла
Файл "Отчет 4" внутри архива находится в папке "Лаба 4". Документ из архива "Лаба 4", который расположен в категории "". Всё это находится в предмете "операционный анализ данных" из 5 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лабораторные работы", в предмете "операционный анализ данных" в общих файлах.
Онлайн просмотр документа "Отчет 4"
Текст из документа "Отчет 4"
Московский государственный технический университет
им. Н.Э.Баумана
Кафедра
«Системы обработки информации и управления»
(ИУ-5)
Отчёт по лабораторной работе №4
по курсу «Оперативный анализ и визуализация данных»
Выполнил:
студент гр. ИУ5-52
Зайков Сергей
Проверил:
Тоноян С.А.
Москва – 2014 г.
1. Цель работы.
Получить теоретические знания изучив:
-
линейная регрессия;
-
логистическая регрессия;
-
байесовская классификация;.
-
деревья решений;
-
решающие правила;
-
нейронные сети;
-
метод k ближайших соседей и др.
Получение практических навыков:
-
исследование и оценка распознавания образов с применением модели линейной регрессии;
-
исследование и оценка распознавания образов с применением модели логистической регрессии;
2. Итоговые Скриншоты
Ответ на контрольный вопрос:
Насколько сильно на результат влияет множитель и почему?
Множитель достаточно сильно влияет на получаемые данные (процент ошибок, время выполнения) по той причине, что он изменяет параметры системы в том или ином направлении (увеличение или уменьшение множителя) так как он умножается на параметр системы, то влияние на результат оказывается достаточно сильным, чтобы кардинально изменить выходной результат.
Общие контрольные вопросы:
Чем объяснить результат, полученный в ходе работы?
В процессе выполнения данной лабораторной работы были получены результаты, представленные выше. На них повлияло множество факторов настройки системы: предел сходимости, скорость обучения, размер тестовой выборки, и один из самых важных – метод оптимизации. Он является одним из самых значимых параметров по той причине, так как именно выбор метода оптимизации наибольшим образом влияет на получаемые результаты.
Насколько улучшился бы результат, если бы в тестовой выборке было больше элементов (100 тысяч, миллион)?
Результат машинного обучения мог дать как положительные, так и отрицательные результаты по той причине, что присутствует эффект переобучения. Он заключается в том, что после некоторого объема обучающей выборки результат будет получен неверно, так как будет реагировать на самые незначительные изменения во входных параметрах. Таким образом, главной задачей при обучении является нахождение оптимального объема обучающей выборки.
Каким образом можно улучшить результат работы модели?
Улучшить модель можно многими способами. Как было уже сказано в прошлом вопросе, один из способов – это найти оптимальное количество обучающих примеров. Также можно более детально настроить модель с помощью корректировки одно или нескольких параметров, указанных в первом вопросе. Также целесообразно применение некоторых алгоритмов оптимизации, описанных выше.
В чем отличие псевдообратной матрицы от обратной?
Псевдообращение можно понимать как решение задачи наилучшей аппроксимации (по методу наименьших квадратов с предельным вариантом регуляризации) для соответствующей системы линейных уравнений.
Псевдообратная матрица может быть вычислена с помощью сингулярного разложения матрицы.
Оцените примерно, какой был бы процент ошибок распознавания, если бы мы выбирали ответы случайным образом, а не занимались вычислениями?
Процент ошибок был бы очень высоким, если бы мы ответы выбирали случайным образом. Процент ошибок приближался к 100% и был бы точно выше, чем те результаты, которые мы получили на обучаемой модели.
11