Вопросы/задания к тесту/контрольной: Применение методов Data Mining в исследовании уровня динамики населения
Описание
CОДЕРЖАНИЕ
Введение.....................................................................................................................
- Корреляционный анализ......................
- Линейная регрессия..................................................................................... 5
- Нейросеть (регрессия).................................................................................. 9
- Кластерный анализ.................................................................................... 10
- Факторный анализ..................................................................................... 15
- Логистическая регрессия........................................................................... 17
Заключение .............................................................................................................. Список использованных источников.....................................................................
ВВЕДЕНИЕ
В данной работе будет проведено исследование, направленное на выявление зависимости численности населения от различных показателей.
Актуальность работы обусловлена тем, что на данный момент демография претерпевает значительные изменения ввиду внутренних и внешних событий, поэтому необходимо обладать достаточной информацией об изменении демографии и способствующих этому факторов, чтобы грамотно решать возникающие вопросы и проблемы в области населения.
Объект исследования: численность населения регионов Дальнего Востока.
Предмет исследования: зависимость динамики населения регионов Дальнего Востока от различного рода факторов.
Цель исследовательской работы: выявление зависимости динамики населения регионов от различного рода факторов.
Для достижения поставленной цели необходимо выполнить следующие задачи:
- Выборка подходящих для анализа статистических данных
- Выборка данных о подходящих факторах из разных областей
- Трансформация собранных данных в таблицу
- Data Mining
- Интерпретация результатов на основе полученных данных Методы исследования, используемые в работе: теоретическое изучение,
анализ и сравнение статистики; анализ (корреляционный, регрессионный, факторный, кластерный); обобщение.
Для проведения исследования обратимся к Федеральной службе государственной статистики[1]. Для зависимой переменной найдем данные о численности населения в регионах Дальнего Востока (Республика Саха, Магаданская область, Приморский край, Амурская область, Сахалинская
область, Хабаровский край, Республика Бурятия, Забайкальский край) за 2019,
2020, 2021 года. Затем загрузим выбранные для выявления зависимости факторы: Численность населения; Численность безработных; Доля, организаций, исп. ПК; Потенциальная рабочая сила; Среднедушевые доходы; Дефицит денежного дохода; Смертность населения; Численность врачей; Сооружения для спорта; Сальдо прямых иностранных инвестиций; Число предприятий и организаций; Общая площадь жилых помещений; Изменение населения; Внутренние затраты на научные исследования и разработки; Используемые передовые производственные технологии, Стоимость минимального набора продуктов; Продукция с/х; Число обрабатывающих производств; Средний размер пенсии; Число заболеваний у пациентов с диагнозом, установленным впервые.
После объединения данных в таблицу импортируем ее в платформу Loginom Community.
Первично - проведем корреляционный анализ.
КубГУ
all_at_700















