Для студентов СПбГУ по предмету ДругиеРазработка алгоритма биоинформатического анализа идентификации патогенных микроорганизмовРазработка алгоритма биоинформатического анализа идентификации патогенных микроорганизмов
4,955920
2024-08-032024-08-03СтудИзба
Курсовая работа: Разработка алгоритма биоинформатического анализа идентификации патогенных микроорганизмов
Описание
Содержание
Введение......................................................................................................................... 3
Постановка задачи....................................................................................................... 5
Обзор литературы........................................................................................................ 7
Глава 1. Глубинный анализ данных................................................................... 10
Глава 2. Сбор данных............................................................................................... 11
2.1. Необходимые данные............................................................................... 11
2.2. NCBI................................................................................................................ 11
2.3. Автоматизация сбора данных................................................................ 12
Глава 3. Подготовка данных................................................................................. 14
3.1. Построение обучающих множеств...................................................... 14
3.2. Извлечение признаков.............................................................................. 14
Глава 4. Модель анализа данных......................................................................... 16
4.1. Случайный лес............................................................................................ 16
Глава 5. Подбор параметров модели.................................................................. 18
5.1. Параметры модели..................................................................................... 18
5.2. Критерии качества..................................................................................... 19
5.3. Сравнение моделей извлечения признаков...................................... 20
Глава 6. Реализация системы................................................................................ 21
6.1. Выбор инструментов реализации......................................................... 21
6.2. Реализация.................................................................................................... 22
Глава 6. Результаты.................................................................................................. 26
Выводы.......................................................................................................................... 28
Заключение.................................................................................................................. 29
Список литературы................................................................................................... 31
2
Введение
Некультивируемое состояние обнаружено у многих патогенных видов микроорганизмов. В связи с тем, что рутинные бактериологические методы неприменимы для обнаружения некультивируемых форм, развитию таких методик как анализ на основе секвенирования по методу дробовика следует уделить значительное внимание. Подобный метод позволит в кратчайшие сроки определять наличие возбудителей особо опасных инфекций и, таким образом, значительно ускорять процесс принятия решений о мерах противодействия возможным эпидемиям.
Методы NGS – методы секвенирования нового поколения являются
высокопроизводительными методами определения нуклеотидных последовательностей. Наиболее распространённой технологией NGS является Illumina [1], позволяющая извлекать из подготовленного образца за один запуск продолжительностью до 30 часов около 400 млн генетических последовательностей длиной до 600 символов.
Из известных и важных применений указанного
Введение......................................................................................................................... 3
Постановка задачи....................................................................................................... 5
Обзор литературы........................................................................................................ 7
Глава 1. Глубинный анализ данных................................................................... 10
Глава 2. Сбор данных............................................................................................... 11
2.1. Необходимые данные............................................................................... 11
2.2. NCBI................................................................................................................ 11
2.3. Автоматизация сбора данных................................................................ 12
Глава 3. Подготовка данных................................................................................. 14
3.1. Построение обучающих множеств...................................................... 14
3.2. Извлечение признаков.............................................................................. 14
Глава 4. Модель анализа данных......................................................................... 16
4.1. Случайный лес............................................................................................ 16
Глава 5. Подбор параметров модели.................................................................. 18
5.1. Параметры модели..................................................................................... 18
5.2. Критерии качества..................................................................................... 19
5.3. Сравнение моделей извлечения признаков...................................... 20
Глава 6. Реализация системы................................................................................ 21
6.1. Выбор инструментов реализации......................................................... 21
6.2. Реализация.................................................................................................... 22
Глава 6. Результаты.................................................................................................. 26
Выводы.......................................................................................................................... 28
Заключение.................................................................................................................. 29
Список литературы................................................................................................... 31
2
Введение
Некультивируемое состояние обнаружено у многих патогенных видов микроорганизмов. В связи с тем, что рутинные бактериологические методы неприменимы для обнаружения некультивируемых форм, развитию таких методик как анализ на основе секвенирования по методу дробовика следует уделить значительное внимание. Подобный метод позволит в кратчайшие сроки определять наличие возбудителей особо опасных инфекций и, таким образом, значительно ускорять процесс принятия решений о мерах противодействия возможным эпидемиям.
Методы NGS – методы секвенирования нового поколения являются
высокопроизводительными методами определения нуклеотидных последовательностей. Наиболее распространённой технологией NGS является Illumina [1], позволяющая извлекать из подготовленного образца за один запуск продолжительностью до 30 часов около 400 млн генетических последовательностей длиной до 600 символов.
- связи с всеобъемлемостью присущей подобного рода исследованию требуется разработка систем, осуществляющих применение методов классификации, способных обеспечить проведение точного, полного и эффективного по времени определения таксономической принадлежности получаемых последовательностей.
Из известных и важных применений указанного
Характеристики курсовой работы
Список файлов
Разработка алгоритма биоинформатического анализа идентификации патогенных микроорганизмов.doc
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
СПбГУ
Tortuga













