Для студентов МГИМО по предмету Любой или несколько предметовПрименение Hi-C к метагеномикеПрименение Hi-C к метагеномике
4,9551048
2024-07-282024-07-28СтудИзба
Курсовая работа: Применение Hi-C к метагеномике
Описание
Оглавление
3
4
Введение
Биоинформатика – одна из наиболее быстро развивающихся областей науки на текущий момент, объединяющая достижения биологии и Com-puter Science. Одной из важнейших проблем биоинформатики является сборка генома. Первым частично собранным геномом стал геном чело-века. Проект «Геном человека» (англ. The Human Genome Project) [19] продолжался на протяжении более десяти лет, и на его осуществление было израсходовано более трех миллиардов долларов. Современное науч-ное сообщество считает достижение успехом, продвинувшим область да-леко вперед, привлекшим колоссальные инвестиции и оказавшим огром-ное влияние на биоинформатику.
Особый интерес представляет изучение геномов микроорганизмов. Не-смотря на малые размеры, данные организмы зачастую обладают неверо-ятными по современным меркам биологическими инструментами, некото-рые из которых адаптированы человеком в своих целях. Так ретровирусы обладают возможностью встраивать гены в клетки организма-носителя и таким образом самовоспроизводиться, что было использовано учеными для развития генотерапии [4]. Некоторые бактерии обладают адаптив-ной имунной системой [29], основанной на встраивании в собственный геном участков геномов враждебных вирусов или иных микроорганизмов для их идентификации и последующего уничтожения. На основе этого учеными были разработаны средства для редактирования генома [5], ко-торые в частности планируется использовать для борьбы с раком [7] и ВИЧ-инфекцией [6] и создания генно-модифицированных продуктов без добавления чужеродной ДНК [11].
| Введение | 5 | ||
| 1. | Постановка задачи | 6 | |
| 2. | Обзор предметной области | 7 | |
| 3. | Обзор Hi-C протокола | 10 | |
| 4. | Обзор инструментов | 12 | |
| 4.1. | Средства выравнивания Hi-C . . . . . . . . . . . . . . . . . . | 12 | |
| 4.2. | Симулятор Hi-C данных . . . . . . . . . . . . . . . . . . . . . | 13 | |
| 4.3. | Средстваскаффолдинга ..................... | 13 | |
| 4.4. | Средствабиннинга ........................ | 14 | |
| 5. | Исследование Hi-C данных | 16 | |
| 6. | Прототип | 19 | |
| 6.1. | Подготовкаданных........................ | 19 | |
| 6.2. | Порогдлинынасжатиеребер . . . . . . . . . . . . . . . . . . | 19 | |
| 6.3. | Сжатиеграфа ........................... | 20 | |
| 6.4. | Наращиваниепути ........................ | 21 | |
| 6.5. | Критерийнаращиванияпути . . . . . . . . . . . . . . . . . . | 21 | |
| 7. | Эксперименты над прототипом | 22 | |
| 7.1. | Эксперименты на симулированных данных . . . . . . . . . . | 22 | |
| 7.2. | Эксперименты на естественных данных . . . . . . . . . . . . | 23 | |
| 8. | Расширение SPAdes | 24 | |
| 8.1. | Архитектура модуля ExSPAnder . . . . . . . . . . . . . . . . | 24 | |
| 8.2. | HiCExtensionChooser . . . . . . . . . . . . . . . . . . . . . . . | 25 | |
| 8.3. | HiCPathToPathExtensionChooser . . . . . . . . . . . . . . . . | 27 | |
| 9. | Результаты | 31 | |
| 9.1. | Доступныеданные ........................ | 31 | |
| 9.2. | Оценкакачествасборки ..................... | 31 | |
3
| 9.3. | Результаты на симулированных данных . . . . . . . . . . . . | 33 |
| 9.4. | Результаты на естественных данных . . . . . . . . . . . . . . | 35 |
| 10.Итоги работы | 38 | |
| Список литературы | 39 | |
4
Введение
Биоинформатика – одна из наиболее быстро развивающихся областей науки на текущий момент, объединяющая достижения биологии и Com-puter Science. Одной из важнейших проблем биоинформатики является сборка генома. Первым частично собранным геномом стал геном чело-века. Проект «Геном человека» (англ. The Human Genome Project) [19] продолжался на протяжении более десяти лет, и на его осуществление было израсходовано более трех миллиардов долларов. Современное науч-ное сообщество считает достижение успехом, продвинувшим область да-леко вперед, привлекшим колоссальные инвестиции и оказавшим огром-ное влияние на биоинформатику.
Особый интерес представляет изучение геномов микроорганизмов. Не-смотря на малые размеры, данные организмы зачастую обладают неверо-ятными по современным меркам биологическими инструментами, некото-рые из которых адаптированы человеком в своих целях. Так ретровирусы обладают возможностью встраивать гены в клетки организма-носителя и таким образом самовоспроизводиться, что было использовано учеными для развития генотерапии [4]. Некоторые бактерии обладают адаптив-ной имунной системой [29], основанной на встраивании в собственный геном участков геномов враждебных вирусов или иных микроорганизмов для их идентификации и последующего уничтожения. На основе этого учеными были разработаны средства для редактирования генома [5], ко-торые в частности планируется использовать для борьбы с раком [7] и ВИЧ-инфекцией [6] и создания генно-модифицированных продуктов без добавления чужеродной ДНК [11].
Характеристики курсовой работы
Учебное заведение
Семестр
Просмотров
1
Размер
599,5 Kb
Список файлов
Применение Hi-C к метагеномике.doc
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
МГИМО
Tortuga















