Определение регуляторных сегментов в геномах методами теоретического анализа последовательностей нуклеотидов ДНК, страница 2
Описание файла
PDF-файл из архива "Определение регуляторных сегментов в геномах методами теоретического анализа последовательностей нуклеотидов ДНК", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
melanogaster.Основные положения, выносимые на защиту1. Расположение дистальных регуляторных элементов, в частностиэнхансеров в геноме может быть определено исходя из наличия в нихучастков, специфически взаимодействующих с регуляторными белками.2. Периодические закономерности в расположении участков связываниярегуляторных белков в пределах регуляторных модулей могут бытьэффективно использованы для предсказания стабильной конформации ДНКбелкового инициаторного комплекса.3. Для регуляторных белков, связывающихся с ДНК в форме димера,удается существенно улучшить распознавание участков ДНК,взаимодействующих с регуляторным белком, путем учета симметрии ихструктуры.74. Статистическая значимость наблюдения мотива связывания белковили конфигурации мотивов может быть вычислена точно, путемкомбинаторного анализа с помощью модификации алгоритма Ахо-Корасик.5. Распределение мотивов в последовательности ДНК позволяет судитьоб уровнях организации генома, которые ответственны за конкретныеструктурные и регуляторные функции.Практическое значение работыПрактическая значимость работы выражается в том, что разработанныев данном исследовании методы применяются в области биотехнологии: это –разработка эффективных конструктов из культур клеток тканей эукариот,включая млекопитающих; и в биомедицине: это – связь аллельных вариантов,локализованных в регуляторных областях, с возможными патологиями.Кроме того, в качестве практических достижений можно назвать созданиеконкретных программных инструментов, используемых научнымсообществом.
Такими инструментами являются:Программа BASIO, позволяющая осуществлять сегментациюхромосомы на участки с определенным характерным составом.Программа SeSiMCMC построения множественного локальноговыравнивания последовательностей при условии заданной симметриивыровненной последовательности и определения характерного мотива ввыровненном участке [http://bioinform.genetika.ru/SeSiMCMC/].Программа поиска сегментов ДНК, содержащих кластеры участковсвязывания одного и того же регуляторного белка (гомотипические кластерысайтов связывания).Программа AhoPro, позволяющая оценивать статистическуюзначимость кластеров мотивов в ДНК.
[http://bioinform.genetika.ru/AhoPro].База данных DMMPMM, содержащая мотивы, распознаваемые белками,регулирующими транскрипцию в ходе раннего развития Drosophiamelanogaster [http://line.imb.ac.ru/DMMPMM/].8О результативности практических приложений свидетельствуетиспользование наших результатов в нижеперечисленных исследованиях.Программа SeSiMCMC успешно принимала участие в международномконкурсе аналогичных программ, проводимом ВашингтонскимУниверситетом (США) [Tompa et.
al. //Nat.Biotech (2005), 123, p. 137.], иприменялась в ряде исследований совместно с широко используемымкомплексом программ GenomeExplorer [Миронов А.А. и др.// Молекул.биология, 34, 253]. Приоритет работ, с участием автора, в которых былапредложена идея кластеризации сайтов связывания в регуляторных элементах[Papatsenko D.A. et al. // Genome Research 2002, 12:470; Lifanov A.P. et al //Genome Research, 2003,13:579; Makeev V.J. et al // Nucleic Acids Res. 200331:6016] как основного фактора, обеспечивающего сложную регуляциютканеспецифической экспрессии генов высших эукариот, признанмеждународным научным сообществом.
Следует отметить, что упомянутыепрактические успехи стали возможны потому, что удалось решить рядтеоретических проблем, в частности переформулировать задачураспознавания функциональных участков как задачу распознаванияодномерных текстовых образов.Апробация работыМатериалы диссертации докладывались на международных ивсероссийских конференциях и семинарах, в том числе: Московскомсеминаре по компьютерной генетике (Москва, 1997); Отчетной конференциипо программе «Геном человека», (Черноголовка, 1997); международномсеминаре «Mathematical applications in biological sciences» (Tronheim, Norway,1997, Rouen, France, 1998); международной конференции по алгоритмам ввычислительной биологии RECOMB 1998 (Lyon, France); Международнойконференции JOBIM 1997 (Montpellier, France); II, III Съездах биофизиковРоссии (Москва, 1999, Воронеж, 2004), III, IV,V, Международных9конференциях по биоинформатике регуляции структуры генов (Новосибирск,2002, 2006, 2008), I и II Московских международных конференциях повычислительной биологии (2003, 2005), Международном семинаре ASSCG(Evry, France, 2003), Энгельгардтовской конференции по молекулярнойбиологии (Суздаль, 2004); Gordon Research Conference in Human Genetics andGenomics (Newport, USA, 2005), III и IV Съездах биохимиков и молекулярныхбиологов (Санкт-Петербург, 2005, Новосибирск 2008); международномсеминаре Statistical semantics of genomes (Evry, France, 2008); Международнойвыставке Biotechnica 2008 (Hannover, Germany); Конференции обществаГельмгольца (Москва, 2008); Российско-Индийских школах-конференциях побиоинформатике и геномике (Хайдарабад, 2006, Новосибирск, 2008) и др.С использованием материалов диссертации автором сделаны: доклад вRockefeller University, New York, USA (1999); два доклада в Georgia Tech,Atlanta, USA (2003, 2004); доклад в РАН (Москва, 2004); доклад вКаролинском университете (Стокгольм, 2005) и ряд других выступлений.ПубликацииПо материалам диссертации опубликовано 36 статей в реферируемыхнаучных журналах (из них 35 в соавторстве), а также более 50 тезисовдокладов (см.
пред. раздел).Структура работыДиссертация состоит из семи глав, выводов и библиографии (243наименования). Ее полный объем составляет 184 страницы, количестворисунков 17, количество таблиц 6.Глава 1. Введение.Во Введении обосновывается актуальность работы, ее научная новизна,практическая значимость. Описаны цели и задачи исследования, а такжепрактические результаты. Сформулированы положения, выносимые на10защиту. Приведена информация об апробации работы, количествопубликаций автора, дана структура дисертации.Глава 2. Анализ нуклеотидых последовательностейрегуляторных сегментов ДНК и задача об управленииэкспрессией генов в эмбриональном развитии D.
melanоgaster.Данная глава является обзором литературы. В этой главе такжеформулируются конкретные задачи, решение которых описывается впоследующих главах диссертации.В результате успехов геномных проектов стало понятно, что виды,сильно отличающеся по морфологии, могут иметь весьма сходных наборструктурных генов. Эти морфологические различия по-видимому связаны сразличиями в регуляции экспрессии генов.
В наибольшей степени наморфологии должны сказываться различия в экспрессии генов, управляющихтечением эмбрионального развития. Механизмы, контролирующиеэкспрессию генов, пока изучены недостаточно. Известно, однако, что дляинициации транскрипции неоходимо формирование масштабныхнадмолекулярных структур, включающих в себя многочисленные молекулыбелков, в частности, факторов инициации транскрипции, и различные участкимолекул ДНК.
Возникает вопрос, какие биофизические механизмы отвечаютза формирование и стабилизацию этих структур. Очевидно, что этимеханизмы должны действовать на нескольких уровнях иерархиимакромолекулярных взаимодействий: участки непосредственного контакта,характерные структурные домены макромолекул (спирали и тяжи), а такжеформирование собственно надмолекулярных структур.Поскольку информация о структуре очень мала, то единственнаявозможность получить информацию о физических взаимодействиях, лежащихв основе инициаторного комплекса, заключается в изучение закономерностейв последовательности нуклеотидов ДНК.
Одномерная текстоваязакономерность в расположении нуклеотидов должна являться проекцией11трехмерной структуры макромолекулярной укладки. Реальная природафизических взаимодействий трехмерна, поэтому объяснение текстовыхзакономерностей в строении последовательностей возможно только на уровнетрехмерных явлений.
Поскольку макромолекулярный комплекс образуетиерархическую структуру, в проекции на одномерную последовательностьнуклеотидов ДНК эта структура проявляется как иерархия закономерностей впоследовательности, существующих на разных масштабах. Очень частоединственным экспериментальным источником информации являетсяпоследовательность ДНК.
Поэтому встает вопрос: «До какой степенииерархия физических явлений на разных масштабах длин, лежащая в основеформирующегося ДНК-белкового комплекса, может быть оценена исходятолько из последовательности ДНК». Решению этого вопроса посвященанастоящая работа.Рядом исследователей, включая автора, в конце 90х годов было сделанонаблюдение, что сегменты ДНК, контролирующие транскрипцию генов (цисрегуляторные модули или ЦРМ), часто содержат большое число сходныхподпоследовательностей длиной от единиц до нескольких десятковнуклеотидов.
В некоторых случаях было показано, что эти«перепредставленные слова» в нуклеотидном тексте взаимодействуют сбелками, регулирующими транскрипцию этих генов (транскрипционнымифакторами, ТФ). Таким образом определяя местоположение сайтовсвязывания ТФ (ССТФ), а также анализируя распределение ТФ в пределахрегуляторных модулей, в особенности распределение расстояний междуразными ССТФ, можно получить информацию, о том, какие физическиесвойства ДНК-белкового комплекса важны для его фукнционирования.Используя полученную информацию сделать выводы о строении трехмерныхмакромолекулярных комплексов на разных масштабах длин.