Определение регуляторных сегментов в геномах методами теоретического анализа последовательностей нуклеотидов ДНК (1097789), страница 7
Текст из файла (страница 7)
После оптимизации по 60 регуляторнымобластям были получены оптимальные значения, приведенные в Таблице 2.Видно, что окно длиной 575 приводит к удовлетворительным результатом длядевяти мотивов. Кроме того, положительным результатом является то, чтооптимальный порог на МПВ для всех факторов соответствует вероятностипоявления приблизительно одного вхождения мотива на тысячу пароснований.
При использовании этих оценок длины окна и порога по МПВоказалось возможным просканировать все имеющиеся локусы МПВ для всехимеющихся факторов и построить приблизительную сеть генетическойрегуляции. Результаты сканирования всех имеющихся локусов приведены втаблице 2. Как видно из таблицы 2 гомотипические кластеры мотивовсвязывания позволяют предсказать регуляторные модули далеко не для всехфакторов.
Если для материнских градиентов и для gap-генов получаетсядостаточно хорошее предскание, то предсказание для генов paired-rule ужезначительно уступает по качеству.Любопытно, что даже в случае факторов Bcd и Cad, для которыхполучаются весьма удовлетворительные предсказания, существуют локусы, вкоторых ЦРМ предсказываются весьма плохо. Так, из таблицы 2 видно, чтодля большинства локусов, зависимых от Bcd, для которых средниехарактерные значения корреляций имеют порядок 0,6-0,7, получаются оченьплохие предсказания в генах otd и tll.
Аналогично, для Cad наблюдаетсяблестящая корреляция в локусах gt и tll, но отсутствует корреляция в локусах36sal, en и ftz. Следует отметить, что регуляция otd посредством Bcd былапоказано экспериментально (Ochoa-Espinosa, 2005), так что в этом случаеприходится говорить о истинном недопредсказании метода.Использование программы кластеризации для предсказаниярегуляторных элементов в геномах и анализа их структурыНабор програмных скриптов CLUSTER (Lifanov, 2003), в которомреализован алгоритм, описанный выше, использовался рядом исследователейдля предсказания положения регуляторных модулей в геномах и анализа ихструктуры. В частности, с помощью описываемой программы был предсказанряд регуляторных модулей, в частности модуль, регулируемый Bcd в гене gt,что в дальнейшем подтвердилось в экспериментальном исследовании. Полноесканирование генома показало, что в полном геноме существует 14 сильныхкластеров Bcd из которых для 11 была показала Bcd-зависимая регуляторнаяактивность (Ochoa-Espinosa, 2006).Таким образом использование кластеризации мотивов связываниярегуляторных белков позволило удвоить число известных ЦРМ, зависящих отBcd.
В таблице 3, взятой из этой работы приводятся точные координатыновых энхансеров, зависящих от Bcd, найденных с помощью нашейпрограммы кластеризации мотивов.Другое возможное приложение описанного алгоритма – анализструктуры кластеров мотивов, присутствующих в различных регуляторныхмодулях. Очевидно, что одно и то же значение статистической значимостикластера можно обеспечить различными способами. Во-первых, кластерможет включать в себя небольшое количество сильных сайтов связываниярегуляторного белка, во-вторых, кластер может содержать большое числосайтов, с небольшими значениями веса, расчитанного с помощью МПВ.37Рисунок 5. Поиск максимума корреляции между положением кластеровмотивов связывания Bicoid и положеним зависимых от Bicoid ЦРМ впоследовательностях восьми генов.
Цветом показано значениекоэффициента ассоциации Пирсона (СС). Ось X: значения порога по МПВ.Ось Y: размер сканирующего окна. Панели – порог по статистическойзначимости кластеров: (А) P=0.0005; (B) P=0.001; (С) P=0.005. Максимальноезначение достигается при пороге МПВ 4.2, длине окна 550 п.о., и порогестатистической значимости кластера 0.0005.В работе (Berg, von Hippel, 1982) было показано, что вес сайта по МПВкоррелирует с аффинностью этого участка ДНК к соответствующемурегуляторному белку, а кластер ССТФ выполняет свою функцию при условиипосадки молекул регуляторного белка на достаточно большое количествосвязывающих ССТФ. Таким образом наличие гомотипического кластерасайтов обеспечивает большую суммарную аффинность к кооперативновзаимодействующим регуляторным белкам.В этом случае энхансер, содержащий небольшое число сильных сайтов,будет работать как при высоких, так и при низких концентрациях38регуляторного белка.
В то же время, энхансер, содержащий большое числослабых сайтов будет работать только при высоких концентрациярегуляторного белка и не будет работать при его низких концентрациях.Таким образом структура кластера ССТФ может быть использована дляанализа фунций конкретного регуляторного элемента.Такой анализ был проведен, и, действительно, подтвердилсяэкспериментально (Clyde et al. 2005). В этой работе, в частности былопоказано, что четыре полосы экспрессии гена even-skipped управляются всегодвумя энхансерами, реагирующими на встречные градиенты двухрегуляторных белков Hb, и Kni (белок Kni экспрессируется в средней частиэмбриона, а белок Hb на полюсах).
Энхансер eve3+7 содержит слабые сайтысвязывания Hb и сильные сайты связывания Kni. Поскольку оба белкаявляются репрессорами, под управлением этого энхансера ген even-skippedэкспрессируется ближе к полюсам, в области, где концентрация Hb заметна,но не достаточно велика, чтобы вызвать ответ кластера слабых сайтов. В тоже время сильные сайты в кластере мотивов связывания Kni не позволяютэнхансеру eve3+7 запускать экспрессию even-skipped в области хоть скольконибудь заметных концентраций Kni в районе центральной области эмбриона.Обратная картина наблюдается в случае запуска гена even-skipped вэкспрессию благодаря взаимодействию с энхансером eve4+6.
Этот энхансерсодержит сильные сайты связывания Hb и слабые сайты связывания Kni.Поэтому, под управлением этого энхансера ген even-skipped запускается вэкспрессию в области приближающейся к средней области эмбриона.Поскольку таким образом образуется по две полосы с переднего и сзаднего конца эмбриона, оказывается, что градиентов концентрации всегодвух белков достаточно для того, чтобы определить восемь границ четырехполос экспрессии even-skipped! В работе (Clyde 2005) приведеныэкспериментальные данные по генной инженерии сайтов в энхансерах eve4+639и eve3+7. Изменение силы сайтов этих энхансерах приводило к смещениюположения полос экспрессии гена even-skipped.Ген и ЦРМДлинаМестоположениеhb P22430 kb 5'Kr CD17303 kb 5'kni1,0191.2 kb 5'tll1,0361.5 kb 3'gt17876 kb 5'gt231,21310 kb 5'btd1,0803 kb 5'otd early9253.3 kb 5'salBE42110 kb 5'bowl3882nd intronhairy04708 kb 3'hairy21,0808.5 kb 5'hairy79329.5 kb 5'eve17885.5 kb 5'eve24881 kb 5'slpA3721 kb 5' of slp1slpB7932 kb 3' of slp17 kb 3' of slp2prdD/fsh1,4001 kb 3'7482 kb 3'Таблица 3.
Предсказание местоположения энахансеров (ЦРМ), зависимых от Bcd вокресностях различных генов с помощью метода, разработанного в диссертации.Приведенены экспериментальные данные , полученные в работе [Ochoa-Espinosa et al.PNAS, 102, 4960], совпадающие с предсказаниями40Рисунок 6 Регуляция экспрессии гена eve с помощью градиентов Hb и Kni. Внизу: карталокуса гена eve. (А).
Распределение градиентов Hb и Kni и паттерн экспрессии eve.Экспрессия eve в пределах полос, соединненных скобкой eve3+7 и eve4+6 управляетсясоответствующими энхансерами. (B). Кластеры мотивов, распознающих Hb. Виденсильный кластер в районе энхансера, управляющего «внутренними» полосами 4 и 6, иболее слабый кластер более слабых сайтов в энхансере, управляющем внешними полосами3 и 7. (С) Тоже для Kni. Сильный кластер присутствует только в энхансере, отвечающем заэкспрессию в полосах 3 и 7.4142BCD0.620.7020.06knikrotd0.40430.9330.3760.7540.4590.052.3 * 104KR30.060.40.7580.4380.2460.070.2754.4 * 106.5HG30.7712.3 * 105.4ABDB20.6150.4760.4131.1 * 103.6KNI20.3250.10.5441.1 * 107GT20.6650.6564.1 * 107.5PRD43 * 104EN20.6840.091.4 * 104.3TLL0.4934.4 * 10^33.6TTK0.4060.62306 * 1044.3FTZкоторых не показана зависимость от конкретного фактора.экспериментально определенных ЦРМ для различных энхансеров.
Пустые клетки соответствуют генам, дляТаблица 4 Сравнение положения гомотипических кластеров мотивов связывания регуляторных белков и0.4170.77900hairyhb31.2 * 104.80.930.5470.9184 * 104CADgtgsbftzeveenemsdllbtdabdaЛокусПорог PклПорог МПВ 4.2ФакторВыводы1. Установлены специфические особенности последовательностей ДНК,определяющие архитектуру взаимодействия ДНК с белковым фактором иобеспечивающие иерархическую организацию компонент генома.2. Оценена вероятность разномасштабных флуктуаций первичнойструктуры в модельной случайной последовательности ДНК, в результатекоторых самопроизвольно возникают участки специфического связываниярегуляторных белков.3.
Проведена сегментация последовательности генома на разныхмасштабах на участки, однородные по своему нуклеотидному составу.Сегментация осуществлялась с помощью вычисления статсуммывсевозможных разбиений последовательности на сегменты, что позволиловыявить участки ДНК, которые могут быть описаны статистическимимоделями.4.
Локализованы участки ДНК, соответствующие специфическомувзаимодействию с регуляторными белками-факторами. Большая точностьлокализации достигнута за счет учета симметрии структуры ДНК-белок, привзаимодействии с регуляторным фактором в форме димера.5. Проведена идентификация регуляторных сегментов ДНК (промоторыи энхансеры) как участков ДНК, имеющих высокую афинность ккооперативно связывающимся белковым факторам.6. Показано, что кооперативность взаимодействия регуляторныхфакторов с ДНК позволяет сформировать сложную картину экспрессии геновв пространстве развивающейся личинки Drosophila, под управлениемтрехмерных градиентов небольшого числа регуляторных белков.43Публикации по теме работыПолищук М.С., Хайнцель, А., Фаворов А.В., Макеев В.Ю.Сравнительный анализ участков связывания белков-регуляторовтранскрипции в раннем развитии Drosophila Melanogaster, определенныхметодом ChIP-chip, и вычислительно предсказанных кластеров сайтовсвязывания этих белков.
Биофизика. 2008, 53(5):754-7Bogush VG, Sokolova OS, Davydova LI, Klinov DV, Sidoruk KV, EsipovaNG, Neretina TV, Orchanskyi IA, Makeev VY, Tumanyan VG, Shaitan KV,Debabov VG, Kirpichnikov MP. A novel model system for design of biomaterialsbased on recombinant analogs of spider silk proteins. J Neuroimmune Pharmacol.2009 Mar;4(1):17-27.Лифанов А.П., Власов П.К., Макеев В.Ю., Есипова Н.Г. Нуклеосомныйповтор и расположение экзонов и интронов в генах коллагенов типов I и VIIБиофизика. 2008, 53(3):524-8.Рахманов С.В., Макеев В.Ю. Использование невзаимодействующихпроб в пространстве белковой структуры для построения статистическихпотенциалов межатомного взаимодействия Биофизика, 2008; 53(3):389-96.Britanova LV, Makeev VJ, Kuprash DV. In vitro selection of optimalRelB/p52 DNA-binding motifs.