Диссертация (1145736), страница 19
Текст из файла (страница 19)
Последовательность 3’UTR гена sbr. Окончание белок-кодирующего регионавыделено полужирным шрифтом. Звёздочки обозначают концы транскриптов, определённыепосредством 3’ RACE-PCR в образцах из голов и яичников, буквы “с” – из семенников. Важныедляполиаденилированияэлементыобозначеныкак:majPAS—мажорныйсайтполиаденилирования, minPAS — минорный сайт полиаденилирования, USE — upstreamsequence element, DSE — downstream sequence element, поли(U)-тракт.
Также отмеченыпредсказанные сайты связывания микроРНК (по Ginanova et al. 2016).Важно отметить, что в семенниках не были выявлены транскрипты гена sbr, которые небыли бы укорочены с 3’-конца: как полноразмерный, так специфичные для семенниковтранскрипты, имеют одинаковый 3'UTR (Рис. 14). В то же время среди транскриптовисследуемого гена в тканях головы или яичников вариант полиаденилирования, характерныйдля семенников, не представлен среди мажорных фракций транскриптов (Рис.
14). Кроме того,даже более длинные 3'UTR в тканях головы и яичников имеют несколько разнуюспецифичность: в тканях головы мажорными являются одни варианты 3'UTR, а в тканяхяичника другие (Рис. 19), но в целом используются одни и те же PAS. Что же делаетальтернативный PAS, использующийся в семенниках, непривлекательным для сборкикомплекса полиаденилирования в тканях головы или яичников: скорость транскрипции,вторичная структура транскрипта или особые условия, специфичные для семенников?Во-первых, для транскриптов в семенниках, где клетки активно пролиферируют,характерно использование проксимального к кодирующей области сайта полиаденилирования(Sartini et al.
2008), что мы и наблюдаем в данном случае. За счёт этого транскрипты болеестабильны (Mayr and Bartel, 2009; Hogg and Goff, 2010; Yepiskoposyan et al. 2011) и способны83продуцировать больше белка (Sandberg et al. 2008; Mayr and Bartel 2009; Smibert et al. 2012).Органоспецифичные PAS часто содержат другие регуляторные последовательности, чемканонические (Hafez et al. 2013).
Во-вторых, полиаденилирование в семенниках осуществляетсяс участием особых факторов 3’-процессинга (Di Giammartino et al. 2011). Показано, например,что у мыши для нормального сперматогенеза нужен белок τCstF64 (специфичный вариантCstF64), а его отсутствие приводит к мужской стерильности. По-видимому, этот белокобеспечивает выбор определённых PAS, которые в соматических клетках, где этого факторанет, не используются (Dass et al.
2007).3'UTR гена sbr содержит предсказанные сайты для связывания со следующимимикроРНК: dme-miR-1014, dme-miR-184, dme-miR-281-2 (предсказано с помощью MicroCosm,EMBL-EBI13, Griffiths-Jones et al. 2008):3' ugacagcugccuAUCGAGAGAa 5' dme-miR-281-2*|||||||||225:5' gauagauuaguuUAGCUCUCUu 3' sbr3' cgGGAAUAGUCAAGAGGCAGGu 5' dme-miR-184:||| | ||| |||||||241:5' ucUCUU-UAAGU--UCCGUCCg 3' sbr3' gaCGUUUACUUUUACUUAAAa 5'|:|||| || |||||||666:5' ccGUAAAUUCAAUUGAAUUUa 3'dme-miR-1014sbrВидно (Рис. 34), что использование альтернативных PAS в семенниках или яичникахприводит к исключению некоторых из них из состава транскрипта. Для miR-184 дрозофилыизвестна роль в оогенезе и раннем эмбриогенезе через контроль дифференцировки женскихпервичных половых клеток (Iovino et al.
2009). Однако экспериментальных данных освязывании микроРНК с геном sbr нет, поэтому о механизмах регуляции с помощью микроРНКможно только предполагать.Помимо длины 3'UTR на интенсивность трансляции и судьбу транскрипта влияет идлинаполи(А)-хвоста.Присозреванииооцитовдрозофилы,например,специальнаяцитоплазматическая полимераза удлиняет поли(А)-хвост, что повышает эффективностьтрансляции многих мРНК (по Eichhorn et al. 2016).
Поэтому не стоит пытаться объяснить посттранскрипционную регуляцию экспрессии гена исключительно событиями альтернативногополиаденилирования. Тем более что в случае гена sbr, специфичность экспрессии неограничивается формированием альтернативного укороченного 3'UTR: второй характернойчертой является использование альтернативных промоторов, что приводит к появлениютранскриптов, укороченных и с 5’-конца, по сравнению с универсальными.13http://www.ebi.ac.uk/enright-srv/microcosm/htdocs/targets/v5844.1.2 Альтернативные промоторы гена sbr (Dm nxf1)Интересно отметить, что в соответствии с исследованиями последнего времени, междупроцессами инициации и терминации транскрипции существует петля обратной связи, и выборсайта полиаденилирования влияет на эффективность инициации транскрипции гена (Andersen etal.
2013). C-терминальный домен (CTD) РНК полимеразы II является посадочной платформойдля взаимодействия множества факторов, которые контролируют инициацию транскрипции, еёэлонгацию и терминацию. Так, факторы расщепления и полиаденилирования обнаружены напромоторах генах, где они способны взаимодействовать с транскрипционными факторами иактиваторами транскрипции, будучи связанными с CTD РНК полимеразы II (по Oktaba et al.2015). Поэтому важно помнить о том, что биогенез мРНК – комплексный процесс смножеством взаимосвязанных путей регуляции.Пытаясь определить TSS in silico, мы убедились, что предсказанные промоторы плохосовпадают с обнаруженными в экспериментах. С использованием алгоритма Neural NetworkPromoter Prediction, Berkeley Drosophila Genome Project14, который отрабатывали напоследовательностях D.
melanogaster, были предсказаны следующие промоторные области вгене sbr (приведены TSS со значимостью больше 0,95):167 н. гена sbr – похож на выявленный в этой работе TSS в тканях головы ияичника;несколько предсказанных TSS в интроне 3: 2185, 4280, 4377, 7836, 9166, 9193 н.гена sbr – не совпадают с выявленными TSS в тканях семенника;2 предсказанных TSS в интроне 5: 11982, 12095 н.
гена sbr.Несовпадение предсказанных промоторов в интроне 3 гена sbr с выявленными нами ииспользуемыми в семенниках ещё раз убеждает, что алгоритм предсказания семенниковоспецифичных промоторов имеет свою специфику и нуждается в разработке. Точки началатранскрипции в экзоне 4, описанные нами для транскриптов голов и яичников и ужевыявленные ранее (AY069415) в Berkeley Drosophila Genome Project, также не предсказаныодноимённым алгоритмом.И всё же определённые особенности промоторных областей существуют. Геномныйанализ позволил выделить промоторы разных типов у млекопитающих: ТАТА и CpG-rich(Carninci et al. 2006).
В геноме D. melanogaster идентифицированы промоторы, содержащиеTATA box – TATAWAAR (~30% промоторов), the initiator (Inr) – TCAKTY (~65% промоторов,функционирующие как вместе с TATA-box, так и отдельно), Downstream Promoter Element(DPE) – RGWYV и другие (Ohler et al. 2002; Gershenzon et al. 2006). Возвращаясь к обсуждению14http://www.fruitfly.org/seq_tools/promoter.html85полученныхрезультатов,следуетотметить,чтоприанализепоследовательностей,предшествующих обнаруженным TSS в экзонах 2 и 3, найти промоторы типа TATA box или Inrне удалось, что также говорит о малой предсказательной силе полученных в результатеполногеномного анализа данных. Однако в области 3’-конца интрона 3 в том месте, гденачинаютсясеменниково-специфичныетранскрипты,можнообнаружитьхарактернуюпоследовательность TATATAAT, свойственную промоторам ТАТА (Рис.
35), а также DPE нарасстоянии 57 н. от промотора. Это свидетельствует о возможности начала транскрипции вэтом районе (по Ginanova et al. 2016).954596159685975598259895TATA****DPE↓tatataatgtatatagtagaaagtgatttaagttcagagaagatttcagtaagctaactgaataaagtca**↓<-----237н.-интрон------------------------aatattattgcttacatctacagacgtgtacgtgattcttcctatttttagacatttagagctatctctc-------------------uORF------------------------uORF------------------cgttttacacactccattggatgatctatcgcagaaccaacacgaaatatggagcactgctggcaaaaca------uORF--------uORF-----------------------------------------------tgagttcatgagttggccgatgagataatttcggtcgctgctatctgtgcaccatataagtttatataat------------------uORF--------------237н.-интрон----->aatcgacagacgacgtctaatggtttccctttttccgcatttttctttttgcagTTACAAAACGCCCAGAстарт-кодонTATACGAAAAGGAAACACTCTTGAGTGCTCTATTGGCAGCGATGTCGCCACATGTCTTTATTCCTCAATAРисунок 35.
Последовательность фрагмента гена sbr: окончание интрона 3 и начало экзона 4(выделен прописными буквами). Красная звёздочка обозначает TSS для транскриптов первоготипа с сохранением интрона 237 н., выявленную при 5’ RACE-PCR. Звёздочки – TSSтранскриптов второго типа, в которых вырезаются последние 237 н. интрона 3. Стрелкамиотмечены два мажорных пика старта транскрипции по данным CAGE-seq. Также обозначены:ТАТА – TATA-box промотор, DPE – downstream promoter element, старт-кодон AUG, с которогоначинается трансляция семенниково-специфичных транскриптов sbr (красным шрифтом).uORFs (upstream ORF) и интрон 237 н.
могут быть регуляторами эффективности трансляции(см. текст) (по Ginanova et al. 2016).Как структура 3'UTR, так и структура 5'UTR значимы для регуляции судьбытранскрипта. Последовательность, представляющая собой интрон (237 н.), который удаляется вболее коротких семенниковых транскриптах sbr второго типа, содержит шесть сайтовинициации трансляции AUG (Рис. 35), принадлежащие коротким ORF. Более подробно данныеоб uORF приведены в Таблице 4. Присутствие в 5'UTR нескольких uORF – это фактор,контролирующий трансляцию у млекопитающих и дрозофилы.