Часть 3 (1129751), страница 18
Текст из файла (страница 18)
табл. 1.1,стр. 18). Объем информации о последовательностях ДНК сейчас настолько велик(много десятков миллиардов нуклеотидов), что для ее хранения и анализа требуются мощные компьютеры.Секвенирование ДНК в больших объемах стало возможным после разработки в середине 70-х гг. метода дидезокси-секвенирования ДНК, который основанна синтезе ДНК in vitro, протекающем в присутствии терминирующих цепь дидезоксирибонуклеозидтрифосфатов (рис. 8.50).Несмотря на то что и в настоящее время используют тот же базовый метод, сделано много улучшений.
Секвенирование ДНК сейчас полностью автоматизировано:роботы смешивают ингредиенты, а затем загружают их, проводят синтез и считываютпоследовательность нуклеотидных оснований с геля. Терминирующие цепь нуклеотиды, помеченные флуоресцентными красителями разных цветов, ускоряют процесс;в данном случае все четыре реакции синтеза могут протекать в одной пробирке,а продукты могут быть разделены в одной дорожке геля. Расположенный вблизинижнего края геля детектор считывает и записывает цвет флуоресцентной меткина каждой полосе, по мере того как они проходят через лазерный луч (рис. 8.51).962Часть III.
МетодыРис. 8.47 (слева). Использование полимеразной цепной реакции в судебно-медицинской экспертизе.(а) Последовательность ДНК, создающая использующуюся в анализе вариабельность, состоит из короткихповторяющихся последовательностей, например, САСАСА…, которые располагаются в различных участках(локусах) человеческого генома. Количество повторений в каждом случае может быть высоковариабельным в популяции, в пределах от 4 до 40 у разных людей.
Последовательность повторов такого типа частоназывают гипервариабельными микросателлитыми последовательностями, — также известными, каклокусы с варьирующимся числом тандемных повторов (Variable Number of Tandem Repeat, VNTR). Поскольку в каждом локусе последовательности различаются, люди обычно наследуют различные вариантыот матери и от отца; таким образом, не находящиеся в родстве люди обычно не обладают одинаковымипарами последовательностей. ПЦР-анализ с использованием ограничивающих локус праймеров дает паруполос амплифицированной ДНК для каждого человека, одна полоса представляет собой материнскийвариант, а вторая — отцовский. Длина амплифицированной ДНК и, следовательно, положение ее полосыпосле электрофореза зависит от точного числа повторов в локусе.
(б) В представленном здесь схематическомпримере анализируются три одинаковых локуса VNTR (требующие трех различных пар специально выбранных олигонуклеотидных праймеров) трех подозреваемых (A, B и C), дающие для каждого человекаГлава 8. Манипуляция белками, ДНК и РНК 963Затем компьютер считывает и сохраняет эту нуклеотидную последовательность.Некоторые современные системы полностью отказались от традиционного геля,и разделение нуклеиновых кислот в них происходит при помощи капиллярногоэлектрофореза, метода, который еще сильнее ускоряет быструю автоматизацию.8.4.13. Нуклеотидные последовательности используют для предсказания аминокислотных последовательностей белковСейчас, когда секвенирование ДНК стало быстрым и надежным, оно сталопредпочтительным методом косвенного определения аминокислотных последовательностей большинства белков.
При наличии кодирующей белок нуклеотиднойпоследовательности процесс довольно прост. Несмотря на то что в принципе существует шесть различных рамок считывания, в которых последовательность ДНКможет быть транслирована в белок (по три на каждой цепи), правильную обычноможно распознать по отсутствию часто встречаемых в других рамках стоп-кодонов(рис. 8.52). Когда мы обсуждали генетический код в главе 6, то обнаружили, чтослучайная последовательность нуклеотидов, считываемая в рамке, будет кодировать сигнал остановки синтеза белка примерно каждые 20 аминокислот.
Нуклеотидные последовательности, кодирующие более длинные пептидные фрагменты,предположительно могут быть экзонами, и их можно транслировать (при помощикомпьютера) в аминокислотную последовательность и сравнить с базами данныхдля нахождения совпадений с известными белками других организмов. Если необходимо, можно секвенировать небольшую часть аминокислотной последовательностиочищенного белка и подтвердить или опровергнуть предсказанную при помощиДНК последовательность.Проблема, однако, состоит в том, чтобы определить, какие нуклеотидные последовательности в пределах всего генома являются генами, кодирующими белки.Идентификация генов очень проста, если последовательность ДНК взята из хромосом бактерий или архей, в которых отсутствуют интроны, или из клона кДНК.Расположение генов в таких нуклеотидных последовательностях может быть предсказано путем поиска в ДНК определенных отличительных особенностей (описанныхв главе 6).
Кодирующие белки гены идентифицируют путем поиска в нуклеотиднойпоследовательности открытых рамок считывания (ОРС), которые начинаютсяс инициирующего кодона, обычно ATG, и заканчиваются терминирующим кодономТАА, ТАG или TGA. Чтобы сократить количество ошибок до минимума, компьютеры, используемые для поиска ОРС, обычно программируют таким образом,чтобы они считали генами только последовательности, длина которых превышает,скажем, 100 кодонов.после электрофореза в полиакриламидном геле шесть полос ДНК.
Несмотря на то что некоторые людиимеют несколько общих полос, в целом картина для каждого человека индивидуальна. Таким образом,состав локусов может служить в качестве «отпечатка пальца» для практически инвариантной идентификации человека. Четвертая полоса (F) содержит продукты той же реакции cудебного образца. Исходнымматериалом для ПЦР может служить единственный волосок или мельчайшая капля крови, оставленныена месте преступления. При исследовании вариабельности в 5–10 различных локусах VNTR вероятностьтого, что два случайных человека будут обладать одинаковыми генетическими характеристиками, составляет примерно 1 к 10 миллиардам.
В показанном здесь случае подозреваемых A и C можно исключитьиз дальнейшего расследования, тогда как человек, обозначенный B, остается главным подозреваемымв совершении преступления. Подобный подход широко используют для установления отцовства.964Часть III. МетодыРис. 8.48. Получение больших количеств белка из кодирующей белок последовательностиДНК, клонированной в векторе экспрессиии введенной в клетку. Плазмидный вектор содержит очень активный промотор, благодарякоторому с прилегающего кодирующего белокгена синтезируются ненормально большиеколичества мРНК. В зависимости от характеристик вектора клонирования плазмиду вводятв клетки бактерий, дрожжей, насекомых илимлекопитающих, где вставленный в векторген эффективно транскрибируется и транслируется в белок.В случае более сложных геномов, например геномов животныхи растений, присутствие больших интронов в пределах кодирующей частигена усложняет процесс.
У большинства многоклеточных организмов,включая человека, экзон в среднемсостоит всего из 150 нуклеотидов.Таким образом, необходимо искатьи другие признаки, указывающиена присутствие гена, например, последовательности, сигнализирующиео границе между интроном и экзоном или отличительные регуляторные участки. Недавние попытки решить проблему предсказания экзонов привелик созданию алгоритмов искусственного интеллекта, позволяющих компьютеру наизвестных примерах обучаться тому, какие наборы характеристик свойственныграницам экзонов.Второй важный подход к идентификации кодирующих участков в хромосомах — описание нуклеотидных последовательностей обнаруживаемых мРНК (припомощи соответствующих кДНК).
мРНК (и получаемые из них кДНК) лишеныинтронов, регуляторных последовательностей ДНК и ненужной «промежуточной»ДНК, лежащей между генами. Таким образом, полезно секвенировать большиеколичества кДНК для получения очень подробных баз данных кодирующих последовательностей организма. Эти последовательности затем легко использоватьдля распознавания в длинной последовательности хромосомной ДНК экзонов,соответствующих генам.8.4.14. Геномы многих организмов полностью секвенированыВ большой степени благодаря автоматизации процесса секвенирования ДНКполностью расшифрованы геномы многих организмов, включая хлоропласты растений и митохондрии животных, геномы бактерий и архей и модельных организмов,широко изучаемых в лабораториях, например: дрожжей, круглого червя, фруктовоймушки Drosophila, модельного растения Arabidopsis, мыши, собаки, шимпанзе и,Глава 8.
Манипуляция белками, ДНК и РНК 965Рис. 8.49. Получение больших количеств белка при помощи плазмидного вектора экспрессии. В данном примере бактериальныеклетки подвергнуты трансфекции кодирующей последовательностью фермента ДНК-хеликазы; транскрипция этой кодирующей последовательности находится под контролем вирусного промотора,который становится активным только при температуре 37° C иливыше. Весь белок клетки проанализировали при помощи электрофореза в полиакриламидном геле в присутствии ДСН либо в случаебактерий, выращенных при 25° C (хеликаза не синтезируется), либопосле переноса той же бактерии в 42° C на 2 часа (фермент хеликазастала преимущественным видом белка в лизате).
(С любезного разрешения Jack Barry.)конечно, человека. Исследователи также полностьюрасшифровали последовательности ДНК разнообразных патогенов человека. Сюда входят геномы бактерий,вызывающих холеру, туберкулез, сифилис, гонорею,болезнь Лайма и язву желудка, а также сотен вирусов,включая вирус оспы и вирус Эпштейна – Барр (которыйвызывает инфекционный мононуклеоз). Исследованиегеномов этих патогенов позволяет понять, что делаетих инфекционными, и указывает путь к разработкеновых и более эффективных способов лечения.Haemophilus influenzae (бактерия, вызывающая ушные инфекции и менингиту детей) — первый организм, для которого полностью расшифровали последовательность генома — все 1,8 миллионов п. н. — при помощи секвенирования методом «дробовика» (шотган-секвенирование, shotgun sequencing method), наиболеераспространенного в настоящее время подхода.