Генетическая информация (Темы и ответы на них)
Описание файла
Файл "Генетическая информация" внутри архива находится в следующих папках: Темы и ответы на них, 12. Документ из архива "Темы и ответы на них", который расположен в категории "". Всё это находится в предмете "информационная безопасность" из 7 семестр, которые можно найти в файловом архиве РТУ МИРЭА. Не смотря на прямую связь этого архива с РТУ МИРЭА, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "информационная безопасность" в общих файлах.
Онлайн просмотр документа "Генетическая информация"
Текст из документа "Генетическая информация"
Генетическая информация
Наследственная информация (генетический материал) у всех растений, животных, микроорганизмов и большинства вирусов представляется словами большой длины в четырехбуквенном алфавите:
ATGGTTCGTTCTTAT...
Каждое такое слово представляет собой полимерную молекулу ДНК, в состав которой входят четыре основания (нуклеотида):
А — аденин С — цитозин
G — гуанин Т — тимин
Существуют особые водородные связи А Т и G С (комплементарность), Такое попарное сопоставление нуклеотидов было выведено с помощью молекулярных моделей, на которых точно выдерживались все межатомные расстояния.
Природная молекула ДНК представляет собой две полимерные цепи попарно соединенных нуклеотидов, закрученные в форме двойной спирали (модель Уотсона—Крика):
Если отождествить ДНК с внешней памятью компьютера, например с магнитной лентой, то можно сказать, что информация записывается избыточно, так что к исходному слову приписывается его шаблон в дополнительном коде.
Введем в рассмотрение конечное поле F4 = (0, 1, , ), в котором операции производятся по модулю неприводимого многочлена х2 + х + 1, так что + = 1, = 1. Поэтому можно сопоставить нуклеотиды и элементы поля F4:
так что дополнительный нуклеотид определяется по правилу х 1 + х. Таким образом, А А+ 1 = Т, G G + 1 = С.
Очень длинные молекулы ДНК упакованы в клетке в небольшом объеме. Общая длина ДНК хромосом человека (около10 нуклеотидов) упакована в ядре диаметром меньше микрометра. Это означает, что в клетке ДНК компактизована.
Определенные отрезки (подслова) слова ДНК, несущие смысловую нагрузку, называются генами. Каждый ген кодирует информацию, ответственную за создание определенного белка. Средняя длина гена у человека порядка 104 нуклеотидов (букв). Таким образом, у человека присутствует порядка 10 различных белков.
Пути переноса информации, закодированной в ДНК, обобщены Ф. Криком в виде центральной догмы молекулярной биологии:
Сплошные стрелки обозначают здесь три основных великих канала передачи биологической информации: репликация, транскрипция и трансляция.
Продолжая аналогию с компьютером, в которой ДНК отождествляется с внешней памятью, можно сказать, что репликация соответствует копированию (размножению) магнитных лент. Транскрипция соответствует записи в оперативную память (РНК), а трансляция – обработке информации (построению белков).
Возможны и особые случаи переноса информации (на схеме они представлены штриховыми линиями). Так, наблюдалась репликация РНК и обратная транскрипция от РНК к ДНК. Далее, информация может непосредственно преобразовываться из ДНК в белок, минуя РНК (это наблюдалось в случае антибиотиков). «Запрещен» перенос информации от белков обратно к нуклеиновым кислотам. Это означает, что модификация белков (генных продуктов) не наследуется.
Способность ДНК к самовоспроизведению (репликации) лежит в основе размножения живых организмов. Модель двойной спирали позволила понять принцип удвоения ДНК. Представлялось логичным, что при удвоении ДНК две хромосомные нити «расплетаются», а затем каждая из них служит базисом, на котором выстраивается комлементарная ей новая цепь. В результате образуются две дочерние хромосомы (реплики), каждая из которых содержит по одной родительской хромосоме. Экспериментально показано, что именно так, по полуконсервативному механизму, происходит репликация ДНК:
Удивительная простота такой модели скрывает сложнейшие биохимические процессы, в которых участвует множество белков (ферментов). Эти белки, как и все другие, закодированы в последовательности нуклеотидов ДНК. В процессе эволюции сформировался сложный репликационный аппарат, обеспечивающий максимальную точность передачи информации от родительских к дочерним молекулам ДНК. По существующим оценкам ошибки репликации, приводящие к появлению неправильного нуклеотида, происходят с частотой порядка одной на 108 – 1010 нуклеотидов. В то же время синтез ДНК происходит с очень высокой скоростью – около 1000 нуклеотидов в секунду. Вся ДНК бактерий (порядка 107 нуклеотидов) воспроизводится за 20 минут.
Стабильность генетического материала объясняется существованием в клетках всех живых организмов специальных систем репарации (обнаружения и исправления ошибок). Каждый день появляются все новые данные, свидетельствующие о большом разнообразии систем репарации ДНК.
Перейдем теперь к описанию процесса транскрипции. При этом молекула ДНК превращается в молекулу РНК, в которой присутствуют также четыре основания. Основное отличие РНК от ДНК заключается в том, что вместо тимина Т появляется урацил U , так что при транскрипции происходит взаимно однозначное преобразование слов:
Существует следующее объяснение такого преобразования.
Аденин А и гуанин G относятся к классу пуриновых оснований, а тимин и цитозин – к классу пиримидиновых оснований. В любом живом организме часто и спонтанно происходит апуринизация, т.е. уменьшение доли аденина и гуанина. Каждая клетка человеческого организма ежедневно теряет около 5000 пуринов. В то же время пиримидины Т и С более устойчивы. Кроме того, постоянно происходит превращение одного кислотного основания в другое. При дезаминировании цитозин С превращается в урацил U, аденин А в гипоксантин, а гуанин – в ксантин. Чаще всего происходит превращение С U (в каждой человеческой клетке за день происходит около 100 таких событий). Если бы для хранения генетической информации вместо ДНК использовалась бы РНК, т.е. набор букв {А, U, С, G}, то ошибочные переходы С U невозможно было бы обнаружить. Если же выбрать алфавит {A,T,C,G}, то при дезаминировании всех оснований возникают основания, не характерные для ДНК. Это обстоятельство позволяет репаративной системе клетки узнавать продукт дезаминирования и удалять его. Можно сказать, что РНК является более естественной. Именно эта кислота участвует в основном процессе – в формировании белков. В то же время она неустойчива, поэтому заменяется на ДНК во «внешней памяти».
Вначале считали, что преобразованием Т V ограничивается весь процесс транскрипции (это справедливо для простейших организмов). Затем была обнаружена мозаичная структура гена. У некоторых организмов каждый ген разделен на чередующиеся участки: информационные слова (экзоны) и вставки (интроны). В процессе транскрипции все интроны вырезаются, а оставшиеся экзоны "сшиваются" (этот процесс называется сплайсингом):
Число интронов может сильно варьироваться: от одного в гене дрожжей до нескольких десятков (17 в гене птиц и 50 в гене млекопитающих). Интроны могут составлять большую часть мозаичного гена. Например, в гене птиц экзоны составляют лишь восьмую часть общей длины гена, а в гене млекопитающих – лишь двадцатую.
Таким образом, ДНК содержит огромную избыточность: лишь небольшая часть букв используется для формирования белков. По-видимому, такая избыточность нужна для обнаружения и исправления ошибок, т.е. интроны участвуют в системе репарации. Все это напоминает запись на магнитной ленте, когда после информационного файла добавляется контрольная сумма.
В настоящее время известно, что в интронах могут находиться важные элементы регуляции транскрипции – усилители, или энхансеры. Эти элементы были выявлены в опытах с искусственными генными конструкциями, составленными из отрезков ДНК разного происхождения. Энхансеры представлены короткими отрезками ДНК (десятки букв). Извлеченные из вирусных генов и включенные в состав искусственных генетических конструкций, они увеличивали эффективность транскрипции в десятки и сотни раз. Особенность энхансеров состоит в том, что они способны действовать на больших расстояниях (более чем 1000 букв) и вне зависимости от ориентации по отношению к направлению транскрипции гена. Наконец, в 1987 г. был обнаружен так называемый альтернативный сплайсинг: различные отрезки ДНК могут несколькими способами сшиваться в РНК, образуя разные модификации (изотипы) одного и того же белка. Разные типы образуются в разных тканях на определенных стадиях развития:
Таким образом, один ген может кодировать несколько различных белков.
Синтез молекул РНК начинается в определенных местах ДНК, называемыми промоторами, и завершается в терминаторах. Участок ДНК, ограниченный промотором и терминатором, представляет собой единицу транскрипции – оперон. В пределах каждого оперона копируется только одна из двух нитей ДНК, которая называется значащей или матричной. Во всех оперонах, считываемых в одном направлении, значащей является одна нить ДНК. В оперонах, считываемых в противоположном направлении, значащей является другая нить ДНК. Соседние опероны могут быть отделены друг от друга нетранскрибируемыми участками ДНК, а могут и перекрываться. Разбиение ДНК на множество оперонов обеспечивает возможность независимого считывания разных генов, их индивидуального включения и выключения. Транскрипция осуществляется специальным ферментом – РНК – полимеразой.
Генетический код
После того как на стадии транскрипции сформирована цепочка букв РНК:
AUGGUUCGUUC ...,
наступает этап превращения этого слова в последовательность белков (стадия трансляции).
Белки играют важнейшую роль в жизнедеятельности любых организмов. Некоторые белки являются ферментами, т.е. катализаторами биохимических реакций в живых организмах. Без участия ферментов подобные реакции не происходят или протекают слишком медленно. Другие белки (структурные) выполняют в организме роль строительных блоков. Некоторые белки, такие, например, как гемоглобин, участвуют в системе запасания и транспорта кислорода.
Белки – это большие полимерные молекулы, построенные из аминокислотных звеньев. В состав белков входят 20 различных видов аминокислот: Глицин (Gly), Аланин (Ala), Валин (Vat) и др. Таким образом, каждый белок представляет собой слово в 20-буквенном алфавите:
Met - Gln - Arg - Туг - Glu - Ser - Leu -...
В процессе трансляции происходит перевод четырех буквенного слова в 20-буквенное слово:
Сразу после того, как была признана модель строения ДНК, многие исследователи сосредоточили свое внимание на установлении истинной природы генетического кода. Было ясно, что, поскольку в состав белков входят 20 различных аминокислот, каждый кодон (набор букв, кодирующий аминокислоту), должен состоять не менее чем из трех нуклеотидов. Дублеты могли бы образовать не более 16 различных кодонов, в то время как на основе триплетов можно составить до 64 различных кодонов.
Можно представить себе несколько способов построения триплетного кода. Код мог бы быть перекрывающимся: