Диссертация (1144820), страница 8
Текст из файла (страница 8)
Существенное значение для анализа силы ассоциацииимеет размер выборки. Чем она больше, тем выше значимость ассоциации. Сдругой стороны, имеет значение и гомогенность выборки. Статистическизначимыми результатами при проведении GWAS исследований считаютсярезультаты с уровнем достоверности больше, чем 1X10-8 (с учетом поправкиБонферони для 1 000 000 SNP) (Zeller et al., 2012).На сегодняшний день идентифицировано свыше 1200 локусов,ассоциированных с более, чем c 165-тью хроническими заболеваниями (Zuk49et al., 2012). На рисунке 2 приведена одна из карт болезней, где по кругуприведены все хромосомы человека, а кружками различного цветаобозначены статистически значимые маркеры того или иного заболевания.Рисунок 2.
GWAS-варианты, ассоциированные с риском сердечнососудистых заболеваний (по Schnabel et al., 2012).Полногеномный анализ сцепления или GWLS (Genome Wide LinkageStudies) является разновидностью метода GWAS (Kitsios et al., 2009) и в тоже время близок методу идентичных по происхождению общих аллелей(TDT). При методе TDT проводят анализ двух тесно сцепленных локусов.Для того чтобы определить, будет ли маркерная аллель «передаватьзаболевание», обследуют обоих родителей больного ребенка. Если родители,50являющиеся гетерозиготами по данной аллели, передают ее больномуребенку более чем в 50% случаях, то, с высокой вероятностью можноговорить о существовании связи между маркером (этой аллелью) изаболеванием (Пузырев, 2003; Naber et al., 2004). Метод GWLS используюттолькоприсемейныхисследованиях,анализируяблоки(группы)молекулярных маркеров, которые передаются от родителей больнымпотомкам. Метод позволяет локализовать область интереса размером от 1 до10 Мб, которые могут включать сотни генов.Несмотря на успехи в идентификации генов-кандидатов МФЗ, анализполученных результатов показывает, что выявленные ассоциации могутобъяснить не более 10-20% наследственной составляющей даже для хорошоизученных заболеваний.
В редких случаях и только при использованииспециальных статистических методов эта величина приближается к 50 %.Считают, что причины такого несоответствия связаны не столько с редкимиаллелями, не выявляемых методом GWAS, сколько с особенностямимежгенных взаимодействий, в частности, с эффектом эпистаза, лежащего воснове «фантомной» или «исчезающей» наследуемости (Zuk et al., 2012).1.2.4. Полногеномное секвенирование.Методыполногеномногоили,такназываемого,«глубокого»параллельного секвенирования в настоящее время рассматривают какнаиболее значимую альтернативу методу GWAS.
Основное преимуществоэтого подхода заключается в том, что он позволяет анализировать всевозможные альтернативные варианты в геноме человека, и при этом обладаетвысокой точностью анализа, сопоставимой с таковой при традиционномсеквенировании по Сенгеру (Скрябин и др., 2009; Чеканов и др., 2010).Существенно отметить, что для решения большинства медицинскихзадач вполне достаточно секвенирование не всего генома, а только егокодирующей последовательности – экзома или таргетных (целевых)областей.Дляэтихцелейнетнеобходимостив«больших»51высокопроизводительных технологиях, которые предлагает фирма «Illumina»(«Hiseq»), подходящими вариантами являются методы, основанные наэффекте полупроводниковой платформы и технологиях пирофосфатногосеквенирования (см.
п.1.3.3).Однимизприоритетныхсеквенированияявляетсяпроектоввобластипроектполногеномного«1000Геномов»(http://www.1000genomes.org), а также проекты «100 000 геномов англичан»,«Российские геномы» (http://genomerussia.bio.spbu.ru) и другие аналогичныепроекты, целью которых является составление гаплокарт различныхпопуляций с картированием на них всех возможных вариантов нуклеотидныхпоследовательностей.Методы«глубокогосеквенирования»можноиспользоватьдляидентификации не только однонуклеотидных замен, но и других перестроек,в том числе делеций и инсерций размерами от 1 до 1000000 п.о.
Наибольшийинтерес представляют вариации числа копий – Copy Number Variations(CNV), с которыми связывают риск разных заболеваний, в том числепсихических и сердечно-сосудистых. В частности, установлено, что делецияэкзона гена BAG3 ассоциирована с делитационной кардиомиопатией(Schnabel et al., 2012).1.2.5. Анализ транскриптома.Однимизметодовидентификацииианализаструктурно-функциональной организации генов может быть исследование особенностейих экспрессии в норме и при патологии.
Так, используя технологиюмикрочипов (см. п. 1.3.2.4), на сегодняшний день получены экспрессионныепрофилидлямногихсердечно-сосудистыхзаболеваний:какмеждукогортами больных и здоровых, так и между группами больных в ответ накакое-либо воздействие факторов внешней среды (например, физическойнагрузки, питания, приема лекарственных средств) (Freedman et al., 2010).Примеромтакогоподходаможетбытьисследованиепервичной52последовательности локуса гена липазы А (LIPA) и его экспрессии какпредикторов риска развития ИБС (Schnabel et al., 2012).Еще больший интерес представляет изучение профиля экспрессииаллельных вариантов генов-кандидатов, а также исследование регуляторныхмикроРНК.МикроРНК – класс малых некодирующих РНК длиной около 21-24нуклеотидов.
Эти РНК играют важную роль в регуляции трансляции идеградации мРНК. Исследования микроРНК начаты относительно недавно.МикроРНК участвуют в регуляции практически всех биологическихпроцессов, включая эмбриональное развитие, иммунный ответ, апоптоз,канцерогенез, жизнедеятельность стволовых клеток, клеточный метаболизм,ответ на оксидативный стресс (Gunel, 2011).
Многие микроРНК являютсябиомаркерами различных онкологических, нейродегенративных и ССЗ. Так,концентрация miR-126 и miR-17, присутствующих в эндотелии сосудов иmiR155, локадизованной в сердечной мышце, сильно увеличены в кровипациентов с ИБС (Schnabel et al., 2012).Исследования процессов транскриптомики и её регуляции, в том числес помощью микроРНК представляют большой интерес для поиска«недостающей» наследственной составляющей МФЗ (Баранов, Баранова,2012).1.2.6. Анализ эпигенома.Изучению эпигенетических модификаций генома уделяют большоевнимание. Международные проекты, посвященные эпигеному, охватываютширокий спектр исследований – от эпигенетических изменений отдельныхгенов до анализа профиля метилирования ДНК и модификаций гистоновцелых хромосом.
Применение новых методов секвенирования такжеспособствует развитию эпигенетики.Благодаряэпигенетическимисследованиям,установлено,чтомодификация гистонов является необходимым условием для работы53фермента, кодируемого геном NO-синтазы – одного из главных регуляторовтонуса сосудов. Подавление метилирования гистонов зачастую вызываетсягипоксией - одним из наиболее распространенных факторов риска сердечнососудистых заболеваний (Schnabel et al., 2012).Установлена также обратная корреляция между метилированиемпромоторной области гена инсулина и количеством инсулина, чтоподтверждает вклад эпигенетических факторов в риск развития сахарногодиабета II типа (СД II) и его осложнений.
Метилирование сайта CCCTCсвязывающего фактора (CTCF) в локусе 11p15 также может быть факторомриска СД II (Schnabel et al., 2012).Число научных работ по эпигенетике МФЗ увеличивается поэкспоненте и в ближайшее время позволит получить подробные карты«динамического метилома тканей человека на разных стадиях развития(Schnabel et al., 2012).1.2.7. Генные сети и компьютерная геномика.Сравнительно новым методом картирования генов МФЗ является метод«компьютерной геномики» (биоинформатики).
В рамках этого направленияорганизмрассматриваюткаксовокупностьсложных,зачастуюперекрывающихся сетей взаимодействующих генов, на основе которыхформируются метаболические пути белков, образующих метаболом клетки,тканей и целого организма.Если известен некоторый молекулярно-генетический процесс, то гены,участвующие в нём, соединены через взаимодействия их белков в единуюфункциональную систему (Franke et al., 2006; Goh et al., 2007). Вэксперименте можно установить множество взаимодействий между парамигенов.Коллекциятакихвзаимодействийпредставляетсобойбазуассоциаций, являющейся основой для связей между генами определённогопроцесса (см.
рис. 3). Однако, далеко не все гены, ассоциированные междусобой, играют одинаково важную роль в таком процессе. Так, мутация54рибосомного белка может привести к нарушению трансляции белков, а,следовательно, и к нарушению многих процессов, например, процессасвёртывания крови, но такая мутация мало интересна для изучения этогопроцесса. Интерес представляют только те гены, изменение активностикоторых существенно влияет на ход данного процесса (Franke et al., 2006).При наличии начального знания о принадлежности каких-нибудь генов кэтому процессу, используя ассоциативную сеть разных баз знаний можновыявить и других её участников. Ясно, что поиск новых участников следуетпроводить вблизи (на расстоянии одной ассоциации) от уже известных геновэтого процесса, поскольку они образуют единую сеть взаимодействий (рис.3).Одним из ключевых понятий современной биоинформатики являетсяпонятие дизизосомы (см.
рис. 4), используемое для определения набора всехизвестных ассоциаций между болезнями и соответствующими им генами,полиморфизм или мутации которых ассоциированы с этими заболеваниями(Goh et al., 2007).Рисунок 3. Схема детекции новых генов-кандидатов заболеваний наосновании реконструкции генетической сети (по Franke et al., 2006).55Окружности – заболевания, линии – общие гены, размеры окружности пропорциональнычислу генов.Прямоугольники - гены, линии - генные связи, общие для разных болезней.ДИЗИАСОМА - совмещение фенотипа с соответствующими генами-маркерами.Рисунок 4. Дизизосома (по Баранов, 2008; Goh et al., 2007).Разработка дизизосом важна для выяснения наследственных причинМФЗ.