Chest Volume 111 Number 6 June 1997

Поиск генов болезни: от муковисцидоза до саркоидоза

Michael C. Iannuzzi MD, FCCP, Benjamin A. Rybicki PhD, Mary Maliarik PhD, John Popovich Jr. MD, FCCP
Pulmonary and Critical Care Medicine, Henry Ford Health System, 2799 W Grand Blvd, Detroit MI 48202

Лекция Томаса А. Неффа (Thomas A. Neff)

Позиционное клонирование используется, чтобы идентифицировать гены, вызывающие наследственные болезни, на основании местоположения гена в хромосоме, без необходимости знания функции этого гена [1] [2]. Примерами использования этого подхода является идентификация генов муковисцидоза, наследственной геморрагической телеангиэктазии, болезни Хантингтона и нейрофиброматоза [3] [4] [5] [6]. Этих болезни являются простыми Менделевскими болезнями (дефект единичного гена), рецессивными, доминантными или связанными с полом. Гены более 400 Менделевских болезней были картированы на специфических хромосомах [7] и более 40 были позиционно клонированы [1].

Успех идентификации единичного гена болезни с использованием позиционного клонирования мотивирует поиск генов восприимчивости при сложных болезнях. Сложные болезни имеют тенденцию происходить в семьях, но не имеют простого типа наследования и их патофизиологический статус обычно зависит от взаимодействия генетических факторов и факторов окружающей среды. Примерами сложных болезней являются астма, рак легкого и саркоидоз.

Прогресс в использовании статистических методов, генетического картирования и исследования ДНК, делает применение позиционного клонирования выполнимым для сложных болезней. Цель этой статьи состоит в кратком рассмотрении генетического подхода к поиску генов сложных болезней. При поиске генов болезни производятся следующие шаги: (1) поиск семейной группировки болезни; (2) опредение семейного риска; (3) тест на Менделевское наследование; (4) поиск связанных маркеров; (5) поиск сцепленных маркеров; (6) локализация и клонирование гена; и (7) мутационный анализ.

Поиск семейной группировки

Неоходимость поиска генов сложных болезней с использованием генетического подхода вообще не рассматривается, если не существует доказательств семейной группировки болезни. Считается, что болезнь имеет семейную группировку, когда эпидемиологические данные показывают, что заболеваемость или распространенность болезни у пациентов выше чем заболеваемость или распространенность болезни среди близких родственников группы контроля (индивидуумы без болезни) [8].

Семейная группировка не всегда является доказательством, что существует генетический компонент или наследственная восприимчивость к болезни. Культурно или наследственно обусловленная реакция на окружающую обстановку или образ жизни могут увеличивать восприимчивость к болезни среди членов семьи или болезнь может быть более обычной из-за воздействия инфекционных или других агентов окружающей среды. Однако, семейная группировка болезни является основанием для проведения исследования с целью поиска и оценки наследственного компонента.

Определение семейного риска

После заключения, что семейная группировка болезни существует, необходимо задаться вопросом, сколько наследственных факторов вносят вклад в эту семейную группировку. Семейный риск может быть оценен количественно, используя риск повторения болезни у близких родственников (l), полученный путем деления риска повторения болезни у родственников пациентов на риск для всей популяции [9]. Величина l связана со степенью наследования гена среди родственников и указывает, насколько трудным, вероятно, будет картирование локуса восприимчивости. Величина l выше для простых Менделевских болезней, которые являются полностью пенетрантными и более легко картируются по сравнению со сложными болезнями, в которых близкие родственники с геном болезни часто не экспрессируют фенотип болезни (неполная пенетрантность). Например, относительный риск для родных братьев/сестер пациентов с муковисцидозом - более 500, в то время как для сахарного диабета первого типа - 15, 8.6 для шизофрении, 3.5 для диабета второго типа [9] [10] и 2.0 для саркоидоза (Rybicki, PhD; неопубликованные данные; 1997). Если l< 1.5, поиск гена восприимчивости болезни с использованием позиционного клонирования будет намного более труден и будет, вероятно, требовать нескольких сотен пар родственников [9][10].

Риск повторения также помогает разъяснить генетическую модель передачи болезни. Линейное снижение риска повторения болезни с уменьшением степени родства т.е. братья/сестры (первая степень), племянники/дяди/тети (вторая степень), кузены (третья степень), поддерживает предположение о наследовании единичного гена, в то время как экспоненциальное снижение риска предполагает взаимодействие нескольких локусов или факторов внешней среды, подразумевая, что единственный локус не играет преобладающей роли. Оценка риска повторения болезни в соответсвии с различными фенотипам или подгруппам болезни, может указывать, что существуют разные подгруппы болезни с генетическим компонентом. Например, было обнаружено, что l больше для пациентов с раком груди, чья болезнь была диагностирована в молодом возрасте [11]. Молодой возраст при постановке диагноза оказался хорошим фенотипическим маркером наследственной предрасположенности [12].

Тест на Менделевское наследование

Мендель предположил, что для каждой особенности или фенотипа, индивидуумы получают два различных фактора от их родителей. Эти факторы при формировании гаметы ведут к определенным отношениям фенотипов среди потомства. Сегрегационный анализ позволяет проверить, является ли наблюдаемый набор фенотипов среди потомства совместимым с простым Менделевским наследованием. За эти годы, сегрегационный анализ был расширен, чтобы проверить большее количество моделей наследования, но окончательная цель - та же самая: проверить на совместимость с Менделевскими ожиданиями и оценить параметры данной модели наследования [13]. Сегрегационный анализ обеспечивает получение доказательств за или против предложенной модели наследственной восприимчивости. Как и в контролируемых исследованиях, в котором статистическая связь между болезнью и воздействием не доказывает, что данное воздействие причиняет болезнь, статистическая совместимость между клинической картиной болезни среди членов семьи и доказательство Менделевского наследования не доказывает, что ген восприимчивости к болезни существует. Доказательство должно быть основано на более категорических биологических данных.

Поиск связанных маркеров

Поиск связанных маркеров - это поиск доказательств статистически значимой связи между аллелем и болезнью путем сравнения несвязанных пациентов и здоровых индивидуумов [8]. Многие подобные исследования относятся к 1950-м годам, когда преобладание некоторых групп крови было замечено у индивидуумов с некоторыми болезнями. Группа крови А была связана с раком желудка, группа крови O - с язвенной болезнью и токсемией при беременности [14]. С тех пор, генетические маркеры связывают с многими болезнями, наиболее известными из которых являются HLA-ассоциированые болезни, такие как сахарный диабет, рассеянный склероз и анкилозирующий спондилит [15]. Аллель HLA-B27, например, присутствует у 90 % пациентов с анкилозирующим спондилитом, но только у 9 % во всей популяции [16].

Главное ограничение поиска связанных маркеров - то, что аллельная ассоциация может возникать, даже если пациенты и группа контроля взяты от генетически различных популяций и даже при том, что никаких связей с наличием гена болезни не существует. Например, сообщалось, что аллель D2 гена рецептора дофамина, был связана с алкоголизмом [17]. Варианты аллеля Taq1, полиморфных по длинам рестрикционных фрагментов, расположенного ниже на 10 КБ по ходу транскрипции от аллеля рецептора дофамина D2, дает два аллеля, A1 и A2. Исследование, сравнившее 35 алкоголиков и 35 индивидуумов группы контроля, обнаружило аллель A1 у 69 % алкоголиков и 27 % индивидуумов группы контроля. Однако, этот результат не был подтвержден в других популяциях и возможно был получен, потому, что группа контроля этнически различалась от умерших от алкоголизма [18] [19].

Чтобы предотвратить такие ложные ассоциации, исследования должны выполняться в гомогенной популяции. Если связь найдена в смешанных популяциях, но не в гомогенной группе, нужно подозревать ''примесь'' гена. Учитывая трудности в отборе группы контроля, которая должна быть абсолютно согласована по этническому происхождению, лучшим выходом при поиске связанных маркеров является ''внутренняя'' группа контроля [9]. Это может быть сделано при изучении пациентов и их родителей [20] [21]. Например, если мать имеет генотип A1/A2, отец А3/А4, потомство A1/A4, то генотип A2/A3, два аллеля, которые потомство с изучаемой болезнью не унаследовало, обеспечивает ''искусственную'' группу контроля, которая хорошо согласована по этническому происхождению. Метод использования непереданных потомству аллелей как искусственной группы контроля называется affected family-based control method or haplotype relative risk method [22].

Хотя контролируемые исследования могут использоваться, чтобы определить, является ли ген-кандидат геном восприимчивости к болезни, эти исследования не подходят для сканирования генома человека, с использованием полиморфных маркеров, таких как короткие тандемные повторы или минисателлиты. Такие исследования потребовали бы тысяч генетических маркеров, чтобы охватить весь геном. Причина заключается в том, что ассоциации связи гена восприимчивости с болезнью, возникают из-за неравновесностью сцепления.

Неравновесность сцепления - тенденция для двух локусов, близко расположенных друг к другу на хромосоме, быть унаследованными вместе. Интервал неравновесности сцепления может изменяться от 1 до 20 сантиморган (приблизительно от 1 до 20 миллионов пар азотистых оснований). Это препятствует выбору приемлемого числа равномерно распределенных маркеров для сканирования генома. По этой причине, если ген-кандидат не может быть рационально выбран для проведения исследования, сканирование генома, используя анализ сцепления, будет необходимым.

Как только при сканировании генома будет идентифицирован регион расположения гена-кандидата, поиск сцепленных маркеров может использоваться как тонкий инструмент картирования, особенно при изучении изолированных популяций, например Финской и Hutterites. История Финской популяции началась 2,000-2,500 лет, от есть от 80 до 100 поколений назад [23] и Hutterite - приблизительно 500 лет назад - от 20 до 25 поколений [24]. Для этих популяций, неравновесность сцепления имеет очень короткий интервал, намного меньше чем 1 сантиморган, и из-за инбридинга, одна или несколько мутаций могут определять фенотип болезни. Любой маркер или ген-кандидат, связанный с болезнью, будет очень близок к гену болезни.

Поиск сцепленных маркеров

Генетический анализ сцепления проверяет маркер и предполагаемый локус болезни на косегрегацию. Традиционный метод подсчета lod (логарифм отношения шансов) проверяет вероятность рекомбинации между маркером и геном болезни по сравнению с независимой сегрегацией из двух локусов. Экспериментальный дизайн этого подхода включает (1) определение числа и типа семей, о которых будут собраны данные и взяты пробы крови для изоляции ДНК, (2) определение числа, типа и интервала генетических маркеров. ДНК маркеры - повторения нуклеотидов, чьи местоположения в хромосоме известны и обнаружены, с использованием полимеразной цепной реакции. Эти повторяющиеся нуклеотиды распределены во всем геноме примерно через каждые 100 КБ и различия в длине позволяют провести идентификацию различных аллелей по различиям в длине [25]. Карта маркеров человека была издана [26] и часто обновляется.

Традиционный метод подсчета lod требует большого количества семей или семей с сильным кровным родством, чтобы иметь достаточную статистическую мощность для обнаружения генетической связи. Такие семьи редки, и при исследовании сложных болезней семьи обычно имеют двух-трех индивидуумов с болезнью. Это ограничение ведет более частому применения непараметрических методов анализа, к которым относится метод исследования пар родственников с болезнью (ARP).

Метод ARP используется, чтобы определить, отклоняются ли переданные аллели у близких родственников с болезнью от Менделевских ожиданий. Например, величина Менделевских ожиданий у пар родственников, которые имеют общие 0, 1, или 2 гена составляет 0.25:0.5:0.25, соответственно [27]. Большая величина предполагает, что маркер связан с локусом болезни [28]. Метод ARP полезен при сложных болезнях, так как не требует определения типа наследования, не требует изучения родословных и не подвержен проблеме неполной пенетрантности, поскольку изучаются только пациенты с болезнью.

Локализация и клонирование гена

Как только ген восприимчивости локализаван в пределах хромосомы, следующий шаг - отсеивание нескольких миллионов пар азотистых оснований, поиск правильного гена. Так как средний размер гена - от 20 до 30 КБ, может оказаться необходимой проверка 30-50 или большего количества генов для поиска мутаций, вызывающих болезнь. Проект генома человека даст список всех потенциальных генов для предполагаемого локуса болезни. Исследователи смогут уменьшить список вероятных генов-кандидатов. Эта стратегия, называемая ''позиционное клонирование'' [29] начинается с картирования локуса болезни в хромосомальном субрегионе, используя анализ сцепления, сопровождаемый обзором этого региона для поиска привлекательного гена-кандидата. Успешный пример использования этого подхода - синдром Марфана.

Мутационный анализ

Доказательство, что ген-кандидат является геном болезни, зависит от обнаружения аллеля, который является варинтом последовательности ДНК, которая коррелирует с риском болезни, и/или в исследовании трансгенных животных демонстрирует, что добавление этого гена производит фенотипический эффект.

Заключение

Взаимодействие между генетическими факторами и факторами окружающей среды лежит в основе причины почти всех сложных болезней. Завершение проекта генома человека позволит составить каталог всех генов и поможет в идентификации генов восприимчивости к болезни. Однако, до использования этого каталога, будут необходимы исследования, использующие фенотипически характерные случаи и семейную группировку. Стратегия позиционного клонирования успешно применялась ко многим болезням с дефектом единичного гена и к идентификации генов, участвующих в сложных болезнях, таких как диабет и рак груди. Делались попытки применить эти методы к другим болезням с сильной семейной группировкой, но определение генетической предрасположенности к этим болезням до настоящего времени от нас уклоняется.