Филогенетический след
Филогенетический след — это метод, используемый для идентификации сайтов связывания транскрипционных факторов (TFBS) в интересующей некодирующей области ДНК путем сравнения ее с ортологической последовательностью у разных видов . Когда этот метод используется с большим количеством близкородственных видов, это называется филогенетическим затенением . [1]
Исследователи обнаружили, что некодирующие участки ДНК содержат сайты связывания регуляторных белков, которые управляют пространственно-временной экспрессией генов . Эти сайты связывания транскрипционных факторов (TFBS), или регуляторные мотивы, оказалось трудно идентифицировать, в первую очередь потому, что они короткие по длине и могут демонстрировать последовательностей вариации . Важность понимания регуляции транскрипции для многих областей биологии побудила исследователей разработать стратегии прогнозирования присутствия TFBS, многие из которых привели к созданию общедоступных баз данных. Одним из таких методов является Филогенетический след .
Филогенетический след опирается на две основные концепции:
- Функции и ДНК связывания предпочтения факторов транскрипции хорошо консервативны у разных видов .
- Важные некодирующие последовательности ДНК, необходимые для регуляции экспрессии генов, будут проявлять различное селективное давление. В TFBS происходят более медленные изменения, чем в других, менее важных частях некодирующего генома. [2]
История
[ редактировать ]Филогенетический след был впервые использован и опубликован Тагле и др. в 1988 году, что позволило исследователям предсказать эволюционно консервативные цис-регуляторные элементы, ответственные за экспрессию генов эмбриональных ε- и γ- глобулинов у приматов. [3]
До филогенетического следа использовался ДНКазный след, при котором белок связывался с сайтами связывания факторов транскрипции ДНК (TFBS), защищая его от расщепления ДНКазой. Одной из проблем этого метода было количество времени и труда, которое потребовалось бы. В отличие от ДНКазного следа, филогенетический след основан на эволюционных ограничениях внутри генома, при этом «важные» части последовательности сохраняются среди разных видов. [4]
Протокол
[ редактировать ]При использовании этого метода важно решить, с каким геномом должна соответствовать ваша последовательность. Более дивергентные виды будут иметь меньшее сходство последовательностей между ортологичными генами. Следовательно, ключевым моментом является выбор видов, которые достаточно родственны, чтобы обнаружить гомологию, но достаточно расходятся, чтобы максимизировать «шум» неприсоединения. Поэтапный подход к филогенетическому следу состоит из:
- Следует определиться с интересующим геном.
- Тщательно выбирайте виды с ортологичными генами.
- Определите длину восходящего или, возможно, нисходящего региона, который будет рассматриваться.
- Выровняйте последовательности.
- Ищите консервативные регионы и анализируйте их.
Не все TFBS обнаружены
[ редактировать ]Не все сайты связывания транскрипции можно найти с помощью филогенетического следа из-за статистического характера этого метода. Вот несколько причин, по которым некоторые TFBS не обнаруживаются:
Видоспецифические сайты связывания
[ редактировать ]Некоторые сайты связывания, по-видимому, не имеют существенных совпадений у большинства других видов. Следовательно, обнаружение этих участков с помощью филогенетического следа, вероятно, невозможно, если не доступно большое количество близкородственных видов.
Очень короткие сайты связывания
[ редактировать ]Некоторые сайты связывания демонстрируют отличную сохранность, но в более коротком регионе, чем те, которые искали. Такие короткие мотивы (например, GC-box) часто встречаются случайно в нефункциональных последовательностях, и обнаружение этих мотивов может быть сложной задачей.
Менее специфичные связывающие факторы
[ редактировать ]Некоторые сайты связывания демонстрируют некоторую консервативность, но имеют вставки или делеции. Не очевидно, сохраняют ли эти последовательности со вставками или делециями функциональность. Хотя они все равно могут быть функциональными, если связующий фактор менее специфичен (или менее «придирчив», если хотите). Поскольку делеции и инсерции в сайтах связывания встречаются редко, рассмотрение вставок и делеций в последовательности позволит обнаружить еще несколько истинных TFBS, но, вероятно, может включать гораздо больше ложноположительных результатов.
Недостаточно данных
[ редактировать ]Некоторые мотивы достаточно хорошо сохраняются, но в конкретном наборе данных они статистически незначимы. Мотив мог появиться у разных видов случайно. Эти мотивы можно было бы обнаружить, если бы были доступны последовательности из большего количества организмов. Так что в будущем проблем будет меньше.
Области связывания соединений
[ редактировать ]Некоторые факторы транскрипции связываются в виде димеров. Следовательно, их сайты связывания могут состоять из двух консервативных участков, разделенных несколькими вариабельными нуклеотидами. Из-за изменчивой внутренней последовательности мотив не может быть обнаружен. Однако если бы мы могли использовать программу для поиска мотивов, содержащих переменную последовательность в середине, без подсчета мутаций, эти мотивы можно было бы обнаружить.
Точность
[ редактировать ]Важно иметь в виду, что не все консервативные последовательности находятся под давлением отбора. Для исключения ложноположительных результатов необходимо провести статистический анализ, который покажет, что зарегистрированные мотивы имеют значительно меньшую частоту мутаций, чем частота мутаций окружающей нефункциональной последовательности.
Более того, результаты могут быть более точными, если учитывать предварительные знания о последовательности. Например, некоторые регуляторные элементы повторяются 15 раз в промоторной области (например, некоторые металлотионеиновые промоторы содержат до 15 металлических реагирующих элементов (MRE)). Таким образом, чтобы Чтобы устранить ложные мотивы с непостоянным порядком у разных видов, ориентация и порядок регуляторных элементов в промоторной области должны быть одинаковым у всех видов. Этот тип информации может помочь нам идентифицировать регуляторные элементы, которые не сохраняются должным образом, но встречаются в нескольких копиях во входной последовательности. [5]
Ссылки
[ редактировать ]- ^ Филогенетическое отслеживание последовательностей приматов для поиска функциональных областей генома человека дои : 10.1126/science.1081331
- ^ Неф, С. и Томпа, М. 2006. MicroFootPrinter: инструмент для филогенетического отслеживания в геномах прокариот. Исследования нуклеиновых кислот . 34:366-368
- ^ Тагл, Д.А., Куп, Б.Ф., Гудман, М., Слайтом, Дж.Л., Хесс, Д. и Джонс, RT 1988. Эмбриональные гены ε- и γ-глобина прозимианского примата (Galago crassicaudatis): нуклеотидные и аминокислотные последовательности, регуляция развития и филогенетические следы. Дж. Мол. Биол. 203:439-455.
- ^ Чжан З. и Герштейн М. 2003. О мышах и людях: филогенетический след помогает обнаружению регуляторных элементов. Ж. Биол. 2:11-11.4
- ^ Бланшетт, М. и Томпа, М. 2002. Открытие регуляторных элементов с помощью вычислительного метода филогенетического следа. Геном Рез. 12:739-748