Филогенетическое профилирование
Филогенетическое профилирование — это метод биоинформатики , в котором совместное присутствие или совместное отсутствие двух признаков у большого числа видов используется для вывода о значимой биологической связи, например, об участии двух разных белков в одном и том же биологическом пути . Наряду с исследованием консервативной синтении , консервативной структуры оперонов или слияний доменов «Розеттского камня» , сравнение филогенетических профилей является назначенным методом «постгомологии», поскольку вычисления, необходимые для этого метода, начинаются после того, как определено, какие белки гомологичны белкам. который. Некоторые из этих методов были разработаны Дэвидом Айзенбергом и его коллегами; Сравнение филогенетических профилей было введено в 1999 году Пеллегрини и др. [1]
Метод
[ редактировать ]Более 2000 видов бактерий , архей и эукариот в настоящее время представлены полными последовательностями генома ДНК . Обычно каждый ген в геноме кодирует белок , который можно отнести к определенному семейству белков на основании гомологии . Для данного семейства белков его присутствие или отсутствие в каждом геноме (в исходной бинарной формулировке) обозначается либо 1 (присутствует), либо 0 (отсутствует). Следовательно, филогенетическое распределение семейства белков может быть представлено длинным двоичным числом с цифрой для каждого генома; такие бинарные представления легко сравниваются друг с другом для поиска коррелирующих филогенетических распределений. Большое количество полных геномов делает эти профили богатыми информацией. Преимущество использования только полных геномов состоит в том, что значения 0, обозначающие отсутствие признака, обычно являются надежными.
Теория
[ редактировать ]Следует ожидать, что близкородственные виды будут иметь очень похожие наборы генов. Однако изменения накапливаются между более отдаленно родственными видами в результате процессов, которые включают горизонтальный перенос генов и их потерю. Отдельные белки имеют специфические молекулярные функции, например, выполняют одну ферментативную реакцию или служат субъединицей более крупного белкового комплекса. Биологический процесс, такой как фотосинтез , метаногенез или биосинтез гистидина , может требовать согласованного действия многих белков. Если какой-то белок, критически важный для процесса, будет потерян, другие белки, участвующие в этом процессе, станут бесполезными; естественный отбор делает маловероятным сохранение этих бесполезных белков в течение эволюционного времени. Следовательно, если два разных семейства белков постоянно имеют тенденцию либо присутствовать, либо отсутствовать вместе, вероятная гипотеза состоит в том, что эти два белка взаимодействуют в каком-то биологическом процессе.
Достижения и проблемы
[ редактировать ]Филогенетическое профилирование привело к многочисленным открытиям в биологии, включая ранее неизвестные ферменты в метаболических путях , факторы транскрипции , которые связываются с консервативными регуляторными сайтами , и объяснение роли определенных мутаций в заболеваниях человека . [2] Улучшение самого метода является активной областью научных исследований, поскольку сам метод сталкивается с рядом ограничений. Во-первых, совместное появление двух семейств белков часто представляет собой недавнее общее происхождение двух видов, а не консервативные функциональные отношения; устранение неоднозначности этих двух источников корреляции может потребовать усовершенствованных статистических методов. Во-вторых, белки, сгруппированные как гомологи, могут различаться по функциям, или белки, функции которых консервативны, могут не регистрироваться как гомологи; усовершенствованные методы адаптации размера каждого семейства белков с учетом функциональной консервации приведут к улучшению результатов.
Инструменты
[ редактировать ]Инструменты включают PLEX (Protein Link Explorer). [3] (ныне несуществующий) и JGI IMG (Интегрированные микробные геномы) Филогенетический профилировщик (как для отдельных генов, так и для генных кассет ). [4]
Примечания
[ редактировать ]- ^ Пеллегрини, Маттео; Маркотт, Эдвард М; Томпсон, Майкл Дж; Айзенберг, Дэвид; Йейтс, Тодд О (1999). «Назначение функций белка путем сравнительного анализа генома: Филогенетические профили белков» . Труды Национальной академии наук США . 96 (8): 4285–4288. дои : 10.1073/pnas.96.8.4285 . ПМК 16324 . ПМИД 10200254 .
- ^ Кенше, Филип Р.; ван Ноорт, Вера; Дутил, Бас Э; Хюйнен, Мартейн А. (2008). «Практические и теоретические достижения в предсказании функции белка по его филогенетическому распределению» . Журнал интерфейса Королевского общества . 5 (19): 151–170. дои : 10.1098/rsif.2007.1047 . ПМК 2405902 . ПМИД 17535793 .
- ^ Дата, Шайлеш В.; Маркотт, Эдвард М. (15 мая 2005 г.). «Прогнозирование функции белка с помощью Protein Link EXplorer (PLEX)» . Биоинформатика . 21 (10): 2558–2559. doi : 10.1093/биоинформатика/bti313 . ISSN 1367-4803 . ПМИД 15701682 .
- ^ Чен, И.-Мин А.; Чу, Кен; Паланиаппан, Кришна; Пиллэй, Манодж; Ратнер, Анна; Хуан, Цзинхуа; Хантеманн, Марсель; Варгезе, Неха; Уайт, Джеймс Р. (05 октября 2018 г.). «IMG/M v.5.0: интегрированная система управления данными и сравнительного анализа микробных геномов и микробиомов» . Исследования нуклеиновых кислот . 47 (Д1): Д666–Д677. дои : 10.1093/nar/gky901 . ISSN 1362-4962 . ПМК 6323987 . ПМИД 30289528 .