Белковая семья
Семейство белков — это группа эволюционно родственных белков . Во многих случаях семейству белков соответствует семейство генов , в котором каждый ген кодирует соответствующий белок в соотношении 1:1. Термин «белковое семейство» не следует путать с семейством , используемым в систематике.
Белки в семействе происходят от общего предка и обычно имеют схожие трехмерные структуры , функции и значительное сходство последовательностей . [1] [2] Сходство последовательностей (обычно аминокислотных последовательностей) является одним из наиболее распространенных показателей гомологии или общего эволюционного происхождения. [3] [4] Некоторые подходы для оценки значимости сходства между последовательностями используют методы выравнивания последовательностей . Белки, не имеющие общего предка, вряд ли проявят статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов белковых семейств. [3] [4] Семейства иногда группируются в более крупные клады, называемые суперсемействами , на основе структурного сходства, даже если нет идентифицируемой гомологии последовательностей.
В настоящее время определено более 60 000 семейств белков. [5] хотя двусмысленность в определении «семейства белков» приводит разных исследователей к весьма разным цифрам.
Терминология и использование
[ редактировать ]Термин «семейство белков» имеет широкое применение и может применяться к большим группам белков с едва заметным сходством последовательностей, а также к узким группам белков с почти идентичной последовательностью, функцией и структурой. Чтобы различать эти случаи, используется иерархическая терминология. На самом высоком уровне классификации находятся суперсемейства белков , которые группируют отдаленно родственные белки, часто на основе их структурного сходства. [6] [7] [8] [9] Далее следуют семейства белков, которые относятся к белкам общего эволюционного происхождения, демонстрируемым значительным сходством последовательностей . [2] [10] Подсемейства могут быть определены внутри семейств для обозначения близкородственных белков, имеющих схожие или идентичные функции. [11] Например, такое суперсемейство, как клан протеаз PA , имеет меньшую консервативность последовательности, чем семейство C04 внутри него.
Белковые домены и мотивы
[ редактировать ]Семейства белков были впервые признаны, когда большинство структурно понятных белков представляли собой небольшие однодоменные белки, такие как миоглобин , гемоглобин и цитохром с . С тех пор было обнаружено множество белков с множеством независимых структурных и функциональных единиц, называемых доменами . В результате эволюционного перетасовки разные домены белка развивались независимо. Это привело к сосредоточению внимания на семействах белковых доменов. Несколько онлайн-ресурсов посвящены выявлению и каталогизации этих доменов. [12] [13]
Различные области белка имеют разные функциональные ограничения. Например, активный центр фермента требует точной ориентации определенных аминокислотных остатков. Интерфейс связывания белок-белок может представлять собой большую поверхность с ограничениями на гидрофобность или полярность аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к образованию блоков консервативной последовательности при сравнении последовательностей семейства белков (см. множественное выравнивание последовательностей ). Эти блоки чаще всего называют мотивами, хотя используются и многие другие термины (блоки, подписи, отпечатки пальцев и т. д.). Несколько онлайн-ресурсов посвящены идентификации и каталогизации белковых мотивов. [14]
Эволюция семейств белков
[ редактировать ]Согласно нынешнему консенсусу, семейства белков возникают двумя способами. Во-первых, разделение родительского вида на два генетически изолированных вида-потомка позволяет гену/белку независимо накапливать вариации ( мутации ) в этих двух линиях. В результате образуется семейство ортологичных белков, обычно с консервативными мотивами последовательности. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ) . Поскольку исходный ген все еще способен выполнять свою функцию, дублированный ген может дивергентствовать и приобретать новые функции (путем случайной мутации).
Определенные семейства генов/белков, особенно у эукариот , в ходе эволюции претерпевают резкие расширения и сокращения, иногда одновременно с дупликацией целого генома . Расширение менее вероятно, а потери более вероятны для внутренне неупорядоченных белков и для белковых доменов, гидрофобные аминокислоты которых находятся дальше от оптимальной степени дисперсии вдоль первичной последовательности. [15] Это расширение и сокращение семейств белков является одной из характерных особенностей эволюции генома , но его важность и последствия в настоящее время неясны.
Использование и важность семейств белков
[ редактировать ]По мере увеличения общего числа секвенированных белков и расширения интереса к анализу протеомов продолжаются попытки организовать белки в семейства и описать их составляющие домены и мотивы. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Инициатива по функциям ферментов использует семейства белков и суперсемейства в качестве основы для разработки стратегии, основанной на последовательностях/структурах, для крупномасштабного функционального назначения ферментов с неизвестной функцией. [16] Алгоритмические средства создания белковых семейств в больших масштабах основаны на понятии сходства.
Ресурсы белкового семейства
[ редактировать ]Многие биологические базы данных каталогизируют семейства белков и позволяют пользователям сопоставлять последовательности запросов с известными семействами. К ним относятся:
- Pfam - база данных выравниваний и HMM семейств белков
- PROSITE - База данных белковых доменов, семейств и функциональных сайтов
- PIRSF - Система классификации суперсемейств
- PASS2 – Выравнивание белков как структурные суперсемейства v2 – PASS2@NCBS [17]
- СУПЕРСЕМЕЙСТВО - Библиотека HMM, представляющая суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов.
- SCOP и CATH - Классификация белковых структур на суперсемейства, семейства и домены.
Аналогично существует множество алгоритмов поиска в базе данных, например:
- BLAST - поиск сходства последовательностей ДНК
- BLASTp — поиск сходства белковых последовательностей
- OrthoFinder - Метод кластеризации белков в семейства (ортогруппы) [18] [19]
См. также
[ редактировать ]Белковые семейства
[ редактировать ]Ссылки
[ редактировать ]- ^ «Что такое семейства белков? Классификация белков» . ЭМБЛ-ЭБИ . Проверено 14 ноября 2023 г.
- ^ Jump up to: а б Оренго, Кристина; Бейтман, Алекс (2013). "Введение". В Оренго, Кристина; Бейтман, Алекс (ред.). Белковые семейства: связь между белковой последовательностью, структурой и функцией . Хобокен, Нью-Джерси: John Wiley & Sons, Inc., стр. vii–xi. дои : 10.1002/9781118743089.fmatter . ISBN 9781118743089 .
- ^ Jump up to: а б Пирсон, Уильям Р. (2013). «Введение в поиск сходства («гомологии») последовательностей» . Современные протоколы в биоинформатике . 3 : 3.1.1–3.1.8. дои : 10.1002/0471250953.bi0301s42 . ISSN 1934-3396 . ПМК 3820096 . ПМИД 23749753 .
- ^ Jump up to: а б Чен, Цзюньцзе; Го, Мингюэ; Ван, Сяолун; Лю, Бинь (01 марта 2018 г.). «Всесторонний обзор и сравнение различных вычислительных методов дистанционного обнаружения гомологии белков» . Брифинги по биоинформатике . 19 (2): 231–244. дои : 10.1093/нагрудник/bbw108 . ISSN 1477-4054 . ПМИД 27881430 .
- ^ Кунин, Виктор; Дела, Ильдефонсо; Энрайт, Антон Дж.; де Лоренцо, Виктор; Узунис, Христос А. (2003). «Мириады семейств белков продолжают считаться» . Геномная биология . 4 (2): 401. doi : 10.1186/gb-2003-4-2-401 . ISSN 1474-760X . ПМЦ 151299 . ПМИД 12620116 .
- ^ Дайхофф, Миссури (декабрь 1974 г.). «Компьютерный анализ белковых последовательностей». Труды Федерации . 33 (12): 2314–6. ПМИД 4435228 .
- ^ Дайхофф, Миссури; Маклафлин, П.Дж.; Баркер, туалет; Хант, LT (1975). «Эволюция последовательностей внутри суперсемейств белков». Die Naturwissenschaften . 62 (4): 154–161. Бибкод : 1975NW.....62..154D . дои : 10.1007/BF00608697 . S2CID 40304076 .
- ^ Дайхофф, Миссури (август 1976 г.). «Происхождение и эволюция суперсемейств белков». Труды Федерации . 35 (10): 2132–8. ПМИД 181273 .
- ^ Оренго, Кристина А.; Торнтон, Джанет М. (1 июня 2005 г.). «Белковые семейства и их эволюция — структурная перспектива» . Ежегодный обзор биохимии . 74 (1): 867–900. doi : 10.1146/annurev.biochem.74.082803.133029 . ISSN 0066-4154 . ПМИД 15954844 .
- ^ Вирамачанени, Вамси; Макаловский, Войцех (2004). «Визуализация сходства последовательностей белковых семейств» . Геномные исследования . 14 (6): 1160–1169. дои : 10.1101/гр.2079204 . ISSN 1088-9051 . ПМК 419794 . ПМИД 15140831 .
- ^ Холм, Лийза; Хегер, Андреас (2013). «Автоматические подходы на основе последовательностей для идентификации семейств доменов». В Оренго, Кристина; Бейтман, Алекс (ред.). Белковые семейства: связь между белковой последовательностью, структурой и функцией . Хобокен, Нью-Джерси: John Wiley & Sons, Inc., стр. 1–24. дои : 10.1002/9781118743089.ch1 . ISBN 9781118743089 . S2CID 85641264 .
- ^ Ван, Ян; Чжан, Ханг; Чжун, Хаолинь; Сюэ, Чжидун (01 января 2021 г.). «Методы идентификации белковых доменов и онлайн-ресурсы» . Журнал вычислительной и структурной биотехнологии . 19 : 1145–1153. дои : 10.1016/j.csbj.2021.01.041 . ISSN 2001-0370 . ПМЦ 7895673 . ПМИД 33680357 .
- ^ Бейтман, Алекс (2013). «Классификация последовательностей белковых семейств: Pfam и другие ресурсы». В Оренго, Кристина; Бейтман, Алекс (ред.). Белковые семейства: связь между белковой последовательностью, структурой и функцией . Хобокен, Нью-Джерси: John Wiley & Sons, Inc., стр. 25–36. дои : 10.1002/9781118743089.ch2 . ISBN 9781118743089 .
- ^ Малдер, Никола Дж.; Апвайлер, Рольф (19 декабря 2001 г.). «Инструменты и ресурсы для идентификации семейств белков, доменов и мотивов» . Геномная биология . 3 (1): обзоры 2001.1. doi : 10.1186/gb-2001-3-1-reviews2001 . ISSN 1474-760X . ПМК 150457 . ПМИД 11806833 .
- ^ Джеймс, Дженнифер Э; Нельсон, Пол Дж; Мазель, Джоанна (4 апреля 2023 г.). «Дифференциальное сохранение доменов Pfam способствует долгосрочным эволюционным тенденциям» . Молекулярная биология и эволюция . 40 (4): msad073. дои : 10.1093/molbev/msad073 . ПМЦ 10089649 . ПМИД 36947137 .
- ^ Герлт, Джон А.; Аллен, Карен Н.; Альмо, Стивен С.; Армстронг, Ричард Н.; Бэббит, Патрисия К.; Кронан, Джон Э.; Данауэй-Мариано, Дебра; Имкер, Хайди Дж.; Джейкобсон, Мэтью П.; Минор, Владек; Поултер, К. Дейл; Раушель, Фрэнк М.; Сали, Андрей; Шойчет, Брайан К.; Свидлер, Джонатан В. (22 ноября 2011 г.). «Инициатива по ферментным функциям» . Биохимия . 50 (46): 9950–9962. дои : 10.1021/bi201312u . ISSN 0006-2960 . ПМЦ 3238057 . ПМИД 21999478 .
- ^ Гандимати, А.; Наир, Ану Г.; Соудхамини, Р. (2012). «PASS2 версия 4: Обновление базы данных структурных выравниваний последовательностей суперсемейств структурных доменов» . Исследования нуклеиновых кислот . 40 (Д1): Д531–Д534. дои : 10.1093/nar/gkr1096 . ISSN 1362-4962 . ПМЦ 3245109 . ПМИД 22123743 .
- ^ Эммс, Дэвид М.; Келли, Стивен (6 августа 2015 г.). «OrthoFinder: устранение фундаментальных ошибок при сравнении целого генома значительно повышает точность вывода ортогрупп» . Геномная биология . 16 (1): 157. дои : 10.1186/s13059-015-0721-2 . ISSN 1474-760X . ПМЦ 4531804 . ПМИД 26243257 .
- ^ Эммс, Дэвид М.; Келли, Стивен (14 ноября 2019 г.). «OrthoFinder: вывод филогенетической ортологии для сравнительной геномики» . Геномная биология . 20 (1): 238. doi : 10.1186/s13059-019-1832-y . ISSN 1474-760X . ПМЦ 6857279 . ПМИД 31727128 .
Внешние ссылки
[ редактировать ]- СМИ, связанные с белковыми семействами, на Викискладе?