Белковые тандемные повторы

Массив белковых тандемных повторов определяется как несколько (по меньшей мере две) соседних копий, имеющих одинаковые или сходные мотивы последовательности . Эти периодические последовательности генерируются внутренними дупликациями как в кодирующих, так и в некодирующих геномных последовательностях. Повторяющиеся единицы белковых тандемных повторов значительно разнообразны: от повторения одной аминокислоты до доменов из 100 и более остатков. [ 1 ] [ 2 ]

«Повторы» в белках
[ редактировать ]
В белках «повтор» — это любой блок последовательности, который возвращает более одного раза в последовательности , либо в идентичной, либо в очень похожей форме. Степень сходства может сильно варьировать: некоторые повторы сохраняют лишь несколько консервативных аминокислотных позиций и характерную длину. Сильно вырожденные повторы бывает очень трудно обнаружить только по последовательности. Структурное сходство может помочь идентифицировать повторяющиеся модели в последовательности.
Структура
[ редактировать ]Повторяемость сама по себе ничего не говорит о структуре белка. Как правило, короткие повторяющиеся последовательности (например, длиной менее 10 аминокислот) могут быть внутренне неупорядоченными и не являться частью каких-либо свернутых белковых доменов . Повторы длиной не менее 30–40 аминокислот с гораздо большей вероятностью будут свернуты как часть домена. Такие длинные повторы часто указывают на наличие в белке соленоидного домена.
Примерно половина областей тандемных повторов имеют внутренне неупорядоченную конформацию и разворачиваются естественным путем. [ 3 ] [ 4 ] [ 5 ] Примеры неупорядоченных повторяющихся последовательностей включают 7-мерные пептидные повторы, обнаруженные в субъединице RPB1 РНК -полимеразы II , [ 6 ] или тандемные бета-катенин или аксин , связывающие линейные мотивы , в APC (аденоматозном полипозе coli). [ 7 ] Другая половина регионов со стабильной трехмерной структурой имеет множество форм и функций. [ 8 ] [ 9 ] Примеры коротких повторов, демонстрирующих упорядоченные структуры, включают повтор коллагена из пяти остатков из трех остатков или повтор пентапептида , который образует структуру бета-спирали .
Классификация
[ редактировать ]В зависимости от длины повторяющихся единиц их белковые структуры можно разделить на пять классов: [ 8 ] [ 9 ]
- кристаллические агрегаты, образованные областями с длинными повторами из 1 или 2 остатков, архетипические области низкой сложности
- волокнистые структуры, стабилизированные межцепными взаимодействиями с повторами из 3-7 остатков
- удлиненные структуры с повторами из 5–40 остатков, в которых доминируют соленоидные белки
- закрытые (не вытянутые) структуры с повторами из 30-60 остатков в виде тороидных повторов
- бусины на струнных структурах с типичным размером повторов более 50 остатков, которые уже достаточно велики, чтобы независимо сворачиваться в стабильные домены.
Функция
[ редактировать ]Некоторыми хорошо известными примерами белков с тандемными повторами являются коллаген , который играет ключевую роль в организации внеклеточного матрикса; альфа-спиральные спиральные клубки, имеющие структурную и олигомеризационную функции; богатые лейцином повторяющиеся белки, которые специфически связывают некоторые глобулярные белки благодаря своей вогнутой поверхности; и белки цинковых пальцев , которые регулируют экспрессию генов путем связывания ДНК .
Белки с тандемными повторами часто функционируют как модули межбелкового взаимодействия. Повтор WD40 — яркий пример этой функции. [ 10 ]
Распределение в протеомах
[ редактировать ]Тандемные повторы широко распространены в протеомах и встречаются по крайней мере в 14% всех белков. [ 11 ] Например, они присутствуют почти в каждом третьем белке человека и даже в каждом втором белке Plasmodium falciparum или Dictyostelium discoideum . [ 11 ] [ 12 ] Тандемные повторы с короткими повторяющимися единицами (особенно гомоповторами) встречаются чаще других. [ 11 ]
Методы аннотации
[ редактировать ]Тандемные повторы белка можно обнаружить либо по последовательности, либо аннотировать по структуре. Были созданы специализированные методы идентификации повторяющихся белков. [ 13 ]
Стратегии, основанные на последовательностях, основанные на поиске гомологии [ 14 ] или назначение домена, [ 15 ] [ 16 ] в основном недооценивают TR из-за присутствия сильно вырожденных повторяющихся единиц. [ 17 ] Недавнее исследование, направленное на понимание и улучшение покрытия Pfam человеческого протеома. [ 17 ] показали, что пять из десяти крупнейших кластеров последовательностей, не аннотированных Pfam, являются областями повторов. Альтернативно, методы, не требующие предварительных знаний для обнаружения повторяющихся подстрок, могут быть основаны на самосравнении. [ 18 ] [ 19 ] кластеризация [ 20 ] [ 21 ] или скрытые модели Маркова. [ 22 ] [ 23 ] Некоторые другие полагаются на измерения сложности. [ 13 ] или воспользуйтесь метапоиском, чтобы объединить результаты из разных источников. [ 24 ] [ 25 ]
Вместо этого методы на основе структур используют преимущества модульности доступных структур PDB для распознавания повторяющихся элементов. [ 26 ] [ 27 ] [ 28 ] [ 29 ] [ 30 ]
Ссылки
[ редактировать ]- ^ Херинга Дж. (июнь 1998 г.). «Обнаружение внутренних повторов: насколько они распространены?». Современное мнение в области структурной биологии . 8 (3): 338–45. дои : 10.1016/s0959-440x(98)80068-7 . ПМИД 9666330 .
- ^ Андраде М.А., Понтинг С.П., Гибсон Т.Дж., Борк П. (май 2000 г.). «Метод идентификации белковых повторов, основанный на гомологии, с использованием оценок статистической значимости». Журнал молекулярной биологии . 298 (3): 521–37. дои : 10.1006/jmbi.2000.3684 . ПМИД 10772867 .
- ^ Томпа П. (сентябрь 2003 г.). «По сути неструктурированные белки развиваются за счет расширения повторов». Биоэссе . 25 (9): 847–55. дои : 10.1002/bies.10324 . ПМИД 12938174 . S2CID 32684524 .
- ^ Саймон М., Хэнкок Дж. М. (2009). «Тандемные и загадочные аминокислотные повторы накапливаются в неупорядоченных участках белков» . Геномная биология . 10 (6): 59 рандов. дои : 10.1186/gb-2009-10-6-r59 . ПМК 2718493 . ПМИД 19486509 .
- ^ Джорда Дж., Сюэ Б., Уверский В.Н., Каява А.В. (июнь 2010 г.). «Белковые тандемные повторы – чем совершеннее, тем менее структурированы» (PDF) . Журнал ФЭБС . 277 (12): 2673–82. дои : 10.1111/j.1742-4658.2010.07684.x . ПМЦ 2928880 . ПМИД 20553501 .
- ^ Мейер П.А., Йе П., Чжан М., Су М.Х., Фу Дж. (июнь 2006 г.). «Фазировка РНК-полимеразы II с использованием внутренне связанных атомов Zn: обновленная структурная модель» . Структура . 14 (6): 973–82. дои : 10.1016/j.str.2006.04.003 . ПМИД 16765890 .
- ^ Лю Дж, Син Ю, Хиндс Т.Р., Чжэн Дж, Сюй В (июнь 2006 г.). «Третий повтор из 20 аминокислот является местом самого тесного связывания APC с бета-катенином». Дж. Мол. Биол . 360 (1): 133–44. дои : 10.1016/j.jmb.2006.04.064 . ПМИД 16753179 .
- ^ Jump up to: а б Каява А.В. (сентябрь 2012 г.). «Тандемные повторы в белках: от последовательности к структуре». Журнал структурной биологии . 179 (3): 279–88. дои : 10.1016/j.jsb.2011.08.009 . ПМИД 21884799 .
- ^ Jump up to: а б Паладин Л., Хирш Л., Пиовесан Д., Андраде-Наварро М.А., Каява А.В., Тосатто СК (январь 2017 г.). «RepeatsDB 2.0: улучшенная аннотация, классификация, поиск и визуализация повторяющихся белковых структур» . Исследования нуклеиновых кислот . 45 (Д1): Д308–Д312. дои : 10.1093/nar/gkw1136 . ПМК 5210593 . ПМИД 27899671 .
- ^ Стирниманн CU, Петсалаки Э, Рассел РБ, Мюллер CW (октябрь 2010 г.). «Белки WD40 способствуют развитию сотовых сетей». Тенденции биохимических наук . 35 (10): 565–74. дои : 10.1016/j.tibs.2010.04.003 . ПМИД 20451393 .
- ^ Jump up to: а б с Маркотт Э.М., Пеллегрини М., Йейтс Т.О., Айзенберг Д. (октябрь 1999 г.). «Перепись белковых повторов». Журнал молекулярной биологии . 293 (1): 151–60. дои : 10.1006/jmbi.1999.3136 . ПМИД 10512723 .
- ^ Пеллегрини М (2015). «Тандемные повторы в белках: алгоритмы прогнозирования и биологическая роль» . Границы биоинженерии и биотехнологии . 3 : 143. дои : 10.3389/fbioe.2015.00143 . ПМЦ 4585158 . ПМИД 26442257 .
- ^ Jump up to: а б Пеллегрини М., Ренда М.Э., Веккьо А. (2012). «Ab initio обнаружение нечетких тандемных повторов аминокислот в белковых последовательностях» . БМК Биоинформатика . 13 (Приложение 3): S8. дои : 10.1186/1471-2105-13-S3-S8 . ПМК 3402919 . ПМИД 22536906 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Андраде М.А., Понтинг К.П., Гибсон Т.Дж., Борк П. (2000). «Метод идентификации белковых повторов, основанный на гомологии, с использованием оценок статистической значимости» . Дж Мол Биол . 298 (3): 521–37. дои : 10.1006/jmbi.2000.3684 . ПМИД 10772867 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Эль-Гебали С., Мистри Дж., Бейтман А., Эдди С.Р., Лучани А., Поттер СК; и др. (2019). «База данных семейств белков Pfam в 2019 году» . Нуклеиновые кислоты Рез . 47 (Д1): Д427–Д432. дои : 10.1093/nar/gky995 . ПМК 6324024 . ПМИД 30357350 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Митчелл А.Л., Эттвуд Т.К., Бэббит ПК, Блюм М., Борк П., Бридж А; и др. (2019). «ИнтерПро в 2019 году: улучшение охвата, классификации и доступа к аннотациям последовательностей белков» . Нуклеиновые кислоты Рез . 47 (Д1): Д351–Д360. дои : 10.1093/nar/gky1100 . ПМК 6323941 . ПМИД 30398656 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Jump up to: а б Мистри Дж., Коггилл П., Эберхардт Р.Ю., Дейана А., Джиансанти А., Финн Р.Д.; и др. (2013). «Проблема увеличения покрытия Pfam человеческого протеома» . База данных (Оксфорд) . 2013 : bat023. дои : 10.1093/база данных/bat023 . ПМК 3630804 . ПМИД 23603847 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Хегер А., Холм Л. (2000). «Быстрое автоматическое обнаружение и выравнивание повторов в белковых последовательностях» . Белки . 41 (2): 224–37. doi : 10.1002/1097-0134(20001101)41:2<224::aid-prot70>3.0.co;2-z . ПМИД 10966575 . S2CID 21757391 .
- ^ Шклярчик Р., Херинга Дж. (2004). «Отслеживание повторов с использованием значимости и транзитивности» . Биоинформатика . 20 (Приложение 1): i311-7. doi : 10.1093/биоинформатика/bth911 . ПМИД 15262814 .
- ^ Ньюман А.М., Купер Дж.Б. (2007). «XSTREAM: практический алгоритм идентификации и моделирования архитектуры тандемных повторов в белковых последовательностях» . БМК Биоинформатика . 8 : 382. дои : 10.1186/1471-2105-8-382 . ПМЦ 2233649 . ПМИД 17931424 .
- ^ Хорда Дж., Каява А.В. (2009). «T-REKS: идентификация тандемных повторов в последовательностях с помощью алгоритма, основанного на K-meanS» . Биоинформатика . 25 (20): 2632–8. doi : 10.1093/биоинформатика/btp482 . ПМИД 19671691 .
- ^ Сёдинг Дж., Реммерт М., Бигерт А. (2006). «HHrep: обнаружение повторов белка de novo и происхождение стволов TIM» . Нуклеиновые кислоты Рез . 34 (проблема с веб-сервером): W137-42. дои : 10.1093/нар/gkl130 . ПМЦ 1538828 . ПМИД 16844977 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Бигерт А., Сёдинг Дж. (2008). «Идентификация de novo сильно дивергентных белковых повторов по вероятностной согласованности» . Биоинформатика . 24 (6): 807–14. doi : 10.1093/биоинформатика/btn039 . hdl : 11858/00-001M-0000-0017-DADF-9 . ПМИД 18245125 .
- ^ Грубер М., Сёдинг Дж., Лупас А.Н. (2005). «РЕППЕР — повторы и их периодичность в волокнистых белках» . Нуклеиновые кислоты Рез . 33 (проблема с веб-сервером): W239-43. дои : 10.1093/nar/gki405 . ПМК 1160166 . ПМИД 15980460 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Шапер Е, Анисимова М (2015). «Эволюция и функция тандемных повторов белков у растений» . Новый Фитол . 206 (1): 397–410. дои : 10.1111/nph.13184 . ПМИД 25420631 . S2CID 20656455 .
- ^ Авраам А.Л., Роша Э.П., Потье Дж. (2008). «Свелфе: детектор внутренних повторов в последовательностях и структурах» . Биоинформатика . 24 (13): 1536–7. doi : 10.1093/биоинформатика/btn234 . ПМЦ 2718673 . ПМИД 18487242 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Сабаринатан Р., Басу Р., Секар К. (2010). «ProSTRIP: метод поиска сходных структурных повторов в трехмерных белковых структурах» . Вычислительная биол. хим . 34 (2): 126–30. doi : 10.1016/j.compbiolchem.2010.03.006 . ПМИД 20430700 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Уолш И, Сирокко ФГ, Минервини Дж, Ди Доменико Т, Феррари С, Тосатто СК (2012). «РАФАЭЛЬ: распознавание, периодичность и назначение вставок соленоидных белковых структур» . Биоинформатика . 28 (24): 3257–64. doi : 10.1093/биоинформатика/bts550 . ПМИД 22962341 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Грабе Т., Годзик А. (2014). «ConSole: использование модульности карт контактов для поиска соленоидных доменов в белковых структурах» . БМК Биоинформатика . 15 :119. дои : 10.1186/1471-2105-15-119 . ПМК 4021314 . ПМИД 24766872 .
- ^ До Вьет П., Рош Д.Б., Каява А.В. (2015). «ТАПО: Комбинированный метод идентификации тандемных повторов в белковых структурах» . ФЭБС Летт . 589 (19 ч. А): 2611–9. дои : 10.1016/j.febslet.2015.08.025 . ПМИД 26320412 . S2CID 28423787 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )