Протеогеномика
Протеогеномика — это область биологических исследований, в которой используется сочетание протеомики , геномики и транскриптомики для открытия и идентификации пептидов. Протеогеномика используется для идентификации новых пептидов путем сравнения спектров MS/MS с базой данных белков, полученной на основе геномной и транскриптомной информации. Протеогеномика часто относится к исследованиям, в которых используется протеомная информация, часто полученная с помощью масс-спектрометрии , для улучшения аннотаций генов . Использование данных как протеомики, так и геномики наряду с развитием доступности и мощности спектрографических и хроматографических технологий привело к появлению в 2004 году протеогеномики как отдельной области.
Протеомика занимается белками так же, как геномика изучает генетический код целых организмов, а транскриптомика занимается изучением секвенирования и транскриптов РНК . Хотя все три области могут использовать формы масс-спектрометрии и хроматографии для идентификации и изучения функций ДНК , РНК и белков, протеомика опирается на предположение, что текущие модели генов верны и что все соответствующие белковые последовательности можно найти в справочной базе данных. например, База данных протеомной идентификации . Протеогеномика помогает устранить зависимость от существующих ограниченных генетических моделей, объединяя наборы данных из разных областей для создания базы данных белков или генетических маркеров. Кроме того, появление новых белковых последовательностей в результате мутаций часто невозможно объяснить в традиционных протеомных базах данных, но можно предсказать и изучить с помощью синтеза геномных и транскриптомных данных.
Полученные в результате исследования могут быть применены для улучшения аннотаций генов , изучения мутаций и понимания последствий генетических манипуляций .
Совсем недавно было разработано совместное профилирование поверхностных белков и транскриптов мРНК из отдельных клеток с помощью таких методов, как CITE-Seq и ESCAPE. [1] получила название одноклеточной протеогеномики. [2] [3] [4] хотя цели этих исследований не связаны с идентификацией пептидов. С 2019 года эти методы чаще называют мультимодальными омиками или мультиомиками. [5]
История
[ редактировать ]Протеогеномика возникла как независимая область в 2004 году на основе интеграции технологических достижений в области секвенирования геномики нового поколения и масс-спектрометрической протеомики. [6] опубликовала статью, Сам термин вошёл в употребление в том же году, когда исследовательская группа Джорджа Чёрча описывающую открытие ими метода протеогеномного картирования, который использовал данные протеомики для лучшего аннотирования генома бактерий M. pneumoniae . Используя современную базу данных белков, лаборатория нанесла на генетический каркас пептиды, обнаруженные в целой клетке , с помощью тандемной масс-спектрометрии, а затем использовала полученные «хиты» для создания «протеогеномной карты», основанной на традиционных генетических сигналах. Полученная карта оказалась чрезвычайно точной: более 81% предсказанных рамок считывания генома были обнаружены в изученных бактериальных клетках. Кроме того, лаборатория обнаружила несколько новых структур, не предсказанных чисто генетическими методами, а также некоторые доказательства, подтверждающие идею о том, что некоторые генетические модели, основанные на предсказаниях, могут быть ложными, что доказывает точность и экономическую эффективность гибридного метода. [7] [8]
Эта область расширялась в течение следующих двух десятилетий, первоначально используя данные протеомики для уточнения генетических моделей с помощью баз данных белков. [6] В 2020-х годах одним из наиболее распространенных методов идентификации пептидов является использование тандемной масс-спектрометрии . Этот метод был разработан Энгом и Йейтсом в 1994 году и включает в себя сравнение теоретического спектра пептидных фрагментов для сравнения экспериментально полученного пептидного спектра с выводом наиболее вероятных найденных совпадений. [7] Однако в отсутствие установленной базы данных пептидов Протеогеномика вместо этого сравнивает экспериментальный спектр с геномной базой данных, которую затем можно использовать для аннотации генома - как описано в работе Джорджа Черча. [3] Последний метод стал более широко использоваться за последнее десятилетие во многом из-за растущей доступности и скорости методов геномного секвенирования в сочетании с увеличением чувствительности протеомики на основе масс-спектрометрии. [6]
Методология
[ редактировать ]Основная идея протеогеномного подхода заключается в идентификации пептидов путем сравнения данных MS/MS с базами данных белков, которые содержат предсказанные белковые последовательности. [9] База данных белков создается различными способами за счет использования геномных и транскриптомных данных. Ниже приведены некоторые способы создания баз данных белков:
Шестикадровый перевод
[ редактировать ]Шестифреймовые трансляции можно использовать для создания базы данных, которая предсказывает белковые последовательности. Ограничением этого метода является то, что базы данных будут очень большими из-за количества генерируемых последовательностей, некоторые из которых не существуют в природе. [10]
Предсказание генов ab initio
[ редактировать ]В этом методе белковая основа создается с помощью алгоритмов прогнозирования генов, которые позволяют идентифицировать области, кодирующие белок . База данных аналогична базе данных, созданной посредством шестикадровой трансляции, в том отношении, что базы данных могут быть очень большими. [10]
Выраженные данные тега последовательности
[ редактировать ]Шестифреймовые трансляции могут использовать метку экспрессируемой последовательности (EST) для создания баз данных белков. Данные EST предоставляют информацию о транскрипции, которая может помочь в создании базы данных. База данных может быть очень большой, но ее недостатком является наличие нескольких копий данной последовательности; однако эту проблему можно обойти, сжимая последовательность белка, созданную с помощью вычислительных стратегий. [10]
Другие методы
[ редактировать ]Базы данных белков также можно создавать с использованием данных секвенирования РНК , аннотированных транскриптов РНК и вариантов последовательностей белков. Кроме того, существуют другие, более специализированные базы данных белков, которые можно создать для правильной идентификации интересующего пептида. [10]
Другим методом идентификации белков посредством протеогеномики является сравнительная протеогеномика. Сравнительная протеогеномика сравнивает протеомные данные нескольких родственных видов одновременно и использует гомологию между их белками для улучшения аннотаций с более высокой статистической достоверностью. [11] [12]
Приложения
[ редактировать ]Протеогеномика может применяться по-разному. Одним из применений является улучшение аннотаций генов в различных организмах. Аннотация генов включает в себя обнаружение генов и их функций. [13] Протеогеномика стала особенно полезной для открытия и улучшения аннотаций генов в прокариотических организмах. Например, с помощью протеогеномного подхода были изучены геномные аннотации различных микроорганизмов, включая Escherichia coli , Mycobacterium и несколько видов бактерий Shewanella . [14]
Помимо улучшения аннотаций генов, протеогеномные исследования также могут предоставить ценную информацию о наличии запрограммированных сдвигов рамки считывания , вырезания N-концевого метионина , сигнальных пептидов , протеолиза и других посттрансляционных модификаций . [15] [11] Протеогеномика имеет потенциальное применение в медицине, особенно в онкологии исследованиях . Рак возникает в результате генетических мутаций, таких как метилирование , транслокация и соматические мутации. Исследования показали, что для понимания молекулярных изменений, которые приводят к раку, необходима как геномная, так и протеомная информация. [16] [17] Протеогеномика помогла в этом благодаря идентификации белковых последовательностей, которые могут играть функциональную роль при раке. [18] Конкретный пример этого произошел в исследовании рака толстой кишки, в результате которого были обнаружены потенциальные мишени для лечения рака. [16] Протеогеномика также привела к персонализированной иммунотерапии, нацеленной на рак, при которой эпитопы антител к раковым антигенам прогнозируются с использованием протеогеномики для создания лекарств, действующих на конкретную опухоль пациента. [19] Помимо лечения, протеогенономика может дать представление о диагностике рака. В исследованиях рака толстой и прямой кишки протеогеномика использовалась для выявления соматических мутаций. Выявление соматических мутаций у пациентов может быть использовано для диагностики рака у пациентов. Помимо прямого применения в лечении и диагностике рака, протеогеномный подход можно использовать для изучения белков, которые приводят к устойчивости к химиотерапии . [17]
Проблемы
[ редактировать ]Протеогеномика может предложить методы идентификации пептидов, не имея недостатка в виде неполных или неточных баз данных белков, с которыми сталкивается протеомика; однако с протеогеномным подходом возникают проблемы. [10] Одной из самых больших проблем протеогеномики является огромный размер создаваемых баз данных белков. статистически, большая база данных белков с большей вероятностью приведет к неправильному сопоставлению данных из базы данных белков с данными МС/МС; эта проблема может затруднить идентификацию новых пептидов. Ложноположительные результаты также являются проблемой при использовании протеогеномных подходов. ложноположительные результаты могут возникать в результате чрезвычайно больших баз данных по белкам, где несовпадающие данные приводят к неправильной идентификации. Другая проблема заключается в неправильном сопоставлении спектров МС/МС с данными последовательности белка, которые соответствуют аналогичному пептиду, а не реальному пептиду. Известны случаи получения данных о пептиде, расположенном на нескольких сайтах гена, это может привести к данным, которые можно интерпретировать по-разному. Несмотря на эти проблемы, существуют способы уменьшить многие возникающие ошибки. Например, имея дело с очень большой базой данных белков, можно сравнить идентифицированные новые пептидные последовательности со всеми последовательностями в базе данных, а затем сравнить посттрансляционные модификации. Затем можно определить, представляют ли две последовательности один и тот же пептид или это два разных пептида. [10]
Ссылки
[ редактировать ]- ^ «Секвенирование РНК Proteona ESCAPE» . 11 декабря 2018 г.
- ^ «Протеона способствует внедрению платформы иммунного профилирования для исследования CAR-T и множественной миеломы» . Новости прецизионной онкологии . 07.05.2021 . Проверено 15 мая 2021 г.
- ^ «Электронная книга TotalSeq» . БиоЛегенда . Проверено 23 ноября 2020 г.
- ^ «Proteona выпускает программу секвенирования РНК ESCAPE™ для измерения белков и РНК в отдельных клетках с акцентом на клинические вопросы» . Протеона . Проверено 23 ноября 2020 г.
- ^ «Метод года 2019: Одноклеточные мультимодальные омики» . Природные методы . 17 (1): 1 января 2020 г. doi : 10.1038/s41592-019-0703-5 . ISSN 1548-7105 . ПМИД 31907477 .
- ^ Jump up to: а б с Меншерт, Гербен; Феньё, Дэвид (2017). «Протеогеномика с точки зрения биоинформатики: развивающаяся область» . Обзоры масс-спектрометрии . 36 (5): 584–599. Бибкод : 2017MSRv...36..584M . дои : 10.1002/mas.21483 . ISSN 1098-2787 . ПМК 6101030 . ПМИД 26670565 .
- ^ Jump up to: а б Рагглс, Келли В.; Круг, Карстен; Ван, Сяоцзин; Клаузер, Карл Р.; Ван, Цзин; Пейн, Сэмюэл Х.; Феньё, Дэвид; Чжан, Бин; Мани, ДР (01.06.2017). «Методы, инструменты и современные перспективы протеогеномики*» . Молекулярная и клеточная протеомика . 16 (6): 959–981. дои : 10.1074/mcp.MR117.000024 . ISSN 1535-9476 . ПМЦ 5461547 . ПМИД 28456751 .
- ^ Яффе, Джейкоб Д.; Берг, Ховард К.; Черч, Джордж М. (январь 2004 г.). «Протеогеномное картирование как дополнительный метод аннотации генома» . Протеомика . 4 (1): 59–77. дои : 10.1002/pmic.200300511 . ISSN 1615-9853 . ПМИД 14730672 . S2CID 10747815 .
- ^ Несвижский, Алексей И. (ноябрь 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии» . Природные методы . 11 (11): 1114–1125. дои : 10.1038/nmeth.3144 . ISSN 1548-7105 . ПМЦ 4392723 . ПМИД 25357241 .
- ^ Jump up to: а б с д и ж Несвижский, Алексей I (1 ноября 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии» . Природные методы . 11 (11): 1114–1125. дои : 10.1038/nmeth.3144 . ПМЦ 4392723 . ПМИД 25357241 .
- ^ Jump up to: а б Гупта Н., Бенхамида Дж., Бхаргава В., Гудман Д., Кейн Э., Керман И., Нгуен Н., Олликайнен Н., Родригес Дж., Ван Дж. и др. Сравнительная протеогеномика: сочетание масс-спектрометрии и сравнительной геномики для анализа нескольких геномов. Геном Рез. 2008;18:1133–1142.
- ^ Галлиен С., Перроду Э., Карапито К., Дешайес К., Рейрат Дж. М., Ван Дорселер А., Пох О., Шеффер К., Лекомпт О. (2009) Ортопротеогеномика: исследование множественных протеомов посредством ортологии и новый протокол на базе MS. Геном Res 19, 128–135.
- ^ Ансонг, К.; Пурвин, СО; Адкинс, Дж. Н.; Липтон, Миссисипи; Смит, Р.Д. (7 марта 2008 г.). «Протеогеномика: потребности и роли, которые должна выполнять протеомика в аннотации генома» . Брифинги по функциональной геномике и протеомике . 7 (1): 50–62. дои : 10.1093/bfgp/eln010 . ПМИД 18334489 .
- ^ Кучарова Вероника; Викер, Харальд Г. (декабрь 2014 г.). «Протеогеномика в микробиологии: правильный поворот на стыке геномики и протеомики». Протеомика . 14 (23–24): 2360–2675. дои : 10.1002/pmic.201400168 . HDL : 1956/9547 . ПМИД 25263021 . S2CID 3240135 .
- ^ Гупта Н., Таннер С., Джейтли Н., Адкинс Дж. Н., Липтон М., Эдвардс Р., Ромин М., Остерман А., Бафна В., Смит Р. Д. и др. Целопротеомный анализ посттрансляционных модификаций: применение масс-спектрометрии для протеогеномной аннотации. Геном Рез. 2007;17:1362–1377.
- ^ Jump up to: а б Саджад, Васим; Рафик, Мухаммед; Али, Баркат; Хаят, Мухаммед; Зада, Сахиб; Саджад, Васим; Кумар, Танвир (июль 2016 г.). «Протеогеномика: новые развивающиеся технологии» . ХАЯТИ Журнал биологических наук . 23 (3): 97–100. дои : 10.1016/j.hjb.2016.11.002 .
- ^ Jump up to: а б Шукла, Хем Д.; Махмуд, Джавед; Вуяскович, Желько (декабрь 2015 г.). «Комплексный протеогеномный подход к ранней диагностике и прогнозированию рака». Письма о раке . 369 (1): 28–36. дои : 10.1016/j.canlet.2015.08.003 . ПМИД 26276717 .
- ^ Чемберс, Мэтью С.; Джагтап, Пратик Д.; Джонсон, Джеймс Э.; Макгоуэн, Томас; Кумар, Правин; Онсонго, Гетирия; Герреро, Кэндис Р.; Барснес, Харальд; Водель, Марк (01 ноября 2017 г.). «Доступный ресурс по протеогеномике и информатике для исследователей рака» . Исследования рака . 77 (21): е43–е46. дои : 10.1158/0008-5472.can-17-0331 . ПМЦ 5675041 . ПМИД 29092937 .
- ^ Крич, Аманда Л.; Тин, Ин С.; Гулдинг, Скотт П.; Саулд, Джон ФК; Бартельм, Доминик; Руни, Майкл С.; Аддона, Терри А.; Абелин, Дженнифер Г. (2018). «Роль масс-спектрометрии и протеогеномики в продвижении предсказания эпитопа HLA» . Протеомика . 18 (12): e1700259. дои : 10.1002/pmic.201700259 . ISSN 1615-9861 . ПМК 6033110 . ПМИД 29314742 .