Протеогенская

Протеогеномика - это область биологических исследований, в которой используется комбинация протеомики , геномики и транскриптомики для помощи в обнаружении и идентификации пептидов. Протеогеномика используется для идентификации новых пептидов путем сравнения спектра MS/MS с базой данных белков, которая была получена из геномной и транскриптомной информации. Протеогеномика часто относится к исследованиям, в которых используется протеомная информация, часто полученная из масс -спектрометрии , для улучшения генных аннотаций. Использование данных протеомики и геномики наряду с достижениями в области доступности и мощности спектрографических и хроматографических технологий привело к появлению протеогеномики в качестве собственной области в 2004 году.
Протеомика имеет дело с белками так же, как геномика изучает генетический код целых организмов, в то время как транскриптомика посвящена изучению секвенирования РНК и транскриптов. В то время как все три поля могут использовать формы масс -спектрометрии и хроматографии для идентификации и изучения функций ДНК , РНК и белков, протеомика зависит от предположения, что современные модели генов правильны и что все соответствующие белковые последовательности можно найти в эталонной базе данных такие как база данных идентификации протеомики . Протеогеномика помогает устранить эту зависимость от существующих, ограниченных генетических моделей путем объединения наборов данных из нескольких полей, чтобы создать базу данных белков или генетических маркеров. Кроме того, появление новых белковых последовательностей из -за мутаций , часто не может быть объяснено в традиционных протеомных базах данных, но может быть предсказано и изучено с использованием синтеза геномных и транскриптомных данных.
Получившиеся исследования имеют применение в улучшении аннотаций генов , изучении мутаций и понимании эффектов генетической манипуляции .
Совсем недавно совместное профилирование поверхностных белков и транскриптов мРНК из отдельных клеток, таких как CITE-Seq и Escape [ 1 ] называется одноклеточной протеогенкой, [ 2 ] [ 3 ] [ 4 ] Хотя цели этих исследований не связаны с идентификацией пептидов. С 2019 года эти методы чаще называют мультимодальной OMIC или мультисомикой. [ 5 ]
История
[ редактировать ]Протеогеномика стала независимой областью в 2004 году, основанной на интеграции технологических достижений в геномике секвенирования секвенирования следующего поколения и протеомике масс-спектрометрии. [ 6 ] Сам термин использовался в этом году, с публикацией статьи исследовательской группы Джорджа Черч , описывающей их открытие метода протеогейного картирования, в котором использовались данные протеомики, чтобы лучше аннотировать геном бактерий M. pneumoniae . Используя современную базу данных белка, лабораторные картовые пептиды, обнаруженные в цельной клетке на генетическом каркасе , с использованием тандемной масс -спектрометрии, затем использовали генерируемые «удары», чтобы создать «протеогемную карту» на основе традиционных генетических сигналов. Полученная карта оказалась чрезвычайно точной: более 81% предсказанных геномных кадров считывания были обнаружены в изученных бактериальных клетках. Кроме того, лаборатория обнаружила несколько новых кадров, не предсказанных с помощью чисто генетических методов, а также некоторые доказательства, подтверждающие идею о том, что несколько генетических моделей, основанных на прогнозах, могут быть ложными, доказывая точность и экономическую эффективность гибридной техники. [ 7 ] [ 8 ]
Поле расширилось в течение следующих двух десятилетий, изначально используя данные протеомики, чтобы помочь в уточнении генетических моделей с помощью баз данных белков. [ 6 ] В 2020 -х годах один из наиболее распространенных методов для идентификации пептидов включает использование тандемной масс -спектрометрии . Этот метод возник с ENG и Yates в 1994 году, который включает в себя сравнение теоретического спектра фрагмента пептида для сравнения экспериментально полученного пептидного спектра с наиболее вероятными совпадениями. [ 7 ] Однако в отсутствие установленной пептидной базы данных вместо этого протеогеномика сравнивает экспериментальный спектр с геномной базой данных, которая затем может использоваться для аннотации генома - как описано в работе Джорджа Черч. [3] Последний метод стал более широко используемым в течение последнего десятилетия в значительной степени из-за растущей доступности и скорости методов секвенирования геномного секвенирования в сочетании с повышенной чувствительностью протеомики на основе масс-спектрометрии. [ 6 ]
Методология
[ редактировать ]
Основная идея протеогейного подхода заключается в идентификации пептидов путем сравнения данных MS/MS с базами данных белков, которые содержат прогнозируемые белковые последовательности. [ 9 ] База данных белков генерируется различными способами посредством использования геномных и транскриптомных данных. Ниже приведены некоторые из способов создания баз данных белков:
Перевод с шестью рамы
[ редактировать ]Перевод с шестью рамы можно использовать для создания базы данных, которая предсказывает белковые последовательности. Ограничением этого метода является то, что базы данных будут очень большими из -за количества генерируемых последовательностей, некоторые из которых не существуют в природе. [ 10 ]
AB initio Gene прогнозирование
[ редактировать ]В этом методе основание белка генерируется с помощью алгоритмов, предсказательных генов, которые позволяют идентифицировать области кодирования белка . База данных аналогична одной, сгенерированной через перевод с шестью рамы в отношении того факта, что базы данных могут быть очень большими. [ 10 ]
Экспрессированные данные тега последовательности
[ редактировать ]Переводы из шести карт могут использовать экспрессируемую метку последовательности (EST) для генерации белковых баз данных. Данные EST предоставляют информацию о транскрипции, которая может помочь в создании базы данных. База данных может быть очень большой и имеет недостаток в наличии нескольких копий данной последовательности; Тем не менее, эту проблему можно обойти путем сжатия белковой последовательности, полученной с помощью вычислительных стратегий. [ 10 ]
Другие методы
[ редактировать ]Базы данных белков также могут быть созданы с помощью данных секвенирования РНК , аннотированных транскриптов РНК и вариантных белковых последовательностей. Кроме того, существуют другие более специализированные базы данных белков, которые можно сделать для надлежащего идентификации интересующего пептида. [ 10 ]
Другим методом в идентификации белков через протеогенс является сравнительная протеогеномика. Сравнительная протеогеномика сравнивает протеомные данные из нескольких родственных видов одновременно и использует гомологию между их белками для улучшения аннотаций с более высокой статистической уверенностью. [ 11 ] [ 12 ]
Приложения
[ редактировать ]Протеогеномика может применяться по -разному. Одним из приложений является улучшение генных аннотаций в различных организмах. Анотация генов включает в себя обнаружение генов и их функций. [ 13 ] Протеогеномика стала особенно полезной при открытии и улучшении аннотаций генов в прокариотических организмах. Например, различные микроорганизмы изучали свою геномную аннотацию с помощью протеогейного подхода, включая Escherichia coli , Mycobacterium и множественные виды бактерий Shewanella . [ 14 ]
Помимо улучшения аннотаций генов, протеогеномные исследования также могут предоставить ценную информацию о присутствии запрограммированных фреймэффициентов , N-концевого удаления метионина , сигнальных пептидов , протеолиза и других посттрансляционных модификаций . [ 15 ] [ 11 ] Протеогеномика имеет потенциальные применения в медицине, особенно для онкологии исследований . Рак происходит с помощью генетических мутаций, таких как метилирование , транслокация и соматические мутации. Исследования показали, что как геномная, так и протеомная информация необходима для понимания молекулярных вариаций, которые приводят к раку. [ 16 ] [ 17 ] Протеогеномика помогла в этом посредством идентификации белковых последовательностей, которые могут играть функциональную роль в раке. [ 18 ] Специфический пример этого произошел в исследовании, включающем рак толстой кишки, в результате которого приводилось открытие потенциальных мишеней для лечения рака. [ 16 ] Протеогеномика также привела к персонализированной иммунотерапии, нацеленной на рак, где антител эпитопов для антигенов рака прогнозируется с использованием протеогеномики для создания лекарств, которые действуют на специфическую опухоль пациента. [ 19 ] В дополнение к лечению, протеогенсономика может дать представление о диагностике рака. В исследованиях, связанных с раком толстой кишки и прямой кишки, протеогенца использовали для выявления соматических мутаций. Идентификация соматических мутаций у пациентов может быть использована для диагностики рака у пациентов. В дополнение к прямому применению в лечении и диагностике рака, для изучения белков может использоваться протеогенный подход, которые приводят к устойчивости к химиотерапии . [ 17 ]
Проблемы
[ редактировать ]Протеогеномика может предлагать методы идентификации пептидов, не имея недостатка неполных или неточных баз данных белков, с которыми сталкиваются протеомика; Тем не менее, возникают проблемы с протеогемным подходом. [ 10 ] Одной из самых больших проблем протеогейки является огромный размер полученных белковых баз данных. Статистически, большая база данных белка с большей вероятностью приведет к неправильному сопоставлению данных из базы данных белков с данными MS/MS, эта проблема может помешать идентификации новых пептидов. Ложные позитивы также являются проблемой с помощью протеогейных подходов. Ложные позитивы могут возникать в результате чрезвычайно больших оснований данных белка, где данные с ошибками приводят к неправильной идентификации. Другой проблемой является неправильное сопоставление спектров спектра MS/MS с белковыми последовательностями, которые соответствуют аналогичному пептиду вместо фактического пептида. Существуют случаи получения данных пептида, расположенного на нескольких генных сайтах, это может привести к данным, которые можно интерпретировать по -разному. Несмотря на эти проблемы, есть способы уменьшить многие возникающие ошибки. Например, при работе с очень большой базой данных белков можно сравнить идентифицированные новые пептидные последовательности со всеми последовательностями в базе данных, а затем сравнить пост -трансляционные модификации. Затем можно определить, представляют ли две последовательности один и тот же пептид или они являются двумя разными пептидами. [ 10 ]
Ссылки
[ редактировать ]- ^ «Протеоновская секвенирование РНК» . 11 декабря 2018 года.
- ^ «Протеона, управляющее принятием платформы иммунного профилирования для CAR-T, множественные исследования миеломы» . Точные новости онкологии . 2021-05-07 . Получено 2021-05-15 .
- ^ «Электронная книга TotalSeq» . Биолегенд . Получено 23 ноября 2020 года .
- ^ «Proteona выпускает секвенирование РНК Escape ™ для измерения белка и РНК в отдельных клетках с акцентом на клинические вопросы» . Протеона . Получено 23 ноября 2020 года .
- ^ «Метод года 2019 года: одноклеточная мультимодальная OMIC» . Природные методы . 17 (1): 1 января 2020 года. DOI : 10.1038/S41592-019-0703-5 . ISSN 1548-7105 . PMID 31907477 .
- ^ Jump up to: а беременный в Menschaert, Gerben; Фениё, Дэвид (2017). «Протеогеномика под углом биоинформатики: растущее поле» . Обзоры масс -спектрометрии . 36 (5): 584–599. Bibcode : 2017msrv ... 36..584m . doi : 10.1002/mas.21483 . ISSN 1098-2787 . PMC 6101030 . PMID 26670565 .
- ^ Jump up to: а беременный Ruggles, Kelly v.; Круг, Карстен; Ван, Сяодзин; Clauser, Karl R.; Ван, Цзин; Пейн, Сэмюэль Х.; Фениё, Дэвид; Чжан, Бинг; Мани, DR (2017-06-01). «Методы, инструменты и текущие перспективы в протеогеномике*» . Молекулярная и клеточная протеомика . 16 (6): 959–981. doi : 10.1074/mcp.mr117.000024 . ISSN 1535-9476 . PMC 5461547 . PMID 28456751 .
- ^ Джаффе, Джейкоб Д.; Берг, Говард С.; Церковь, Джордж М. (январь 2004 г.). «Протеогемное картирование как дополнительный метод для выполнения аннотации генома» . Протеомика . 4 (1): 59–77. doi : 10.1002/pmic.200300511 . ISSN 1615-9853 . PMID 14730672 . S2CID 10747815 .
- ^ Nesvizhskii, Алексей I. (ноябрь 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии» . Природные методы . 11 (11): 1114–1125. doi : 10.1038/nmeth.3144 . ISSN 1548-7105 . PMC 4392723 . PMID 25357241 .
- ^ Jump up to: а беременный в дюймовый и фон Nesvizhskii, Алексей I (1 ноября 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии» . Природные методы . 11 (11): 1114–1125. doi : 10.1038/nmeth.3144 . PMC 4392723 . PMID 25357241 .
- ^ Jump up to: а беременный Gupta N., Benhamida J., Bhargava V., Goodman D., Kain E., Kerman I., Nguyen N., Ollikainen N., Rodriguez J., Wang J., et al. Сравнительная протеогеномика: объединение масс -спектрометрии и сравнительной геномики для анализа множественных геномов. Геном Res. 2008; 18: 1133–1142.
- ^ Gallien S., Perrodou E., Carapito C., Deshayes C., Reyrat JM, Van Dorsselaer A., Poch O., Schaeffer C., Lecompte O. (2009) Orthoproteogenomics: множественные протеомы через ортологию и Новый протокол на основе MS. Genome Res 19, 128–135.
- ^ Ansong, C.; Purvine, так; Adkins, JN; Липтон, MS; Смит, Rd (7 марта 2008 г.). «Протеогеномика: потребности и роли, которые должны быть заполнены протеомикой в аннотации генома» . Брифинги в функциональной геномике и протеомике . 7 (1): 50–62. doi : 10.1093/bfgp/eln010 . PMID 18334489 .
- ^ Кучарова, Вероника; Викер, Харальд Дж. (Декабрь 2014 г.). «Протеогенмика в микробиологии: правый поворот на соединении геномики и протеомики». Протеомика . 14 (23–24): 2360–2675. doi : 10.1002/pmic.201400168 . HDL : 1956/9547 . PMID 25263021 . S2CID 3240135 .
- ^ Гупта Н., Таннер С., Джейтли Н., Адкинс Дж. Н., Липтон М., Эдвардс Р., Ромин М., Остерман А., Бафна В., Смит Р.Д. и др. Анализ целого протеома посттрансляционных модификаций: применение масс-спектрометрии для протеогейной аннотации. Геном Res. 2007; 17: 1362–1377.
- ^ Jump up to: а беременный Саджад, Васим; Рафик, Мухаммед; Али, Баркат; Хаят, Мухаммед; Зада, Сахиб; Саджад, Васим; Кумар, Танвиер (июль 2016 г.). «Протеогеномика: новая новая технология» . Хаяти журнал биологических наук . 23 (3): 97–100. doi : 10.1016/j.hjb.2016.11.002 .
- ^ Jump up to: а беременный Shukla, Hem D.; Махмуд, Джавед; Вуджаскович, Зельжко (декабрь 2015 г.). «Интегрированный протеогеномный подход для ранней диагностики и прогноза рака». Раковые письма . 369 (1): 28–36. doi : 10.1016/j.canlet.2015.08.003 . PMID 26276717 .
- ^ Chambers, Matthew C.; Jagtap, Pratik D.; Джонсон, Джеймс Э.; МакГоуэн, Томас; Кумар, Правин; Onsongo, Getiria; Герреро, Кэндис Р.; Барснес, Харальд; Vaudel, Marc (2017-11-01). «Доступный ресурс по информатике протеогеномики для исследователей рака» . РАНКА . 77 (21): E43 - E46. doi : 10.1158/0008-5472.can-17-0331 . PMC 5675041 . PMID 29092937 .
- ^ Крич, Аманда Л.; Тин, Ying S.; Гулдинг, Скотт П.; Саулд, Джон ФК; Бартельме, Доминик; Руни, Майкл С.; Addona, Terri A.; Абелин, Дженнифер Г. (2018). «Роль масс -спектрометрии и протеогенки в прогрессе прогноза эпитопа HLA» . Протеомика . 18 (12): E1700259. doi : 10.1002/pmic.201700259 . ISSN 1615-9861 . PMC 6033110 . PMID 29314742 .