Jump to content

Протеогеномика

Протеогеномика использует интегрированный подход, объединяя геномику , протеомику и транскриптомику .

Протеогеномика — это область биологических исследований, в которой используется сочетание протеомики , геномики и транскриптомики для открытия и идентификации пептидов. Протеогеномика используется для идентификации новых пептидов путем сравнения спектров MS/MS с базой данных белков, полученной на основе геномной и транскриптомной информации. Протеогеномика часто относится к исследованиям, в которых используется протеомная информация, часто полученная с помощью масс-спектрометрии , для улучшения аннотаций генов . Использование данных как протеомики, так и геномики наряду с развитием доступности и мощности спектрографических и хроматографических технологий привело к появлению в 2004 году протеогеномики как отдельной области.

Протеомика занимается белками так же, как геномика изучает генетический код целых организмов, а транскриптомика занимается изучением секвенирования и транскриптов РНК . Хотя все три области могут использовать формы масс-спектрометрии и хроматографии для идентификации и изучения функций ДНК , РНК и белков, протеомика опирается на предположение, что текущие модели генов верны и что все соответствующие белковые последовательности можно найти в справочной базе данных. например, База данных протеомной идентификации . Протеогеномика помогает устранить зависимость от существующих ограниченных генетических моделей, объединяя наборы данных из разных областей для создания базы данных белков или генетических маркеров. Кроме того, появление новых белковых последовательностей в результате мутаций часто невозможно объяснить в традиционных протеомных базах данных, но можно предсказать и изучить с помощью синтеза геномных и транскриптомных данных.

Полученные в результате исследования могут быть применены для улучшения аннотаций генов , изучения мутаций и понимания последствий генетических манипуляций .

Совсем недавно было разработано совместное профилирование поверхностных белков и транскриптов мРНК из отдельных клеток с помощью таких методов, как CITE-Seq и ESCAPE. [1] получила название одноклеточной протеогеномики. [2] [3] [4] хотя цели этих исследований не связаны с идентификацией пептидов. С 2019 года эти методы чаще называют мультимодальными омиками или мультиомиками. [5]

Протеогеномика возникла как независимая область в 2004 году на основе интеграции технологических достижений в области секвенирования геномики нового поколения и масс-спектрометрической протеомики. [6] опубликовала статью, Сам термин вошёл в употребление в том же году, когда исследовательская группа Джорджа Чёрча описывающую открытие ими метода протеогеномного картирования, который использовал данные протеомики для лучшего аннотирования генома бактерий M. pneumoniae . Используя современную базу данных белков, лаборатория нанесла на генетический каркас пептиды, обнаруженные в целой клетке , с помощью тандемной масс-спектрометрии, а затем использовала полученные «хиты» для создания «протеогеномной карты», основанной на традиционных генетических сигналах. Полученная карта оказалась чрезвычайно точной: более 81% предсказанных рамок считывания генома были обнаружены в изученных бактериальных клетках. Кроме того, лаборатория обнаружила несколько новых структур, не предсказанных чисто генетическими методами, а также некоторые доказательства, подтверждающие идею о том, что некоторые генетические модели, основанные на предсказаниях, могут быть ложными, что доказывает точность и экономическую эффективность гибридного метода. [7] [8]

           Эта область расширялась в течение следующих двух десятилетий, первоначально используя данные протеомики для уточнения генетических моделей с помощью баз данных белков. [6] В 2020-х годах одним из наиболее распространенных методов идентификации пептидов является использование тандемной масс-спектрометрии . Этот метод был разработан Энгом и Йейтсом в 1994 году и включает в себя сравнение теоретического спектра пептидных фрагментов для сравнения экспериментально полученного пептидного спектра с выводом наиболее вероятных найденных совпадений. [7] Однако в отсутствие установленной базы данных пептидов Протеогеномика вместо этого сравнивает экспериментальный спектр с геномной базой данных, которую затем можно использовать для аннотации генома - как описано в работе Джорджа Черча. [3] Последний метод стал более широко использоваться за последнее десятилетие во многом из-за растущей доступности и скорости методов геномного секвенирования в сочетании с увеличением чувствительности протеомики на основе масс-спектрометрии. [6]

Методология

[ редактировать ]
Изображение клетки эукариота, иллюстрирующее, как образуются белки: ДНК в ядре считывается РНК-полимеразой, затем рибосомы в цитоплазме производят аминокислотную цепь, которая сворачивается в функциональный белок.

Основная идея протеогеномного подхода заключается в идентификации пептидов путем сравнения данных MS/MS с базами данных белков, которые содержат предсказанные белковые последовательности. [9] База данных белков создается различными способами за счет использования геномных и транскриптомных данных. Ниже приведены некоторые способы создания баз данных белков:

Шестикадровый перевод

[ редактировать ]

Шестифреймовые трансляции можно использовать для создания базы данных, которая предсказывает белковые последовательности. Ограничением этого метода является то, что базы данных будут очень большими из-за количества генерируемых последовательностей, некоторые из которых не существуют в природе. [10]

Предсказание генов ab initio

[ редактировать ]

В этом методе белковая основа создается с помощью алгоритмов прогнозирования генов, которые позволяют идентифицировать области, кодирующие белок . База данных аналогична базе данных, созданной посредством шестикадровой трансляции, в том отношении, что базы данных могут быть очень большими. [10]

Выраженные данные тега последовательности

[ редактировать ]

Шестифреймовые трансляции могут использовать метку экспрессируемой последовательности (EST) для создания баз данных белков. Данные EST предоставляют информацию о транскрипции, которая может помочь в создании базы данных. База данных может быть очень большой, но ее недостатком является наличие нескольких копий данной последовательности; однако эту проблему можно обойти, сжимая последовательность белка, созданную с помощью вычислительных стратегий. [10]

Другие методы

[ редактировать ]

Базы данных белков также можно создавать с использованием данных секвенирования РНК , аннотированных транскриптов РНК и вариантов последовательностей белков. Кроме того, существуют другие, более специализированные базы данных белков, которые можно создать для правильной идентификации интересующего пептида. [10]

Другим методом идентификации белков посредством протеогеномики является сравнительная протеогеномика. Сравнительная протеогеномика сравнивает протеомные данные нескольких родственных видов одновременно и использует гомологию между их белками для улучшения аннотаций с более высокой статистической достоверностью. [11] [12]

Приложения

[ редактировать ]

Протеогеномика может применяться по-разному. Одним из применений является улучшение аннотаций генов в различных организмах. Аннотация генов включает в себя обнаружение генов и их функций. [13] Протеогеномика стала особенно полезной для открытия и улучшения аннотаций генов в прокариотических организмах. Например, с помощью протеогеномного подхода были изучены геномные аннотации различных микроорганизмов, включая Escherichia coli , Mycobacterium и несколько видов бактерий Shewanella . [14]

Помимо улучшения аннотаций генов, протеогеномные исследования также могут предоставить ценную информацию о наличии запрограммированных сдвигов рамки считывания , вырезания N-концевого метионина , сигнальных пептидов , протеолиза и других посттрансляционных модификаций . [15] [11] Протеогеномика имеет потенциальное применение в медицине, особенно в онкологии исследованиях . Рак возникает в результате генетических мутаций, таких как метилирование , транслокация и соматические мутации. Исследования показали, что для понимания молекулярных изменений, которые приводят к раку, необходима как геномная, так и протеомная информация. [16] [17] Протеогеномика помогла в этом благодаря идентификации белковых последовательностей, которые могут играть функциональную роль при раке. [18] Конкретный пример этого произошел в исследовании рака толстой кишки, в результате которого были обнаружены потенциальные мишени для лечения рака. [16] Протеогеномика также привела к персонализированной иммунотерапии, нацеленной на рак, при которой эпитопы антител к раковым антигенам прогнозируются с использованием протеогеномики для создания лекарств, действующих на конкретную опухоль пациента. [19] Помимо лечения, протеогенономика может дать представление о диагностике рака. В исследованиях рака толстой и прямой кишки протеогеномика использовалась для выявления соматических мутаций. Выявление соматических мутаций у пациентов может быть использовано для диагностики рака у пациентов. Помимо прямого применения в лечении и диагностике рака, протеогеномный подход можно использовать для изучения белков, которые приводят к устойчивости к химиотерапии . [17]

Проблемы

[ редактировать ]

Протеогеномика может предложить методы идентификации пептидов, не имея недостатка в виде неполных или неточных баз данных белков, с которыми сталкивается протеомика; однако с протеогеномным подходом возникают проблемы. [10] Одной из самых больших проблем протеогеномики является огромный размер создаваемых баз данных белков. статистически, большая база данных белков с большей вероятностью приведет к неправильному сопоставлению данных из базы данных белков с данными МС/МС; эта проблема может затруднить идентификацию новых пептидов. Ложноположительные результаты также являются проблемой при использовании протеогеномных подходов. ложноположительные результаты могут возникать в результате чрезвычайно больших баз данных по белкам, где несовпадающие данные приводят к неправильной идентификации. Другая проблема заключается в неправильном сопоставлении спектров МС/МС с данными последовательности белка, которые соответствуют аналогичному пептиду, а не реальному пептиду. Известны случаи получения данных о пептиде, расположенном на нескольких сайтах гена, это может привести к данным, которые можно интерпретировать по-разному. Несмотря на эти проблемы, существуют способы уменьшить многие возникающие ошибки. Например, имея дело с очень большой базой данных белков, можно сравнить идентифицированные новые пептидные последовательности со всеми последовательностями в базе данных, а затем сравнить посттрансляционные модификации. Затем можно определить, представляют ли две последовательности один и тот же пептид или это два разных пептида. [10]

  1. ^ «Секвенирование РНК Proteona ESCAPE» . 11 декабря 2018 г.
  2. ^ «Протеона способствует внедрению платформы иммунного профилирования для исследования CAR-T и множественной миеломы» . Новости прецизионной онкологии . 07.05.2021 . Проверено 15 мая 2021 г.
  3. ^ «Электронная книга TotalSeq» . БиоЛегенда . Проверено 23 ноября 2020 г.
  4. ^ «Proteona выпускает программу секвенирования РНК ESCAPE™ для измерения белков и РНК в отдельных клетках с акцентом на клинические вопросы» . Протеона . Проверено 23 ноября 2020 г.
  5. ^ «Метод года 2019: Одноклеточные мультимодальные омики» . Природные методы . 17 (1): 1 января 2020 г. doi : 10.1038/s41592-019-0703-5 . ISSN   1548-7105 . ПМИД   31907477 .
  6. ^ Jump up to: а б с Меншерт, Гербен; Феньё, Дэвид (2017). «Протеогеномика с точки зрения биоинформатики: развивающаяся область» . Обзоры масс-спектрометрии . 36 (5): 584–599. Бибкод : 2017MSRv...36..584M . дои : 10.1002/mas.21483 . ISSN   1098-2787 . ПМК   6101030 . ПМИД   26670565 .
  7. ^ Jump up to: а б Рагглс, Келли В.; Круг, Карстен; Ван, Сяоцзин; Клаузер, Карл Р.; Ван, Цзин; Пейн, Сэмюэл Х.; Феньё, Дэвид; Чжан, Бин; Мани, ДР (01.06.2017). «Методы, инструменты и современные перспективы протеогеномики*» . Молекулярная и клеточная протеомика . 16 (6): 959–981. дои : 10.1074/mcp.MR117.000024 . ISSN   1535-9476 . ПМЦ   5461547 . ПМИД   28456751 .
  8. ^ Яффе, Джейкоб Д.; Берг, Ховард К.; Черч, Джордж М. (январь 2004 г.). «Протеогеномное картирование как дополнительный метод аннотации генома» . Протеомика . 4 (1): 59–77. дои : 10.1002/pmic.200300511 . ISSN   1615-9853 . ПМИД   14730672 . S2CID   10747815 .
  9. ^ Несвижский, Алексей И. (ноябрь 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии» . Природные методы . 11 (11): 1114–1125. дои : 10.1038/nmeth.3144 . ISSN   1548-7105 . ПМЦ   4392723 . ПМИД   25357241 .
  10. ^ Jump up to: а б с д и ж Несвижский, Алексей I (1 ноября 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии» . Природные методы . 11 (11): 1114–1125. дои : 10.1038/nmeth.3144 . ПМЦ   4392723 . ПМИД   25357241 .
  11. ^ Jump up to: а б Гупта Н., Бенхамида Дж., Бхаргава В., Гудман Д., Кейн Э., Керман И., Нгуен Н., Олликайнен Н., Родригес Дж., Ван Дж. и др. Сравнительная протеогеномика: сочетание масс-спектрометрии и сравнительной геномики для анализа нескольких геномов. Геном Рез. 2008;18:1133–1142.
  12. ^ Галлиен С., Перроду Э., Карапито К., Дешайес К., Рейрат Дж. М., Ван Дорселер А., Пох О., Шеффер К., Лекомпт О. (2009) Ортопротеогеномика: исследование множественных протеомов посредством ортологии и новый протокол на базе MS. Геном Res 19, 128–135.
  13. ^ Ансонг, К.; Пурвин, СО; Адкинс, Дж. Н.; Липтон, Миссисипи; Смит, Р.Д. (7 марта 2008 г.). «Протеогеномика: потребности и роли, которые должна выполнять протеомика в аннотации генома» . Брифинги по функциональной геномике и протеомике . 7 (1): 50–62. дои : 10.1093/bfgp/eln010 . ПМИД   18334489 .
  14. ^ Кучарова Вероника; Викер, Харальд Г. (декабрь 2014 г.). «Протеогеномика в микробиологии: правильный поворот на стыке геномики и протеомики». Протеомика . 14 (23–24): 2360–2675. дои : 10.1002/pmic.201400168 . HDL : 1956/9547 . ПМИД   25263021 . S2CID   3240135 .
  15. ^ Гупта Н., Таннер С., Джейтли Н., Адкинс Дж. Н., Липтон М., Эдвардс Р., Ромин М., Остерман А., Бафна В., Смит Р. Д. и др. Целопротеомный анализ посттрансляционных модификаций: применение масс-спектрометрии для протеогеномной аннотации. Геном Рез. 2007;17:1362–1377.
  16. ^ Jump up to: а б Саджад, Васим; Рафик, Мухаммед; Али, Баркат; Хаят, Мухаммед; Зада, Сахиб; Саджад, Васим; Кумар, Танвир (июль 2016 г.). «Протеогеномика: новые развивающиеся технологии» . ХАЯТИ Журнал биологических наук . 23 (3): 97–100. дои : 10.1016/j.hjb.2016.11.002 .
  17. ^ Jump up to: а б Шукла, Хем Д.; Махмуд, Джавед; Вуяскович, Желько (декабрь 2015 г.). «Комплексный протеогеномный подход к ранней диагностике и прогнозированию рака». Письма о раке . 369 (1): 28–36. дои : 10.1016/j.canlet.2015.08.003 . ПМИД   26276717 .
  18. ^ Чемберс, Мэтью С.; Джагтап, Пратик Д.; Джонсон, Джеймс Э.; Макгоуэн, Томас; Кумар, Правин; Онсонго, Гетирия; Герреро, Кэндис Р.; Барснес, Харальд; Водель, Марк (01 ноября 2017 г.). «Доступный ресурс по протеогеномике и информатике для исследователей рака» . Исследования рака . 77 (21): е43–е46. дои : 10.1158/0008-5472.can-17-0331 . ПМЦ   5675041 . ПМИД   29092937 .
  19. ^ Крич, Аманда Л.; Тин, Ин С.; Гулдинг, Скотт П.; Саулд, Джон ФК; Бартельм, Доминик; Руни, Майкл С.; Аддона, Терри А.; Абелин, Дженнифер Г. (2018). «Роль масс-спектрометрии и протеогеномики в продвижении предсказания эпитопа HLA» . Протеомика . 18 (12): e1700259. дои : 10.1002/pmic.201700259 . ISSN   1615-9861 . ПМК   6033110 . ПМИД   29314742 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ff737d0b79d8e7670be6c53794c26511__1711648020
URL1:https://arc.ask3.ru/arc/aa/ff/11/ff737d0b79d8e7670be6c53794c26511.html
Заголовок, (Title) документа по адресу, URL1:
Proteogenomics - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)