Прогноз субклеточной локализации белка
Предсказание субклеточной локализации белка (или просто предсказание локализации белка) включает в себя предсказание того, где белок находится в клетке , его субклеточную локализацию .
Как правило, инструменты прогнозирования принимают в качестве входных данных информацию о белке, такую как белковая последовательность аминокислот . , и в качестве выходных данных создают предсказанное местоположение внутри клетки, например, ядро , эндоплазматический ретикулум , аппарат Гольджи , внеклеточное пространство или другие органеллы . Цель состоит в том, чтобы создать инструменты, которые смогут точно предсказать результат нацеливания белка в клетки.
Прогнозирование субклеточной локализации белка является важным компонентом биоинформатического прогнозирования функции белка и аннотации генома и может помочь в идентификации мишеней для лекарств.
Фон
[ редактировать ]Экспериментальное определение субклеточной локализации белка может оказаться трудоемкой и трудоемкой задачей. иммуномаркировка или маркировка (например, зеленым флуоресцентным белком ) для проверки локализации с помощью флуоресцентного микроскопа Часто используется . Альтернативой высокой пропускной способности является использование прогнозирования.
Благодаря развитию новых подходов в информатике в сочетании с увеличением набора данных о белках известной локализации вычислительные инструменты теперь могут обеспечивать быстрые и точные прогнозы локализации для многих организмов. Это привело к тому, что предсказание субклеточной локализации стало одной из задач, успешно решаемых биоинформатикой и машинным обучением .
Многие методы прогнозирования в настоящее время превосходят точность некоторых высокопроизводительных лабораторных методов идентификации субклеточной локализации белков. [1] [2] [3] В частности, были разработаны некоторые предикторы. [4] который можно использовать для борьбы с белками, которые могут одновременно существовать или перемещаться между двумя или более разными субклеточными местоположениями. Для подтверждения предсказанной локализации обычно требуется экспериментальная проверка.
Инструменты
[ редактировать ]В 1999 году PSORT была первой опубликованной программой для прогнозирования субклеточной локализации. [5] Последующие инструменты и веб-сайты были выпущены с использованием таких технологий, как искусственные нейронные сети , машина опорных векторов и белковые мотивы . Предикторы могут быть специализированы для белков в разных организмах. Некоторые из них специализируются на эукариотических белках, [6] некоторые для человеческих белков, [7] и некоторые для растительных белков. [8] Были рассмотрены методы прогнозирования предикторов бактериальной локализации и их точность. [9] В 2021 году был опубликован SCLpred-MEM, инструмент для прогнозирования мембранных белков на основе искусственных нейронных сетей. [10] SCLpred-EMS — это еще один инструмент, основанный на искусственных нейронных сетях, который классифицирует белки по эндомембранной системе и секреторному пути (EMS) по сравнению со всеми остальными. [11] Аналогично, Light-Attention использует методы машинного обучения для прогнозирования десяти различных распространенных субклеточных местоположений. [12]
Развитие предсказания субклеточного расположения белков было обобщено в двух подробных обзорных статьях. [13] [14] Последние инструменты и отчет об опыте можно найти в недавней статье Мейнкена и Мин (2012) .
Приложение
[ редактировать ]Знание субклеточной локализации белка может значительно улучшить идентификацию мишени в процессе разработки лекарств . Например, секретируемые белки и белки плазматической мембраны легко доступны молекулам лекарств благодаря их локализации во внеклеточном пространстве или на поверхности клетки.
Поверхность бактериальных клеток и секретируемые белки также представляют интерес из-за их потенциала в качестве кандидатов на вакцины или диагностических мишеней. Аберрантная субклеточная локализация белков наблюдалась в клетках ряда заболеваний, таких как рак и болезнь Альцгеймера . Секретируемые белки некоторых архей, способные выживать в необычных условиях, имеют промышленно важное применение.
С помощью прогнозирования можно оценить большое количество белков, чтобы найти кандидатов, которые будут доставлены в нужное место.
Базы данных
[ редактировать ]Результаты прогнозирования субклеточной локализации могут храниться в базах данных. Примеры включают многовидовую базу данных Compartments , FunSecKB2, базу данных грибов; [15] PlantSecKB, база данных растений; [16] MetazSecKB, база данных животных и человека; [17] и ProtSecKB, база данных протистов. [18]
Ссылки
[ редактировать ]- ^ Калил, М; Чжэн, Ю; Чен, Дж; Фэн, X; Симпсон, Джей Си; Полластри, Г; Муни, К. (6 марта 2020 г.). «SCLpred-EMS: предсказание субклеточной локализации белков эндомембранной системы и секреторного пути с помощью глубоких сверточных нейронных сетей N-к-1». Биоинформатика . 36 (11): 3343–3349. doi : 10.1093/биоинформатика/btaa156 . hdl : 10197/12182 . ПМИД 32142105 .
- ^ Рей С., Гарди Дж.Л., Бринкман Ф.С. (2005). «Оценка точности высокопроизводительных вычислительных и лабораторных подходов для полногеномной идентификации субклеточной локализации белков у бактерий» . БМК Геномика . 6 : 162. дои : 10.1186/1471-2164-6-162 . ПМЦ 1314894 . ПМИД 16288665 .
- ^ Калил, Маназ; Эллингер, Лиам; Лалор, Клода; Полластри, Джанлука; Муни, Кэтрин (2021). «SCLpred-MEM: предсказание субклеточной локализации мембранных белков с помощью глубоких сверточных нейронных сетей N-to-1» . Белки: структура, функции и биоинформатика . 89 (10): 1233–1239. дои : 10.1002/прот.26144 . HDL : 2346/90320 . ПМИД 33983651 . S2CID 234484678 .
- ^ Чжоу К.С., Шен Х.Б. (2008). «Cell-PLoc: пакет веб-серверов для прогнозирования субклеточной локализации белков в различных организмах». Протоколы природы . 3 (2): 153–62. дои : 10.1038/nprot.2007.494 . ПМИД 18274516 . S2CID 226104 .
- ^ «Прогнозирование субклеточной локализации белка» . www.ncbi.nlm.nih.gov . Проверено 31 декабря 2016 г.
- ^ Чжоу К.С., Ву ZC, Сяо X (2011). «iLoc-Euk: многометочный классификатор для прогнозирования субклеточной локализации одинплексных и мультиплексных эукариотических белков» . ПЛОС ОДИН . 6 (3): e18258. Бибкод : 2011PLoSO...618258C . дои : 10.1371/journal.pone.0018258 . ПМК 3068162 . ПМИД 21483473 .
- ^ Шен Х.Б., Чжоу К.К. (ноябрь 2009 г.). «Нисходящий подход для повышения эффективности прогнозирования субклеточной локализации белков человека: Hum-mPLoc 2.0». Аналитическая биохимия . 394 (2): 269–74. дои : 10.1016/j.ab.2009.07.046 . ПМИД 19651102 .
- ^ Чжоу К.С., Шен Х.Б. (2010). «Plant-mPLoc: нисходящая стратегия, расширяющая возможности прогнозирования субклеточной локализации растительных белков» . ПЛОС ОДИН . 5 (6): е11335. Бибкод : 2010PLoSO...511335C . дои : 10.1371/journal.pone.0011335 . ПМЦ 2893129 . ПМИД 20596258 .
- ^ Гарди Дж.Л., Бринкман Ф.С. (октябрь 2006 г.). «Методы прогнозирования субклеточной локализации бактериальных белков». Обзоры природы. Микробиология . 4 (10): 741–51. дои : 10.1038/nrmicro1494 . ПМИД 16964270 . S2CID 62781755 .
- ^ Калил, Маназ; Эллингер, Лиам; Лалор, Клода; Полластри, Джанлука; Муни, Кэтрин (2021). «SCLpred-MEM: предсказание субклеточной локализации мембранных белков с помощью глубоких сверточных нейронных сетей N-to-1» . Белки: структура, функции и биоинформатика . 89 (10): 1233–1239. дои : 10.1002/прот.26144 . HDL : 2346/90320 . ПМИД 33983651 . S2CID 234484678 .
- ^ Калил, Маназ; Чжэн, Яндан; Чен, Цзялян; Фэн, Сюаньмин; Симпсон, Джереми С; Полластри, Джанлука; Муни, Кэтрин (1 июня 2020 г.). «SCLpred-EMS: предсказание субклеточной локализации белков эндомембранной системы и секреторного пути с помощью глубоких сверточных нейронных сетей N-к-1» . Биоинформатика . 36 (11): 3343–3349. doi : 10.1093/биоинформатика/btaa156 . hdl : 10197/12182 . ПМИД 32142105 .
- ^ Рост, Старк; Хайнцингер, Даллаго (26 апреля 2021 г.). «Слабое внимание предсказывает расположение белка на основе языка жизни» . Биорксив . дои : 10.1101/2021.04.25.441334 . S2CID 233449747 .
- ^ Накаи, К. Сигналы сортировки белков и предсказание субклеточной локализации. Адв. Protein Chem., 2000, 54, 277-344.
- ^ Чоу, КЦ; Shen, HB Review: Последние достижения в предсказании субклеточного расположения белков» Anal. Biochem 2007, 370, 1-16.
- ^ «FunSecKB2 (База знаний о грибковом секретоме и субклеточном протеоме 2.1)» . bioinformatics.ysu.edu . Архивировано из оригинала 10 апреля 2016 г. Проверено 17 сентября 2017 г.
- ^ «PlantSecKB (База знаний о секретомах растений и субклеточных протеомах)» . bioinformatics.ysu.edu . Архивировано из оригинала 6 апреля 2016 г. Проверено 17 сентября 2017 г.
- ^ «MetazSecKB (Субклеточное расположение белков Metazoa (человека и животных), база данных секретомов и субклеточных протеомов)» . bioinformatics.ysu.edu . Архивировано из оригинала 6 апреля 2016 г. Проверено 17 сентября 2017 г.
- ^ «ProtSecKB (База знаний о секретоме протистов и субклеточном протеоме)» . proteomics.ysu.edu . Проверено 17 сентября 2017 г.
Дальнейшее чтение
[ редактировать ]- Борк П., Дандекар Т., Диас-Ласко Ю., Эйзенхабер Ф., Хюйнен М., Юань Ю. (ноябрь 1998 г.). «Прогностическая функция: от генов к геномам и обратно». Журнал молекулярной биологии . 283 (4): 707–25. дои : 10.1006/jmbi.1998.2144 . ПМИД 9790834 .
- Накаи К. (2000). «Сигналы сортировки белков и предсказание субклеточной локализации». Достижения в области химии белков . 54 : 277–344. дои : 10.1016/s0065-3233(00)54009-1 . ISBN 0120342545 . ПМИД 10829231 .
- Эмануэльссон О (декабрь 2002 г.). «Прогнозирование субклеточной локализации белка на основе информации о последовательностях аминокислот» . Брифинги по биоинформатике . 3 (4): 361–76. дои : 10.1093/нагрудник/3.4.361 . ПМИД 12511065 .
- Шнайдер Г., Фехнер Ю (июнь 2004 г.). «Достижения в предсказании сигналов нацеливания на белки». Протеомика . 4 (6): 1571–80. дои : 10.1002/pmic.200300786 . ПМИД 15174127 . S2CID 7217647 .
- Гарди Дж.Л., Бринкман Ф.С. (октябрь 2006 г.). «Методы прогнозирования субклеточной локализации бактериальных белков». Обзоры природы. Микробиология . 4 (10): 741–51. дои : 10.1038/nrmicro1494 . ПМИД 16964270 . S2CID 62781755 .
- Чоу К.С., Шен Х.Б. (ноябрь 2007 г.). «Недавний прогресс в предсказании субклеточного расположения белков». Аналитическая биохимия . 370 (1): 1–16. дои : 10.1016/j.ab.2007.07.006 . ПМИД 17698024 .