Jump to content

Псевдоаминокислотный состав

Псевдоаминокислотная композиция , или PseAAC , в молекулярной биологии была первоначально представлена ​​Куо-Чен Чжоу в 2001 году для представления образцов белков для улучшения предсказания субклеточной локализации белка и предсказания типа мембранного белка . [1] Как и метод ванильного аминокислотного состава (AAC), он характеризует белок в основном с использованием матрицы частот аминокислот, что помогает иметь дело с белками без значительной последовательной гомологии с другими белками. По сравнению с AAC в матрицу также включена дополнительная информация для представления некоторых локальных особенностей, таких как корреляция между остатками на определенном расстоянии. [2] При рассмотрении дел PseAAC Теорема инвариантности Чжоу часто использовалась.

Чтобы предсказать субклеточную локализацию белков и другие атрибуты на основе их последовательности, обычно используются два типа моделей для представления образцов белков: (1) последовательная модель и (2) непоследовательная модель или дискретная модель.

Наиболее типичным последовательным представлением образца белка является его полная аминокислотная (АА) последовательность, которая может содержать наиболее полную информацию. Это очевидное преимущество последовательной модели. Чтобы получить желаемые результаты, для проведения прогнозирования обычно используются инструменты, основанные на поиске сходства последовательностей.

Учитывая белковую последовательность P с аминокислотные остатки, т.е.

где R 1 представляет собой 1-й остаток белка Р , R 2 - 2-й остаток и т.д. Это представление белка в последовательной модели.

Однако такой подход терпит неудачу, когда исследуемый белок не имеет значительной гомологии с известным белком(ами). Таким образом, были предложены различные дискретные модели, не опирающиеся на порядок последовательности. Самая простая дискретная модель использует аминокислотный состав (ААС) для представления образцов белка. В рамках модели AAC белок P из уравнения 1 также может быть выражен формулой

где — нормализованные частоты встречаемости 20 нативных аминокислот в P и T — оператора транспонирования. AAC белка получают тривиально, используя первичную структуру белка, известную, как указано в уравнении 1 ; это также возможно путем гидролиза без знания точной последовательности, и такой этап на самом деле часто является предпосылкой для секвенирования белка . [3]

Благодаря своей простоте модель аминокислотного состава (ААС) широко использовалась во многих более ранних статистических методах прогнозирования свойств белков. Однако вся информация о порядке последовательности теряется. Это его главный недостаток.

Концепция

[ редактировать ]

порядке последовательностей, была предложена концепция псевдоаминокислот состав PseAAC Чтобы избежать полной потери информации о ) ( . [1] В отличие от обычного аминокислотного состава (AAC), который содержит 20 компонентов, каждый из которых отражает частоту встречаемости одной из 20 нативных аминокислот в белке, PseAAC содержит набор из более чем 20 дискретных факторов, где первые 20 представляют собой компоненты его обычного аминокислотного состава, в то время как дополнительные факторы включают некоторую информацию о порядке последовательности через различные псевдокомпоненты.

Дополнительные факторы представляют собой серию корреляционных факторов различного ранга вдоль белковой цепи, но они также могут представлять собой любые комбинации других факторов, если они могут так или иначе отражать некоторые виды эффектов порядка последовательности. Таким образом, суть PseAAC заключается в том, что он, с одной стороны, охватывает состав АК, но с другой стороны содержит информацию, выходящую за рамки состава АК, и, следовательно, может лучше отражать особенность белковой последовательности посредством дискретной модели.

Между тем, как резюмируется в обзорной статье 2009 года, также были разработаны различные способы создания вектора PseAAC. [2]

Алгоритм

[ редактировать ]
Рисунок 1 . Схематический рисунок, показывающий (a) 1-й уровень, (b) 2-й уровень и (c) режим корреляции последовательности-порядка-корреляции 3-го уровня вдоль белковой последовательности, где R 1 представляет собой аминокислотный остаток в позиция последовательности 1, R 2 в позиции 2 и т. д. (см. уравнение 1 ), а коэффициенты связи даны уравнением 6 . Панель (а) отражает режим корреляции между всеми наиболее смежными остатками, панель (б) — между всеми 2-ми наиболее смежными остатками, а панель (в) — между всеми 3-ми наиболее смежными остатками.

Согласно модели PseAAC, белок P из уравнения 1 можно сформулировать как

где ( ) компоненты имеют вид

где - весовой коэффициент, а тот Коэффициент корреляции -го уровня, который отражает корреляцию порядка последовательности между всеми -th наиболее смежных остатков, как сформулировано

с

где это -я функция аминокислоты , и общее количество рассматриваемых функций. Например, в оригинальной статье Чжоу [1] , и представляют собой соответственно значение гидрофобности, значение гидрофильности и массу боковой цепи аминокислоты. ; пока , и соответствующие значения для аминокислоты . Следовательно, общее количество рассматриваемых функций равно . видно Из уравнения 3 , что первые 20 компонентов, т.е. связаны с традиционным АА-составом белка, тогда как остальные компоненты являются коэффициентами корреляции, которые отражают 1-й уровень, 2-й уровень,... и Паттерны корреляции порядка последовательности -го уровня ( рис. 1 ). Именно благодаря этим дополнительным факторы, которые включают некоторые важные эффекты порядка последовательности.

в уравнении 3 является целочисленным параметром, и выбор другого целого числа для приведет к составу PseAA, отличающемуся по размерности. [4]

Использование уравнения 6 — лишь один из многих способов получения коэффициентов корреляции в PseAAC или его компонентах. Остальные, такие как физико-химический дистанционный режим [5] и режим амфифильного рисунка, [6] также может использоваться для получения различных типов PseAAC, как описано в обзорной статье 2009 года. [2] В 2011 году формулировка PseAAC ( уравнение 3 ) была расширена до формы общего PseAAC, заданной следующим образом: [7]

где индекс является целым числом, а его значение и компоненты будет зависеть от того, как извлечь желаемую информацию из аминокислотной последовательности P в уравнении 1 .

Общий PseAAC может использоваться для отражения любых желаемых функций в соответствии с целями исследования, включая такие основные функции, как функциональный домен , последовательная эволюция и онтология генов , чтобы улучшить качество прогнозирования субклеточной локализации белков. [8] [9] а также их многие другие важные атрибуты.

  1. ^ Jump up to: а б с Чжоу К.С. (май 2001 г.). «Прогнозирование клеточных свойств белков с использованием псевдоаминокислотного состава». Белки . 43 (3): 246–55. дои : 10.1002/прот.1035 . ПМИД   11288174 . S2CID   28406797 .
  2. ^ Jump up to: а б с Чжоу К.С. (2009). «Псевдоаминокислотный состав и его применение в биоинформатике, протеомике и системной биологии». Современная протеомика . 6 (4): 262–274. дои : 10.2174/157016409789973707 .
  3. ^ Михаил А. Альтерман; Питер Хунцикер (2 декабря 2011 г.). Аминокислотный анализ: методы и протоколы . Хумана Пресс. ISBN  978-1-61779-444-5 .
  4. ^ Чоу К.С., Шен Х.Б. (ноябрь 2007 г.). «Недавний прогресс в предсказании субклеточного расположения белков». Анальный. Биохим . 370 (1): 1–16. дои : 10.1016/j.ab.2007.07.006 . ПМИД   17698024 .
  5. ^ Чоу К.С. (ноябрь 2000 г.). «Прогнозирование субклеточного расположения белков с помощью эффекта квазипорядка последовательности». Биохим. Биофиз. Рез. Коммун . 278 (2): 477–83. дои : 10.1006/bbrc.2000.3815 . ПМИД   11097861 .
  6. ^ Чжоу К.С. (январь 2005 г.). «Использование амфифильного псевдоаминокислотного состава для прогнозирования классов подсемейства ферментов» . Биоинформатика . 21 (1): 10–9. doi : 10.1093/биоинформатика/bth466 . ПМИД   15308540 .
  7. ^ Чжоу К.С. (март 2011 г.). «Некоторые замечания о предсказании свойств белков и псевдоаминокислотном составе» . Журнал теоретической биологии . 273 (1): 236–47. Бибкод : 2011JThBi.273..236C . дои : 10.1016/j.jtbi.2010.12.024 . ПМЦ   7125570 . ПМИД   21168420 .
  8. ^ Чжоу К.С., Шен Х.Б. (2008). «Cell-PLoc: пакет веб-серверов для прогнозирования субклеточной локализации белков в различных организмах» . Нат Проток . 3 (2): 153–62. дои : 10.1038/nprot.2007.494 . ПМИД   18274516 . S2CID   226104 . Архивировано из оригинала 27 августа 2007 г. Проверено 24 марта 2008 г.
  9. ^ Шен Х.Б., Чжоу К.К. (февраль 2008 г.). «PseAAC: гибкий веб-сервер для генерации различных видов псевдоаминокислотного состава белков». Анальный. Биохим . 373 (2): 386–8. дои : 10.1016/j.ab.2007.10.012 . ПМИД   17976365 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8b1a2bbd4d6e583e7a42d361e7a832d8__1684407300
URL1:https://arc.ask3.ru/arc/aa/8b/d8/8b1a2bbd4d6e583e7a42d361e7a832d8.html
Заголовок, (Title) документа по адресу, URL1:
Pseudo amino acid composition - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)