Список программного обеспечения для обнаружения областей низкой сложности в белках
Вычислительные методы могут изучать белковые последовательности для выявления областей низкой сложности , которые могут иметь особые свойства, касающиеся их функции и структуры.
Имя | Последнее обновление | Использование | Описание | Открытый исходный код? | Ссылка |
---|---|---|---|---|---|
SAPS | 1992 | загружаемый / веб-сайт | В нем описаны некоторые статистические данные о последовательностях белков для оценки отличительных характеристик содержания и расположения остатков в первичных структурах. | да | [ 1 ] |
СКАЗАТЬ | 1993 | загружаемый | Это двухпроходный алгоритм: сначала идентифицируется LCR, а затем выполняется локальная оптимизация путем маскировки X LCR. | да | [ 2 ] |
ФЛПС | 2017 | загружаемый / веб-сайт | Он может легко обрабатывать очень большие наборы данных о белках, например, полученные в результате проектов метагеномики. Это полезно при поиске белков со схожими CBR и для создания функциональных выводов о CBR интересующего белка. | да | [ 3 ] |
БРОСАТЬ | 2000 | сеть | Он идентифицирует LCR с помощью динамического программирования. | нет | [ 4 ] |
ПРОСТОЙ | 2002 | загружаемый веб-сайт | Он облегчает количественную оценку количества простых последовательностей в белках и определяет тип коротких мотивов, которые демонстрируют кластеризацию выше определенного порога. | да | [ 5 ] |
Oj.py | 2001 | по запросу | Инструмент для разграничения белковых доменов низкой сложности. | нет | [ 6 ] |
ДСР | 2003 | по запросу | Он вычисляет сложность, используя обратную сложность. | нет | [ 7 ] |
СканКом | 2003 | по запросу | Вычисляет композиционную сложность, используя меру лингвистической сложности. | нет | [ 8 ] |
КАРТА | 2005 | по запросу | На основе анализа сложности подпоследовательностей, разделенных парами одинаковых, повторяющихся подпоследовательностей. | нет | [ 9 ] |
ПРЕДВЗЯТОСТЬ | 2006 | загружаемый / веб-сайт | Он использует дискретную статистику сканирования, которая обеспечивает высокоточную коррекцию множественных тестов для вычисления аналитических оценок значимости каждого композиционно смещенного сегмента. | да | [ 10 ] |
ПОЛУЧАТЬ | 2006 | по запросу | Алгоритм на основе графов, который строит граф последовательности. | нет | [ 11 ] |
SubSeqer | 2008 | сеть | Подход на основе графов для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности. | нет | [ 12 ] |
ЭННИ | 2009 | сеть | Этот метод позволяет автоматизировать процесс анализа последовательности. | нет | [ 13 ] |
LPS-аннотация | 2011 | по запросу | Этот алгоритм определяет композиционную погрешность посредством тщательного поиска подпоследовательностей с наименьшей вероятностью (LPS; последовательности с низкой вероятностью) и служит инструментом инструментов, которые теперь доступны молекулярным биологам для генерации гипотез и выводов о белках, которые они исследуют. | нет | [ 14 ] |
LCReXXXplorer | 2015 | сеть | Веб-платформа для поиска, визуализации и обмена данными об участках низкой сложности в белковых последовательностях. LCR-eXXXplorer предлагает инструменты для отображения LCR из базы знаний UniProt/SwissProt в сочетании с другими соответствующими характеристиками белков, предсказанными или экспериментально подтвержденными. Кроме того, пользователи могут выполнять запросы к специально разработанной базе данных, ориентированной на последовательности/LCR. | нет | [ 15 ] |
XNU | 1993 | загружаемый | Для расчета сложности используется оценочная матрица PAM120. | да | [ 16 ] |
АлкоР | 2022 | загружаемый | Инструмент на основе сжатия и без выравнивания для обнаружения областей низкой сложности в биологических данных. | да | [ 17 ] |
Подробный обзор различных методов и инструментов см. [ 18 ]
Кроме того, был разработан веб-мета-сервер под названием PLAtform of TOols for LOw COmplexity (PlaToLoCo) для визуализации и аннотирования областей низкой сложности в белках. [ 19 ] PlaToLoCo интегрирует и собирает результаты пяти различных современных инструментов для обнаружения LCR и предоставляет функциональные аннотации, такие как обнаружение доменов, прогнозирование трансмембранных сегментов и расчет частот аминокислот. Кроме того, может быть получено объединение или пересечение результатов поиска по последовательности запросов.
Веб-сервер нейронной сети под названием LCR-hound был разработан для прогнозирования функции прокариотических и эукариотических LCR на основе их содержания аминокислот или диаминокислот. [ 20 ]
Ссылки
[ редактировать ]- ^ Брендель В., Бухер П., Нурбахш И.Р., Блейсделл Б.Е., Карлин С. (15 марта 1992 г.). «Методы и алгоритмы статистического анализа белковых последовательностей» . Proc Natl Acad Sci США . 89 (6): 2002–2006. Бибкод : 1992PNAS...89.2002B . дои : 10.1073/pnas.89.6.2002 . ПМК 48584 . ПМИД 1549558 .
- ^ Вуттон Дж. К., Федерхен С. (июнь 2003 г.). «Статистика локальной сложности аминокислотных последовательностей и баз данных последовательностей». Компьютеры и химия . 17 (2): 149–163. дои : 10.1016/0097-8485(93)85006-X .
- ^ Харрисон ПМ (13 ноября 2017 г.). «fLPS: Быстрое открытие композиционных искажений белковой вселенной» . БМК Биоинформатика . 18 (1): 476. doi : 10.1186/s12859-017-1906-3 . ПМЦ 5684748 . ПМИД 29132292 .
- ^ Промпонас В.Дж., Энрайт А.Дж., Цока С., Крейл Д.П., Лерой С., Хамодракас С., Сандер С., Узунис К.А. (октябрь 2000 г.). «CAST: итерационный алгоритм анализа сложности участков последовательностей. Анализ сложности участков последовательностей» . Биоинформатика . 16 (10): 915–922. дои : 10.1093/биоинформатика/16.10.915 . ПМИД 11120681 .
- ^ Альба М.М., Ласковский Р.А., Хэнкок Дж.М. (май 2002 г.). «Обнаружение загадочно простых белковых последовательностей с использованием алгоритма SIMPLE» . Биоинформатика . 18 (5): 672–678. дои : 10.1093/биоинформатика/18.5.672 . ПМИД 12050063 .
- ^ Мудрый MJ (2001). «0j.py: программный инструмент для белков и белковых доменов низкой сложности» . Биоинформатика . 17 (Приложение 1): S288–S295. doi : 10.1093/биоинформатика/17.suppl_1.s288 . ПМИД 11473020 .
- ^ Ван Х., Ли Л., Федерхен С., Вуттон Дж.К. (2003). «Обнаружение простых областей в биологических последовательностях, связанных со схемами оценки». J Компьютерная Биол . 10 (2): 171–185. дои : 10.1089/106652703321825955 . ПМИД 12804090 .
- ^ Нанди Т., Даш Д., Гай Р., Б-Рао С., Каннан К., Брахмачари С.К., Рамакришнан С., Рамачандран С. (2003). «Новый алгоритм обнаружения областей низкой сложности в белковых последовательностях». J Biomol Struct Dyn . 20 (5): 657–668. дои : 10.1080/07391102.2003.10506882 . ПМИД 12643768 . S2CID 45635217 .
- ^ Шин С.В., Ким С.М. (15 января 2005 г.). «Новая мера сложности для сравнительного анализа белковых последовательностей полных геномов» . Биоинформатика . 21 (2): 160–170. doi : 10.1093/биоинформатика/bth497 . ПМИД 15333459 .
- ^ Кузнецов И.Б., Хван С. (1 мая 2006 г.). «Новый чувствительный метод обнаружения определяемых пользователем композиционных отклонений в биологических последовательностях» . Биоинформатика . 22 (9): 1055–1063. doi : 10.1093/биоинформатика/btl049 . ПМИД 16500936 .
- ^ Ли Х, Кахвечи Т (15 декабря 2006 г.). «Новый алгоритм для идентификации областей низкой сложности в белковой последовательности» . Биоинформатика . 22 (24): 2980–2987. doi : 10.1093/биоинформатика/btl495 . ПМИД 17018537 .
- ^ Он Д., Паркинсон Дж. (1 апреля 2008 г.). «SubSeqer: подход на основе графов для обнаружения и идентификации повторяющихся элементов в последовательностях низкой сложности» . Биоинформатика . 24 (7): 1016–1017. doi : 10.1093/биоинформатика/btn073 . ПМИД 18304932 .
- ^ Оой Х.С., Кво С.И., Вильдпанер М., Сирота Ф.Л., Эйзенхабер Б., Маурер-Штро С., Вонг В.К., Шляйффер А., Эйзенхабер Ф., Шнайдер Г. (июль 2009 г.). «ЭННИ: интегрированная аннотация последовательности белка de novo» . Нуклеиновые кислоты Рез . 37 (проблема с веб-сервером): W435–W440. дои : 10.1093/нар/gkp254 . ПМК 2703921 . ПМИД 19389726 .
- ^ Харби Д., Кумар М., Харрисон П.М. (6 января 2011 г.). «LPS-аннотация: полная аннотация композиционно смещенных областей в базе знаний о белках» . База данных (Оксфорд) . 2011 : baq031. дои : 10.1093/база данных/baq031 . ПМК 3017391 . ПМИД 21216786 .
- ^ Кирмицоглу I, Промпонас В.Дж. (1 июля 2015 г.). «LCR-eXXXplorer: веб-платформа для поиска, визуализации и обмена данными об участках низкой сложности в белковых последовательностях» . Биоинформатика . 31 (13): 2208–2210. doi : 10.1093/биоинформатика/btv115 . ПМЦ 4481844 . ПМИД 25712690 .
- ^ Клавери Дж. М., Штаты D (июнь 1993 г.). «Методы расширения информации для крупномасштабного анализа последовательностей». Компьютеры Хим . 17 (2): 191–201. дои : 10.1016/0097-8485(93)85010-а .
- ^ Сильва Дж.М., Ци В., Пиньо А.Дж., Пратас Д. (28 декабря 2022 г.). «AlcoR: моделирование, картирование и визуализация областей низкой сложности в биологических данных без выравнивания» . ГигаСайенс . 12 . doi : 10.1093/gigascience/giad101 . ISSN 2047-217X . ПМЦ 10716826 . ПМИД 38091509 .
- ^ Миер П, Паладин Л, Тамана С, Петросян С, Хайду-Солтес Б, Урбанек А, Грука А, Плевчински Д, Гринберг М, Бернадо П, Гаспари З (23 марта 2020 г.). «Распутывание сложности белков низкой сложности» . Брифинги по биоинформатике . 21 (2): 458–472. дои : 10.1093/нагрудник/bbz007 . ISSN 1467-5463 . ПМК 7299295 . ПМИД 30698641 .
- ^ Ярнот П., Зиемска-Легиецка Дж., Добсон Л., Мерски М., Миер П., Андраде-Наварро М.А., Хэнкок Дж.М., Достаньи З., Паладин Л., Неччи М., Пиовесан Д. (02.07.2020). «PlaToLoCo: первый веб-мета-сервер для визуализации и аннотирования областей низкой сложности в белках» . Исследования нуклеиновых кислот . 48 (П1): П77–П84. дои : 10.1093/nar/gkaa339 . ISSN 0305-1048 . ПМЦ 7319588 . ПМИД 32421769 .
- ^ Нтунтуми К., Властаридис П., Моссиалос Д., Статопулос К., Илиопулос И., Промпонас В., Оливер С.Г., Амуциас Г.Д. (04.11.2019). «Области низкой сложности в белках прокариот выполняют важные функциональные роли и высоко консервативны» . Исследования нуклеиновых кислот . 47 (19): 9998–10009. дои : 10.1093/nar/gkz730 . ISSN 0305-1048 . ПМК 6821194 . ПМИД 31504783 .