Проект сравнения генома Фиокруса
Проект сравнения геномов Fiocruz — это совместная работа Бразильского института Освальдо Круза и IBM компании World Community Grid , целью которой является создание базы данных , позволяющей сравнивать гены из многих геномов друг с другом с помощью SSEARCH. [1] Программа SSEARCH выполняет строгое выравнивание Смита-Уотермана между последовательностью белка и другой последовательностью белка, базой данных белков, ДНК или библиотекой ДНК.
Характер вычислений в проекте позволяет легко использовать преимущества добровольных вычислений . Это, наряду с вероятной гуманитарной пользой от исследования, побудило World Community Grid (добровольную вычислительную сеть, которая использует время простоя компьютеров) запустить проект Fiocruz. Все продукты находятся в свободном доступе по контракту с WCG.
Описание
[ редактировать ]Проблема в том, что к записям базы данных белков прилагается очень большой объем информации (структурный, функциональный, перекрестные ссылки и т. д.). После ввода информация редко обновляется или исправляется. Эта аннотация предсказанной функции белка часто является неполной, использует нестандартную номенклатуру или может быть неправильной при перекрестных ссылках на предыдущие, иногда неправильно аннотированные последовательности. Кроме того, многие белки, состоящие из нескольких структурных и/или функциональных доменов, не учитываются автоматизированными системами. Сравнительная информация сегодня огромна по сравнению с ранними днями геномики. Одна ошибка усугубляется, а затем усложняется.
Проект сравнения геномов выполняет полное попарное сравнение между всеми предсказанными белковыми последовательностями, получая используемые индексы (вместе со стандартизированной онтологией генов). [2] ) в качестве справочного репозитория для сообщества аннотаторов. Проект предоставляет биологам бесценные источники данных. Программа сравнения сходства последовательностей, используемая в проекте сравнения геномов, называется SSEARCH. Эта программа математически находит наилучшее локальное выравнивание между парами последовательностей. [3] и является свободно доступной реализацией алгоритма Смита – Уотермана. [4]
Использование SSEARCH делает возможным точную аннотацию, исправление несоответствий и возможное присвоение функций гипотетическим белкам с неизвестной функцией. Более того, правильно распознаются белки с несколькими доменами и функциональными элементами. Выявляются даже дальние связи.
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Веб-страница SSEARCH. Архивировано 20 сентября 2012 г. на Wayback Machine .
- ^ Веб-сайт Генной Онтологии
- ^ Пирсон, Уильям Р. (ноябрь 1991 г.). «Поиск библиотек последовательностей белков: сравнение чувствительности и селективности алгоритмов Смита-Уотермана и FASTA» . Геномика . 11 (3): 635–650. дои : 10.1016/0888-7543(91)90071-л . ISSN 0888-7543 . ПМИД 1774068 .
- ^ Смит, Т.Ф.; Уотерман, М.С. (март 1981 г.). «Идентификация общих молекулярных последовательностей» . Журнал молекулярной биологии . 147 (1): 195–197. дои : 10.1016/0022-2836(81)90087-5 . ISSN 0022-2836 . ПМИД 7265238 .