Критическая оценка аннотации функции

Критическая оценка функциональных аннотаций (CAFA) — это эксперимент, призванный обеспечить крупномасштабную оценку вычислительных методов, предназначенных для прогнозирования функции белка . ^[1] Различные алгоритмы оцениваются по их способности прогнозировать термины Онтологии генов (GO) в категориях « Молекулярная функция» , «Биологический процесс» и «Клеточный компонент» .

Эксперимент состоит из двух треков: (i) эукариотический трек, (ii) прокариотический путь. В каждом треке организаторами предусмотрен набор мишеней. Ожидается, что участники представят свои прогнозы к крайнему сроку подачи, после чего они будут оцениваться по набору конкретных показателей.

Мотивация

Геном , организма может состоять из сотен и десятков тысяч генов которые кодируют сотни тысяч различных белковых последовательностей. Из-за относительно низкой стоимости секвенирования генома определение последовательностей генов и белков происходит быстро и недорого. На данный момент секвенированы тысячи видов, однако многие белки еще недостаточно охарактеризованы. ^[2] Процесс экспериментального определения роли белка в клетке — дорогостоящая и трудоемкая задача. Более того, даже когда проводятся функциональные анализы , они вряд ли дадут полное представление о функции белка. Поэтому стало важным использовать вычислительные инструменты для функциональной аннотации белков. Существует несколько вычислительных методов прогнозирования функции белка, которые могут сделать вывод о функции белка, используя различные биологические и эволюционные данные, но есть значительные возможности для улучшения. Точное предсказание функции белка может иметь долгосрочное значение для биомедицинских и фармацевтических исследований.

Эксперимент CAFA призван обеспечить объективную оценку вычислительных методов, стимулировать исследования в области прогнозирования вычислительных функций и дать представление об общем состоянии современного прогнозирования функций.

Организация

Эксперимент состоит из трёх этапов:

Фаза прогнозирования : ~4 месяца

Организаторы предоставляют сообществу белковые последовательности с неизвестной или неполной функцией и устанавливают крайний срок подачи прогнозов.

Целевое накопление : 6–12 месяцев.

После того, как все прогнозы сохранены и эксперимент вступает в период ожидания, в течение которого ожидается, что функции белка будут накапливаться в общедоступных базах данных.

Фаза анализа : 1 месяц

Предсказатели ранжируются в зависимости от их производительности. Результаты публикуются на научных конференциях и публикуются после рецензирования .

История

Эксперимент CAFA проводится Специальной группой по автоматическому прогнозированию функций (AFP) (AFP/SIG). CAFA была задумана доктором Инбалом (Гальперином) Ландсбергом и организована ею вместе с профессором Рассом Альтманом и доктором Иддо Фридбергом. Встреча AFP/SIG проводилась одновременно с конференцией «Интеллектуальные системы для молекулярной биологии» в 2005, 2006, 2008, 2011 и 2012 годах. ^[3]^[4]^[5]

КАФА 2010-2012 гг.

Первый эксперимент CAFA был организован осенью 2010 года и весной 2012 года. Организаторы предоставили сообществу 48 000 последовательностей с задачей предсказать аннотации Gene Ontology для каждой из этих последовательностей. Из этих 48 000 белков 866 были аннотированы экспериментально во время фазы целевого накопления. Результаты показали, что текущие алгоритмы прогнозирования функций работают значительно лучше, чем простое назначение домена или прямое использование пакета BLAST . Однако они также обнаружили, что точное предсказание биологической функции белка по-прежнему остается открытой и сложной проблемой.

КАФА 2013-2014 гг.

Второй эксперимент CAFA стартовал осенью 2013 года. Начиная с августа заинтересованные стороны могли загрузить более 100 000 целевых последовательностей у 27 видов. Зарегистрированным командам предлагается аннотировать последовательности терминами онтологии генов, а также дополнительно поставить задачу аннотировать человеческие последовательности терминами онтологии фенотипа человека . Крайний срок подачи заявок — 15 января 2014 г. Оценка прогнозов состоится в июне 2014 г.

См. также

CASP : Критическая оценка прогнозирования структуры белка
CAPRI : Критическая оценка прогнозирования взаимодействий

Ссылки

^ Предраг, Радивояц; и др. (2013). «Крупномасштабная оценка вычислительного предсказания функций белка» . Природные методы . 10 (3): 221–227. дои : 10.1038/nmeth.2340 . ПМЦ 3584181 . ПМИД 23353650 .
^ Берналь, Аксель; Уй Ухо; Никос Кирпидес (2001). «Онлайн-база данных геномов (GOLD): мониторинг геномных проектов по всему миру» . Исследования нуклеиновых кислот . 29 (1): 126–127. дои : 10.1093/нар/29.1.126 . ПМК 29859 . ПМИД 11125068 .
^ Фридберг, Иддо; Мартин Джамбон; Адам Годзик (июнь 2006 г.). «Новые возможности в прогнозировании функций белков» . Белковая наука . 15 (6): 1527–1529. дои : 10.1110/ps.062158406 . ПМЦ 2242544 . ПМИД 16731984 .
^ Родригес, Ана; Барри Грант; Адам Годзик; Иддо Фридберг (2007). «Совещание по прогнозированию автоматизированных функций 2006 г.» . Биоинформатика . 8 (Приложение 4): С1–4. дои : 10.1186/1471-2105-8-s4-s1 . ПМК 1892079 . ПМИД 17570143 .
^ Гиллис, Джесси; Пол Павлидис (апрель 2013 г.). «Характеристика современного состояния вычислительного определения функций генов: уроки первой критической оценки функциональной аннотации (CAFA)» (PDF) . БМК Биоинформатика . 14 (Дополнение 3): S15. дои : 10.1186/1471-2105-14-s3-s15 . ПМЦ 3633048 . ПМИД 23630983 .

Внешние ссылки

Специальная группа по автоматизированному прогнозированию функций — информация об участии в конкурсе CAFA Challenge

[1] Предраг, Радивояц; и др. (2013). «Крупномасштабная оценка вычислительного предсказания функций белка» . Природные методы . 10 (3): 221–227. дои : 10.1038/nmeth.2340 . ПМЦ 3584181 . ПМИД 23353650 .

[2] Берналь, Аксель; Уй Ухо; Никос Кирпидес (2001). «Онлайн-база данных геномов (GOLD): мониторинг геномных проектов по всему миру» . Исследования нуклеиновых кислот . 29 (1): 126–127. дои : 10.1093/нар/29.1.126 . ПМК 29859 . ПМИД 11125068 .

[3] Фридберг, Иддо; Мартин Джамбон; Адам Годзик (июнь 2006 г.). «Новые возможности в прогнозировании функций белков» . Белковая наука . 15 (6): 1527–1529. дои : 10.1110/ps.062158406 . ПМЦ 2242544 . ПМИД 16731984 .

[4] Родригес, Ана; Барри Грант; Адам Годзик; Иддо Фридберг (2007). «Совещание по прогнозированию автоматизированных функций 2006 г.» . Биоинформатика . 8 (Приложение 4): С1–4. дои : 10.1186/1471-2105-8-s4-s1 . ПМК 1892079 . ПМИД 17570143 .

[5] Гиллис, Джесси; Пол Павлидис (апрель 2013 г.). «Характеристика современного состояния вычислительного определения функций генов: уроки первой критической оценки функциональной аннотации (CAFA)» (PDF) . БМК Биоинформатика . 14 (Дополнение 3): S15. дои : 10.1186/1471-2105-14-s3-s15 . ПМЦ 3633048 . ПМИД 23630983 .

[1]

[2]

[3]

[4]

[5]