Европейский институт биоинформатики
Аббревиатура | ЭМБЛ-ЭБИ |
---|---|
Формирование | 1992 [ 1 ] |
Расположение |
|
Координаты | 52.079889, 0.186356 |
Директор | Юэн Бирни [ 2 ] |
Заместитель директора | Рольф Апвейлер [ 2 ] |
Головная организация | Европейская лаборатория молекулярной биологии |
Персонал | 685 [ 3 ] |
Веб-сайт | www |
Европейский институт биоинформатики ( EMBL-EBI ) — межправительственная организация (IGO), которая, как часть Европейской лаборатории молекулярной биологии (EMBL), занимается исследованиями и услугами в области биоинформатики . Он расположен на территории кампуса Wellcome Genome в Хинкстоне , недалеко от Кембриджа , и в нем работает более 600 сотрудников, работающих полный рабочий день (FTE). [ 4 ]
Кроме того, EMBL-EBI проводит учебные программы, которые обучают ученых основам работы с биологическими данными и продвигают множество биоинформатических инструментов, доступных для их исследований, как на основе EMBL-EBI, так и не на основе EMBL-EBI.
Биоинформатические услуги
[ редактировать ]Одной из ролей EMBL-EBI является индексирование и хранение биологических данных в наборе баз данных, включая Ensembl (хранит данные о последовательностях всего генома), UniProt (база данных последовательностей белков и аннотаций) и Protein Data Bank (третичные данные о белках и нуклеиновых кислотах). структура базы данных). Предоставляются различные онлайн-сервисы и инструменты, такие как инструмент поиска базового локального выравнивания (BLAST) или инструмент выравнивания последовательностей Clustal Omega, позволяющий осуществлять дальнейший анализ данных.
ВЗРЫВ
[ редактировать ]ВЗРЫВ [ 5 ] — алгоритм сравнения первичной структуры биомакромолекулы, чаще всего нуклеотидной последовательности ДНК/РНК и аминокислотной последовательности белков, хранящихся в биоинформационных базах данных, с запрашиваемой последовательностью. Алгоритм использует оценку доступных последовательностей по запросу с помощью матрицы оценок, такой как BLOSUM 62 . Последовательности с наивысшей оценкой представляют собой ближайших родственников запроса с точки зрения функционального и эволюционного сходства. [ 6 ]
Поиск в базе данных с помощью BLAST требует, чтобы входные данные были в правильном формате (например, в формате FASTA , GenBank, PIR или EMBL). Пользователи также могут указать конкретные базы данных для поиска, выбрать используемые оценочные матрицы и другие параметры перед запуском инструмента. Лучшие совпадения в результатах BLAST упорядочены в соответствии с их рассчитанным значением E (вероятность случайного присутствия в базе данных совпадения с аналогичным или более высоким рейтингом). [ 7 ]
Кластал Омега
[ редактировать ]Кластал Омега [ 8 ] представляет собой инструмент множественного выравнивания последовательностей (MSA), который позволяет найти оптимальное выравнивание минимум трех и максимум 4000 входных последовательностей ДНК и белков. [ 9 ] Алгоритм Clustal Omega использует две профильные модели скрытой Маркова (HMM) для окончательного выравнивания последовательностей. Выходные данные Clustal Omega можно визуализировать в виде направляющего дерева (филогенетические отношения последовательностей наилучшего спаривания) или упорядочить по взаимному сходству последовательностей между запросами. [ 10 ] Главным преимуществом Clustal Omega перед другими инструментами MSA (Muscle, ProbCons ) является его эффективность при сохранении значительной точности результатов.
Вместе
[ редактировать ]Ансамбль основан на базе EMBL-EBI. [ 11 ] — это база данных, организованная на основе геномных данных, поддерживаемая проектом Ensembl . Ensembl , которому поручено непрерывное аннотирование геномов модельных организмов , предоставляет исследователям комплексный ресурс соответствующей биологической информации о каждом конкретном геноме. Аннотация сохраненных эталонных геномов осуществляется автоматически и на основе последовательностей. Ensembl включает в себя общедоступную базу данных геномов, доступ к которой можно получить через веб-браузер. С сохраненными данными можно взаимодействовать с помощью графического пользовательского интерфейса, который поддерживает отображение данных с несколькими уровнями разрешения: от кариотипа через отдельные гены до нуклеотидной последовательности. [ 12 ]
Первоначально основной областью интересов были позвоночные животные, но с 2009 года Ensembl предоставляет аннотированные данные о геномах растений, грибов, беспозвоночных, бактерий и других видов в дочернем проекте Ensembl Genomes . По состоянию на 2020 год [update] В различных базах данных проекта Ensembl содержится более 50 000 эталонных геномов. [ 13 ]
ПДБ
[ редактировать ]ПДБ [ 14 ] представляет собой базу данных трехмерных структур биологических макромолекул, таких как белки и нуклеиновые кислоты. Данные обычно получают с помощью рентгеновской кристаллографии или ЯМР-спектроскопии и передаются вручную структурными биологами со всего мира через организации-члены PDB — PDBe , RCSB, PDBj и BMRB. Доступ к базе данных можно получить через веб-страницы ее участников, включая PDBe (размещенный в EMBL-EBI). Являясь членом консорциума wwPDB , PDBe помогает в совместной работе по архивированию и поддержанию данных о структуре макромолекул. [ 15 ]
ЮниПрот
[ редактировать ]UniProt — это онлайн-хранилище данных о последовательностях белков и аннотаций, распространенных в базах данных UniProt Knowledge Base (UniProt KB), UniProt Reference Clusters (UniRef) и UniProt Archive (UniParc). Первоначально задуманные как отдельные предприятия EMBL-EBI, Швейцарского института биоинформатики (SIB) (совместно поддерживающие Swiss-Prot и TrEMBL) и Protein Information Resource (PIR) (в котором размещена база данных белковых последовательностей), рост глобального сбора данных о белках привел к за их сотрудничество в создании UniProt в 2002 году. [ 16 ]
Записи о белках, хранящиеся в UniProt, каталогизируются по уникальному идентификатору UniProt. Данные аннотаций, собранные для каждой записи, организованы в логические разделы (например, функция белка, структура, экспрессия, последовательность или соответствующие публикации), что позволяет получить скоординированный обзор интересующего белка. Также предоставляются ссылки на внешние базы данных и оригинальные источники данных. Помимо стандартного поиска по названию/идентификатору белка, на веб-странице UniProt размещены инструменты для поиска BLAST, выравнивания последовательностей или поиска белков, содержащих определенные пептиды. [ 17 ]
АльфаФолд БД
[ редактировать ]База данных структур белков AlphaFold (AlphaFold DB) — это совместный проект с Google DeepMind, целью которого является сделать предсказанные структуры белков из системы искусственного интеллекта AlphaFold бесплатными для научного сообщества. [ 18 ] Первый выпуск базы данных состоялся в 2021 году; по состоянию на 2024 год [update]AlphaFold DB обеспечивает доступ к более чем 214 миллионам белковых структур. [ 19 ]
Другие биоинформатические организации
[ редактировать ]- Национальный центр биотехнологической информации (NCBI), Национальная медицинская библиотека США
- Национальный институт генетики ( Банк данных ДНК Японии )
- Швейцарский институт биоинформатики (SIB: Expasy )
- Ресурс Австралии по биоинформатике
- BIG Data Center (Национальный центр геномных данных), Пекинский институт геномики , Китайская академия наук
См. также
[ редактировать ]- База данных альтернативного сплайсинга и разнообразия транскриптов
- Биообразцы
- Европейская организация молекулярной биологии
- Европейский архив нуклеотидов
Ссылки
[ редактировать ]- ^ «Справочная информация | Европейский институт биоинформатики» . Ebi.ac.uk. 16 мая 2018 года . Проверено 29 октября 2019 г.
- ^ Jump up to: а б «Лидерство» . www.ebi.ac.uk. Проверено 21 августа 2024 г.
- ^ «Основные события EMBL-EBI 2023» (PDF) (пресс-релиз). ЭМБЛ-ЭБИ. 8 апреля 2024 г. с. 4.
- ^ «Научный отчет» (PDF) . www.embl.de. 2017 . Проверено 29 октября 2019 г.
- ^ «ВЗРЫВ NCBI в EMBL-EBI» . www.ebi.ac.uk. Проверено 3 ноября 2021 г.
- ^ Альтшул С.Ф., Гиш В., Миллер В., Майерс Э.В., Липман DJ (октябрь 1990 г.). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. дои : 10.1016/S0022-2836(05)80360-2 . ПМИД 2231712 . S2CID 14441902 .
- ^ Уиллер Д., Бхагват М. (2007). ВЗРЫВ Быстрый старт . Методы молекулярной биологии. Том. 395. Хумана Пресс. стр. 149–176. ПМЦ 4780883 . ПМИД 17993672 .
- ^ «Кластал Омега в EMBL-EBI» . ebi.ac.uk. Проверено 3 ноября 2021 г.
- ^ «Документация Clustal Omega в EMBL-EBI» . ebi.ac.uk. Проверено 3 ноября 2021 г.
- ^ Сиверс Ф., Хиггинс Д.Г. (январь 2018 г.). «Clustal Omega для точного выравнивания многих белковых последовательностей» . Белковая наука . 27 (1): 135–145. дои : 10.1002/pro.3290 . ПМЦ 5734385 . ПМИД 28884485 .
- ^ «Домашняя страница ансамбля» . ensembl.org . Проверено 3 ноября 2021 г.
- ^ Хоу К.Л., Ачутан П., Аллен Дж., Аллен Дж., Альварес-Харрета Дж., Амод М.Р. и др. (январь 2021 г.). «Ансамбль 2021» . Исследования нуклеиновых кислот . 49 (Д1): Д884–Д891. дои : 10.1093/nar/gkaa942 . ПМЦ 7778975 . ПМИД 33137190 .
- ^ «О проекте Ансамбль» . ensembl.org . Проверено 3 ноября 2021 г.
- ^ Берли, Стивен К.; и др. (январь 2019 г.). «Банк данных белков: единый глобальный архив трехмерных данных о структуре макромолекул» . Исследования нуклеиновых кислот . 47 (Д1): Д520–Д528. дои : 10.1093/nar/gky949 . ПМК 6324056 . ПМИД 30357364 .
- ^ «О ПДБе» . ebi.ac.uk. Проверено 3 ноября 2021 г.
- ^ «О ЮниПроте» . uniprot.org . Проверено 3 ноября 2021 г.
- ^ Бейтман, Алекс; и др. (январь 2021 г.). «UniProt: универсальная база знаний о белках в 2021 году» . Исследования нуклеиновых кислот . 49 (Д1): Д480–Д489. дои : 10.1093/nar/gkaa1100 . ПМЦ 7778908 . ПМИД 33237286 .
- ^ «База данных структуры белков AlphaFold» . Alphafold.ebi.ac.uk . Проверено 22 августа 2024 г.
- ^ Варади, Михай; Бертони, Дамиан; Магана, Полина; Парамвал, Урмила; Пидручная, Иванна; Радхакришнан, Маларвижи; Ценков Максим; Наир, Шринат; Мирдита, Милот; Йо, Джинги; Ковалевский Олег; Туньясувунакул, Кэтрин; Лидон, Агата; Жидек, Августин; Томлинсон, Хэмиш; Харихаран, Дхаванти; Абрахамсон, Джош; Грин, Тим; Джампер, Джон; Бирни, Юэн; Штайнеггер, Мартин; Хассабис, Демис; Веланкар, Самир (5 января 2024 г.). «База данных о структуре белков AlphaFold в 2024 году: обеспечивает структурный охват более 214 миллионов белковых последовательностей» . Исследования нуклеиновых кислот . 52 (Д1): Д368–Д375. дои : 10.1093/nar/gkad1011 . ПМЦ 10767828 .
- Биоинформатические организации
- Биологические научно-исследовательские институты в Соединенном Королевстве
- Здания и сооружения в округе Южный Кембриджшир
- Хинкстон
- Организации информационных технологий, базирующиеся в Европе
- Международные исследовательские институты
- Институты молекулярной биологии
- Учреждения-партнеры Кембриджского университета
- Научно-исследовательские институты, основанные в 1992 году.
- Исследовательские институты в Кембриджшире
- Наука и технологии в Европе
- Институты системных наук
- 1992 заведения в Англии