Европейский институт биоинформатики
![]() | |
Аббревиатура | ЭМБЛ-ЭБИ |
---|---|
Формирование | 1992 [1] |
Расположение |
|
Координаты | 52.079889, 0.186356 |
Директор | Я не знаю Бирни |
Директор | Рольф Апвайлер |
Головная организация | Европейская лаборатория молекулярной биологии |
Персонал | 570 [2] |
Веб-сайт | www |
Европейский институт биоинформатики ( EMBL-EBI ) — межправительственная организация (IGO), которая, как часть Европейской лаборатории молекулярной биологии (EMBL), занимается исследованиями и услугами в области биоинформатики . Он расположен на территории кампуса Wellcome Genome в Хинкстоне , недалеко от Кембриджа , и в нем работает более 600 сотрудников, работающих полный рабочий день (FTE). [3] Руководители института, такие как Рольф Апвейлер , Алекс Бейтман , Юэн Бирни и Гай Кокрейн, советник Научно-консультативного совета Национального центра данных по геномике, входят в международную исследовательскую сеть BIG Data Center при Пекинском институте геномики . [4]
Кроме того, EMBL-EBI проводит учебные программы, которые обучают ученых основам работы с биологическими данными и продвигают множество биоинформатических инструментов, доступных для их исследований, как на основе EMBL-EBI, так и не на основе EMBL-EBI.
Биоинформационные услуги [ править ]
Одной из ролей EMBL-EBI является индексирование и хранение биологических данных в наборе баз данных, включая Ensembl (хранит данные о последовательностях всего генома), UniProt (база данных последовательностей белков и аннотаций) и Protein Data Bank (третичные данные о белках и нуклеиновых кислотах). структура базы данных). Предоставляются различные онлайн-сервисы и инструменты, такие как инструмент поиска базового локального выравнивания (BLAST) или инструмент выравнивания последовательностей Clustal Omega, позволяющий осуществлять дальнейший анализ данных.
ВЗРЫВ [ править ]
ВЗРЫВ [5] — алгоритм сравнения первичной структуры биомакромолекулы, чаще всего нуклеотидной последовательности ДНК/РНК и аминокислотной последовательности белков, хранящихся в биоинформационных базах данных, с запрашиваемой последовательностью. Алгоритм использует оценку доступных последовательностей по запросу с помощью матрицы оценок, такой как BLOSUM 62 . Последовательности с наивысшей оценкой представляют собой ближайших родственников запроса с точки зрения функционального и эволюционного сходства. [6]
Поиск в базе данных с помощью BLAST требует, чтобы входные данные были в правильном формате (например, в формате FASTA , GenBank, PIR или EMBL). Пользователи также могут указать конкретные базы данных для поиска, выбрать используемые оценочные матрицы и другие параметры перед запуском инструмента. Лучшие совпадения в результатах BLAST упорядочены в соответствии с их рассчитанным значением E (вероятность случайного присутствия в базе данных совпадения с аналогичным или более высоким рейтингом). [7]
Кластал Омега [ править ]
Кластал Омега [8] представляет собой инструмент множественного выравнивания последовательностей (MSA), который позволяет найти оптимальное выравнивание минимум трех и максимум 4000 входных последовательностей ДНК и белков. [9] Алгоритм Clustal Omega использует две профильные модели скрытой Маркова (HMM) для окончательного выравнивания последовательностей. Выходные данные Clustal Omega можно визуализировать в виде направляющего дерева (филогенетические отношения последовательностей наилучшего спаривания) или упорядочить по взаимному сходству последовательностей между запросами. [10] Главным преимуществом Clustal Omega перед другими инструментами MSA (Muscle, ProbCons ) является его эффективность при сохранении значительной точности результатов.
Ансамбль [ править ]
Ансамбль основан на базе EMBL-EBI. [11] — это база данных, организованная на основе геномных данных, поддерживаемая проектом Ensembl . Ensembl , которому поручено непрерывное аннотирование геномов модельных организмов , предоставляет исследователям комплексный ресурс соответствующей биологической информации о каждом конкретном геноме. Аннотация сохраненных эталонных геномов осуществляется автоматически и на основе последовательностей. Ensembl включает в себя общедоступную базу данных геномов, доступ к которой можно получить через веб-браузер. С сохраненными данными можно взаимодействовать с помощью графического пользовательского интерфейса, который поддерживает отображение данных с несколькими уровнями разрешения: от кариотипа через отдельные гены до нуклеотидной последовательности. [12]
Первоначально основной областью интересов были позвоночные животные, но с 2009 года Ensembl предоставляет аннотированные данные о геномах растений, грибов, беспозвоночных, бактерий и других видов в дочернем проекте Ensembl Genomes . По состоянию на 2020 год [update] В различных базах данных проекта Ensembl содержится более 50 000 эталонных геномов. [13]
ПДБ [ править ]
ПДБ [14] представляет собой базу данных трехмерных структур биологических макромолекул, таких как белки и нуклеиновые кислоты. Данные обычно получаются с помощью рентгеновской кристаллографии или ЯМР-спектроскопии и передаются вручную структурными биологами со всего мира через организации-члены PDB — PDBe , RCSB, PDBj и BMRB. Доступ к базе данных можно получить через веб-страницы ее участников, включая PDBe (размещенный в EMBL-EBI). Являясь членом консорциума wwPDB , PDBe помогает в совместной работе по архивированию и поддержанию данных о структуре макромолекул. [15]
ЮниПрот [ править ]
UniProt — это онлайн-хранилище данных о последовательностях белков и аннотаций, распределенных в базах данных UniProt Knowledgebase (UniProt KB), UniProt Reference Clusters (UniRef) и UniProt Archive (UniParc). Первоначально задуманные как отдельные предприятия EMBL-EBI, Швейцарского института биоинформатики (SIB) (совместно поддерживающие Swiss-Prot и TrEMBL) и Protein Information Resource (PIR) (в котором размещена база данных белковых последовательностей), рост глобального сбора данных о белках привел к за их сотрудничество в создании UniProt в 2002 году. [16]
Записи о белках, хранящиеся в UniProt, каталогизируются по уникальному идентификатору UniProt. Данные аннотаций, собранные для каждой записи, организованы в логические разделы (например, функция белка, структура, экспрессия, последовательность или соответствующие публикации), что позволяет получить скоординированный обзор интересующего белка. Также предоставляются ссылки на внешние базы данных и оригинальные источники данных. Помимо стандартного поиска по названию/идентификатору белка, на веб-странице UniProt размещены инструменты для поиска BLAST, выравнивания последовательностей или поиска белков, содержащих определенные пептиды. [17]
Другие биоинформатические организации
- Национальный центр биотехнологической информации (NCBI), Национальная медицинская библиотека США
- Национальный институт генетики ( Банк данных ДНК Японии )
- Швейцарский институт биоинформатики (SIB: Expasy )
- Ресурс Австралии по биоинформатике
- BIG Data Center (Национальный центр геномных данных), Пекинский институт геномики , Китайская академия наук

См. также [ править ]
- База данных альтернативного сплайсинга и разнообразия транскриптов
- Биообразцы
- Европейская организация молекулярной биологии
- Европейский архив нуклеотидов
Ссылки [ править ]
- ^ «Справочная информация | Европейский институт биоинформатики» . Ebi.ac.uk. 16 мая 2018 года . Проверено 29 октября 2019 г.
- ^ «Работа в EMBL-EBI» . Проверено 20 июня 2016 г.
- ^ «Научный отчет» (PDF) . www.embl.de. 2017 . Проверено 29 октября 2019 г.
- ^ БОЛЬШОЙ центр данных, Пекинский институт геномики, Китайская академия наук. (2018). Годовой отчет , с. 6. Проверено 26 марта 2020 г.
- ^ «ВЗРЫВ NCBI в EMBL-EBI» . www.ebi.ac.uk. Проверено 3 ноября 2021 г.
- ^ Альтшул С.Ф., Гиш В., Миллер В., Майерс Э.В., Липман DJ (октябрь 1990 г.). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. дои : 10.1016/S0022-2836(05)80360-2 . ПМИД 2231712 . S2CID 14441902 .
- ^ Уиллер Д., Бхагват М. (2007). ВЗРЫВ Быстрый старт . Методы молекулярной биологии. Том. 395. Хумана Пресс. стр. 149–176. ПМЦ 4780883 . ПМИД 17993672 .
- ^ «Кластал Омега в EMBL-EBI» . ebi.ac.uk. Проверено 3 ноября 2021 г.
- ^ «Документация Clustal Omega в EMBL-EBI» . ebi.ac.uk. Проверено 3 ноября 2021 г.
- ^ Сиверс Ф., Хиггинс Д.Г. (январь 2018 г.). «Clustal Omega для точного выравнивания многих белковых последовательностей» . Белковая наука . 27 (1): 135–145. дои : 10.1002/pro.3290 . ПМЦ 5734385 . ПМИД 28884485 .
- ^ «Домашняя страница ансамбля» . ensembl.org . Проверено 3 ноября 2021 г.
- ^ Хоу К.Л., Ачутан П., Аллен Дж., Аллен Дж., Альварес-Харрета Дж., Амоде М.Р. и др. (январь 2021 г.). «Ансамбль 2021» . Исследования нуклеиновых кислот . 49 (Д1): Д884–Д891. дои : 10.1093/nar/gkaa942 . ПМЦ 7778975 . ПМИД 33137190 .
- ^ «О проекте Ансамбль» . ensembl.org . Проверено 3 ноября 2021 г.
- ^ Берли, Стивен К.; и др. (январь 2019 г.). «Банк данных белков: единый глобальный архив трехмерных данных о структуре макромолекул» . Исследования нуклеиновых кислот . 47 (Д1): Д520–Д528. дои : 10.1093/nar/gky949 . ПМК 6324056 . ПМИД 30357364 .
- ^ «О ПДБе» . ebi.ac.uk. Проверено 3 ноября 2021 г.
- ^ «О ЮниПроте» . uniprot.org . Проверено 3 ноября 2021 г.
- ^ Бейтман, Алекс; и др. (январь 2021 г.). «UniProt: универсальная база знаний о белках в 2021 году» . Исследования нуклеиновых кислот . 49 (Д1): Д480–Д489. дои : 10.1093/nar/gkaa1100 . ПМЦ 7778908 . ПМИД 33237286 .
- Биоинформатические организации
- Биологические научно-исследовательские институты в Соединенном Королевстве
- Здания и сооружения в округе Южный Кембриджшир
- Хинкстон
- Организации информационных технологий, базирующиеся в Европе
- Международные исследовательские институты
- Институты молекулярной биологии
- Учреждения-партнеры Кембриджского университета
- Научно-исследовательские институты, основанные в 1992 году.
- Исследовательские институты в Кембриджшире
- Наука и технологии в Европе
- Институты системных наук
- 1992 заведения в Англии