Jump to content

Европейский институт биоинформатики

Европейский институт биоинформатики (EBI)
Аббревиатура ЭМБЛ-ЭБИ
Формирование 1992 [ 1 ]
Расположение
Координаты 52.079889, 0.186356
Директор
Юэн Бирни [ 2 ]
Заместитель директора
Рольф Апвейлер [ 2 ]
Головная организация
Европейская лаборатория молекулярной биологии
Персонал
685 [ 3 ]
Веб-сайт www .семья .uk

Европейский институт биоинформатики ( EMBL-EBI ) — межправительственная организация (IGO), которая, как часть Европейской лаборатории молекулярной биологии (EMBL), занимается исследованиями и услугами в области биоинформатики . Он расположен на территории кампуса Wellcome Genome в Хинкстоне , недалеко от Кембриджа , и в нем работает более 600 сотрудников, работающих полный рабочий день (FTE). [ 4 ]

Кроме того, EMBL-EBI проводит учебные программы, которые обучают ученых основам работы с биологическими данными и продвигают множество биоинформатических инструментов, доступных для их исследований, как на основе EMBL-EBI, так и не на основе EMBL-EBI.

Биоинформатические услуги

[ редактировать ]

Одной из ролей EMBL-EBI является индексирование и хранение биологических данных в наборе баз данных, включая Ensembl (хранит данные о последовательностях всего генома), UniProt (база данных последовательностей белков и аннотаций) и Protein Data Bank (третичные данные о белках и нуклеиновых кислотах). структура базы данных). Предоставляются различные онлайн-сервисы и инструменты, такие как инструмент поиска базового локального выравнивания (BLAST) или инструмент выравнивания последовательностей Clustal Omega, позволяющий осуществлять дальнейший анализ данных.

ВЗРЫВ [ 5 ] — алгоритм сравнения первичной структуры биомакромолекулы, чаще всего нуклеотидной последовательности ДНК/РНК и аминокислотной последовательности белков, хранящихся в биоинформационных базах данных, с запрашиваемой последовательностью. Алгоритм использует оценку доступных последовательностей по запросу с помощью матрицы оценок, такой как BLOSUM 62 . Последовательности с наивысшей оценкой представляют собой ближайших родственников запроса с точки зрения функционального и эволюционного сходства. [ 6 ]

Поиск в базе данных с помощью BLAST требует, чтобы входные данные были в правильном формате (например, в формате FASTA , GenBank, PIR или EMBL). Пользователи также могут указать конкретные базы данных для поиска, выбрать используемые оценочные матрицы и другие параметры перед запуском инструмента. Лучшие совпадения в результатах BLAST упорядочены в соответствии с их рассчитанным значением E (вероятность случайного присутствия в базе данных совпадения с аналогичным или более высоким рейтингом). [ 7 ]

Кластал Омега

[ редактировать ]

Кластал Омега [ 8 ] представляет собой инструмент множественного выравнивания последовательностей (MSA), который позволяет найти оптимальное выравнивание минимум трех и максимум 4000 входных последовательностей ДНК и белков. [ 9 ] Алгоритм Clustal Omega использует две профильные модели скрытой Маркова (HMM) для окончательного выравнивания последовательностей. Выходные данные Clustal Omega можно визуализировать в виде направляющего дерева (филогенетические отношения последовательностей наилучшего спаривания) или упорядочить по взаимному сходству последовательностей между запросами. [ 10 ] Главным преимуществом Clustal Omega перед другими инструментами MSA (Muscle, ProbCons ) является его эффективность при сохранении значительной точности результатов.

Ансамбль основан на базе EMBL-EBI. [ 11 ] — это база данных, организованная на основе геномных данных, поддерживаемая проектом Ensembl . Ensembl , которому поручено непрерывное аннотирование геномов модельных организмов , предоставляет исследователям комплексный ресурс соответствующей биологической информации о каждом конкретном геноме. Аннотация сохраненных эталонных геномов осуществляется автоматически и на основе последовательностей. Ensembl включает в себя общедоступную базу данных геномов, доступ к которой можно получить через веб-браузер. С сохраненными данными можно взаимодействовать с помощью графического пользовательского интерфейса, который поддерживает отображение данных с несколькими уровнями разрешения: от кариотипа через отдельные гены до нуклеотидной последовательности. [ 12 ]

Первоначально основной областью интересов были позвоночные животные, но с 2009 года Ensembl предоставляет аннотированные данные о геномах растений, грибов, беспозвоночных, бактерий и других видов в дочернем проекте Ensembl Genomes . По состоянию на 2020 год В различных базах данных проекта Ensembl содержится более 50 000 эталонных геномов. [ 13 ]

ПДБ [ 14 ] представляет собой базу данных трехмерных структур биологических макромолекул, таких как белки и нуклеиновые кислоты. Данные обычно получают с помощью рентгеновской кристаллографии или ЯМР-спектроскопии и передаются вручную структурными биологами со всего мира через организации-члены PDB — PDBe , RCSB, PDBj и BMRB. Доступ к базе данных можно получить через веб-страницы ее участников, включая PDBe (размещенный в EMBL-EBI). Являясь членом консорциума wwPDB , PDBe помогает в совместной работе по архивированию и поддержанию данных о структуре макромолекул. [ 15 ]

UniProt — это онлайн-хранилище данных о последовательностях белков и аннотаций, распространенных в базах данных UniProt Knowledge Base (UniProt KB), UniProt Reference Clusters (UniRef) и UniProt Archive (UniParc). Первоначально задуманные как отдельные предприятия EMBL-EBI, Швейцарского института биоинформатики (SIB) (совместно поддерживающие Swiss-Prot и TrEMBL) и Protein Information Resource (PIR) (в котором размещена база данных белковых последовательностей), рост глобального сбора данных о белках привел к за их сотрудничество в создании UniProt в 2002 году. [ 16 ]

Записи о белках, хранящиеся в UniProt, каталогизируются по уникальному идентификатору UniProt. Данные аннотаций, собранные для каждой записи, организованы в логические разделы (например, функция белка, структура, экспрессия, последовательность или соответствующие публикации), что позволяет получить скоординированный обзор интересующего белка. Также предоставляются ссылки на внешние базы данных и оригинальные источники данных. Помимо стандартного поиска по названию/идентификатору белка, на веб-странице UniProt размещены инструменты для поиска BLAST, выравнивания последовательностей или поиска белков, содержащих определенные пептиды. [ 17 ]

АльфаФолд БД

[ редактировать ]

База данных структур белков AlphaFold (AlphaFold DB) — это совместный проект с Google DeepMind, целью которого является сделать предсказанные структуры белков из системы искусственного интеллекта AlphaFold бесплатными для научного сообщества. [ 18 ] Первый выпуск базы данных состоялся в 2021 году; по состоянию на 2024 год AlphaFold DB обеспечивает доступ к более чем 214 миллионам белковых структур. [ 19 ]

Другие биоинформатические организации

[ редактировать ]
Европейский институт биоинформатики, Хинкстон, Кембридж, Великобритания

См. также

[ редактировать ]
  1. ^ «Справочная информация | Европейский институт биоинформатики» . Ebi.ac.uk. 16 мая 2018 года . Проверено 29 октября 2019 г.
  2. ^ Jump up to: а б «Лидерство» . www.ebi.ac.uk. ​Проверено 21 августа 2024 г.
  3. ^ «Основные события EMBL-EBI 2023» (PDF) (пресс-релиз). ЭМБЛ-ЭБИ. 8 апреля 2024 г. с. 4.
  4. ^ «Научный отчет» (PDF) . www.embl.de. ​2017 . Проверено 29 октября 2019 г.
  5. ^ «ВЗРЫВ NCBI в EMBL-EBI» . www.ebi.ac.uk. ​Проверено 3 ноября 2021 г.
  6. ^ Альтшул С.Ф., Гиш В., Миллер В., Майерс Э.В., Липман DJ (октябрь 1990 г.). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. дои : 10.1016/S0022-2836(05)80360-2 . ПМИД   2231712 . S2CID   14441902 .
  7. ^ Уиллер Д., Бхагват М. (2007). ВЗРЫВ Быстрый старт . Методы молекулярной биологии. Том. 395. Хумана Пресс. стр. 149–176. ПМЦ   4780883 . ПМИД   17993672 .
  8. ^ «Кластал Омега в EMBL-EBI» . ebi.ac.uk. ​Проверено 3 ноября 2021 г.
  9. ^ «Документация Clustal Omega в EMBL-EBI» . ebi.ac.uk. ​Проверено 3 ноября 2021 г.
  10. ^ Сиверс Ф., Хиггинс Д.Г. (январь 2018 г.). «Clustal Omega для точного выравнивания многих белковых последовательностей» . Белковая наука . 27 (1): 135–145. дои : 10.1002/pro.3290 . ПМЦ   5734385 . ПМИД   28884485 .
  11. ^ «Домашняя страница ансамбля» . ensembl.org . Проверено 3 ноября 2021 г.
  12. ^ Хоу К.Л., Ачутан П., Аллен Дж., Аллен Дж., Альварес-Харрета Дж., Амод М.Р. и др. (январь 2021 г.). «Ансамбль 2021» . Исследования нуклеиновых кислот . 49 (Д1): Д884–Д891. дои : 10.1093/nar/gkaa942 . ПМЦ   7778975 . ПМИД   33137190 .
  13. ^ «О проекте Ансамбль» . ensembl.org . Проверено 3 ноября 2021 г.
  14. ^ Берли, Стивен К.; и др. (январь 2019 г.). «Банк данных белков: единый глобальный архив трехмерных данных о структуре макромолекул» . Исследования нуклеиновых кислот . 47 (Д1): Д520–Д528. дои : 10.1093/nar/gky949 . ПМК   6324056 . ПМИД   30357364 .
  15. ^ «О ПДБе» . ebi.ac.uk. ​Проверено 3 ноября 2021 г.
  16. ^ «О ЮниПроте» . uniprot.org . Проверено 3 ноября 2021 г.
  17. ^ Бейтман, Алекс; и др. (январь 2021 г.). «UniProt: универсальная база знаний о белках в 2021 году» . Исследования нуклеиновых кислот . 49 (Д1): Д480–Д489. дои : 10.1093/nar/gkaa1100 . ПМЦ   7778908 . ПМИД   33237286 .
  18. ^ «База данных структуры белков AlphaFold» . Alphafold.ebi.ac.uk . Проверено 22 августа 2024 г.
  19. ^ Варади, Михай; Бертони, Дамиан; Магана, Полина; Парамвал, Урмила; Пидручная, Иванна; Радхакришнан, Маларвижи; Ценков Максим; Наир, Шринат; Мирдита, Милот; Йо, Джинги; Ковалевский Олег; Туньясувунакул, Кэтрин; Лидон, Агата; Жидек, Августин; Томлинсон, Хэмиш; Харихаран, Дхаванти; Абрахамсон, Джош; Грин, Тим; Джампер, Джон; Бирни, Юэн; Штайнеггер, Мартин; Хассабис, Демис; Веланкар, Самир (5 января 2024 г.). «База данных о структуре белков AlphaFold в 2024 году: обеспечивает структурный охват более 214 миллионов белковых последовательностей» . Исследования нуклеиновых кислот . 52 (Д1): Д368–Д375. дои : 10.1093/nar/gkad1011 . ПМЦ   10767828 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 12a48a19821a4405401797b79001566e__1724631840
URL1:https://arc.ask3.ru/arc/aa/12/6e/12a48a19821a4405401797b79001566e.html
Заголовок, (Title) документа по адресу, URL1:
European Bioinformatics Institute - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)