Национальный центр биотехнологической информации
Аббревиатура | NCBI |
---|---|
Основан | 1988 год |
Штаб-квартира | Бетесда , Мэриленд |
Расположение | |
Координаты | 38 ° 59'45 "N 77 ° 05'56" W / 38,9959 ° N 77,0989 ° W |
Официальный язык | Английский |
Директор | Стивен Шерри (с 26 сентября 2022 г.) |
Головная организация | Национальная медицинская библиотека США |
Принадлежности | Национальные институты здравоохранения |
Веб-сайт | ncbi.nlm.nih.gov |
Национальный центр биотехнологической информации ( NCBI ) [1] [2] является частью Национальной медицинской библиотеки США (NLM), филиала Национальных институтов здравоохранения (NIH). Он одобрен и финансируется правительством Соединенных Штатов . NCBI расположен в Бетесде, штат Мэриленд , и был основан в 1988 году в соответствии с законодательством, спонсируемым конгрессменом США Клодом Пеппером .
В NCBI хранится ряд баз данных, имеющих отношение к биотехнологии и биомедицине , и он является важным ресурсом для инструментов и услуг биоинформатики. Основные базы данных включают GenBank для последовательностей ДНК и PubMed , библиографическую базу данных биомедицинской литературы. Другие базы данных включают базу данных NCBI Epigenomics . Все эти базы данных доступны в Интернете через поисковую систему Entrez . Режиссером NCBI выступил Дэвид Липман . [2] один из первых авторов BLAST программы выравнивания последовательностей [3] и широко уважаемый деятель в области биоинформатики .
ГенБанк
[ редактировать ]NCBI отвечал за предоставление доступа к ДНК базе данных последовательностей GenBank с 1992 года. [4] GenBank координирует свои действия с отдельными лабораториями и другими базами данных последовательностей, например, Европейской лабораторией молекулярной биологии (EMBL) и Банком данных ДНК Японии (DDBJ). [4]
С 1992 года NCBI расширилась и теперь предоставляет другие базы данных в дополнение к GenBank. NCBI предоставляет базу данных генов, онлайн-менделевское наследование у человека , базу данных молекулярного моделирования (3D-структуры белков), dbSNP (базу данных однонуклеотидных полиморфизмов ), коллекцию эталонных последовательностей, карту генома человека и браузер таксономии . и координирует работу с Национальным институтом рака для реализации проекта анатомии генома рака. NCBI присваивает уникальный идентификатор (идентификатор таксономии) каждому виду организма. [5]
У NCBI есть программные инструменты, доступные через интернет-браузеры или по FTP . Например, BLAST — это программа поиска сходства последовательностей. BLAST может выполнять сравнение последовательностей с базой данных ДНК GenBank менее чем за 15 секунд.
Книжная полка NCBI
[ редактировать ]Книжная полка NCBI [6] представляет собой коллекцию свободно доступных для скачивания онлайн-версий избранных биомедицинских книг. Книжная полка охватывает широкий спектр тем, включая молекулярную биологию , биохимию , клеточную биологию , генетику , микробиологию , болезненные состояния с молекулярной и клеточной точки зрения, методы исследования и вирусологию . Некоторые из книг представляют собой онлайн-версии ранее опубликованных книг, а другие, такие как Coffee Break , написаны и отредактированы сотрудниками NCBI. Книжная полка является дополнением к Entrez PubMed репозиторию рефератов рецензируемых публикаций , поскольку содержимое книжной полки обеспечивает устоявшиеся взгляды на развивающиеся области исследований и контекст, в котором могут быть организованы многие разрозненные отдельные части опубликованных исследований. [ нужна ссылка ]
Базовый инструмент поиска локального выравнивания (BLAST)
[ редактировать ]BLAST — это алгоритм, используемый для расчета сходства последовательностей между биологическими последовательностями, такими как нуклеотидные последовательности ДНК и аминокислотные последовательности белков. [7] BLAST — мощный инструмент для поиска последовательностей, похожих на последовательность запроса, внутри одного и того же организма или в разных организмах. Он выполняет поиск последовательности запросов в базах данных и серверах NCBI и отправляет результаты обратно в браузер человека в выбранном формате. Входные последовательности в BLAST в основном имеют формат FASTA или GenBank, тогда как выходные данные могут быть доставлены в различных форматах, таких как HTML, форматирование XML и простой текст. HTML является форматом вывода по умолчанию для веб-страницы NCBI. Результаты для NCBI-BLAST представлены в графическом формате со всеми найденными совпадениями, таблицей с идентификаторами последовательностей для совпадений, имеющих данные, связанные с оценкой, а также выравниванием интересующей последовательности и полученных совпадений с аналогичными оценками BLAST для них. [8]
Входить
[ редактировать ]Система Entrez Global Query используется в NCBI для всех основных баз данных, таких как нуклеотидные и белковые последовательности, белковые структуры, PubMed, Taxonomy, Complete Genomes, OMIM и некоторых других. межбазового поиска [9] Entrez — это система индексирования и поиска данных из различных источников для биомедицинских исследований. NCBI распространил первую версию Entrez в 1991 году, состоящую из нуклеотидных последовательностей из PDB и GenBank , белковых последовательностей из SWISS-PROT, транслированных GenBank, PIR, PRF, PDB, а также связанных с ними рефератов и цитат из PubMed. Entrez специально разработан для интеграции данных из нескольких различных источников, баз данных и форматов в единую информационную модель и систему поиска, которая может эффективно извлекать соответствующие ссылки, последовательности и структуры. [10]
Ген
[ редактировать ]Ген был реализован в NCBI для характеристики и организации информации о генах. Он служит основным узлом в связке геномной карты, экспрессии, последовательности, функции белка, структуры и данных о гомологии. Каждой записи гена присваивается уникальный GeneID, который можно отслеживать в циклах пересмотра. Генные записи для известных или предсказанных генов устанавливаются здесь и разграничиваются положениями на карте или нуклеотидными последовательностями. Gene имеет несколько преимуществ перед своим предшественником LocusLink, в том числе лучшую интеграцию с другими базами данных в NCBI, более широкую таксономическую область применения и расширенные возможности запроса и поиска, предоставляемые системой Entrez. [11]
Белок
[ редактировать ]В базе данных белков хранятся текстовые записи для отдельных последовательностей белков, полученные из множества различных ресурсов, таких как проект NCBI Reference Sequence (RefSeq), GenBank, PDB и UniProtKB/SWISS-Prot. Записи о белках представлены в различных форматах, включая FASTA и XML , и связаны с другими ресурсами NCBI. Белок предоставляет пользователям соответствующие данные, такие как гены, последовательности ДНК/РНК, биологические пути, данные об экспрессии и вариациях, а также литературу. Он также предоставляет заранее определенные наборы похожих и идентичных белков для каждой последовательности, рассчитанные с помощью BLAST. База данных структур NCBI содержит наборы трехмерных координат для экспериментально определенных структур в PDB, которые импортируются NCBI.База данных консервативных доменов ( CDD ) белков содержит профили последовательностей, которые характеризуют высококонсервативные домены в последовательностях белков. Он также имеет записи из внешних ресурсов, таких как SMART и Pfam .Существует еще одна база данных белков, известная как база данных белковых кластеров, которая содержит наборы последовательностей белков, сгруппированных в соответствии с максимальным выравниванием между отдельными последовательностями, рассчитанным с помощью BLAST. [12]
База данных Пабхем
[ редактировать ]База данных PubChem NCBI — это общедоступный ресурс по молекулам и их активности в отношении биологических анализов. PubChem доступен для поиска и доступен через информационно-поисковую систему Entrez . [13]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Проект генома человека» . Нью-Йорк Таймс .
- ^ Jump up to: а б «Научно-исследовательский институт публикует генные данные в Интернете» . Нью-Йорк Таймс . 26 июня 1997 г.
- ^ «Смысл последовательностей: Стивен Ф. Альтшул об улучшении BLAST» . 2000. Архивировано из оригинала 7 октября 2007 года.
- ^ Jump up to: а б Мизрахи, Илен (22 августа 2007 г.). «GenBank: База данных нуклеотидных последовательностей» . Справочник NCBI . Национальный центр биотехнологической информации (США). Архивировано из оригинала 18 мая 2023 года.
- ^ «Главная — Таксономия» . НКБИ . Архивировано из оригинала 16 февраля 2024 года.
- ^ «Дом - Книги» . НКБИ . Проверено 12 июня 2019 г.
- ^ Альтшул Стивен; Гиш Уоррен; Миллер Уэбб; Майерс Юджин; Липман Дэвид (1990). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. дои : 10.1016/s0022-2836(05)80360-2 . ПМИД 2231712 . S2CID 14441902 .
- ^ Мэдден, Т. (2013). «Инструмент анализа последовательности BLAST». Справочник NCBI (2-е изд.). Бетесда, Мэриленд: Национальный центр биотехнологической информации .
- ^ Координаторы ресурсов NCBI (2012). «Ресурсы базы данных Национального центра биотехнологической информации». Исследования нуклеиновых кислот 41 (выпуск базы данных): D8–D20.
- ^ Остелл Дж. (2002). Справочник NCBI, 2-е издание, глава 15, Поисково-поисковая система Entrez
- ^ Маглотт Д. , Прюитт К. и Татусова Т. (2005). Справочник NCBI, 2-е издание, глава 19, Ген: Справочник генов.
- ^ Сэйерс Э. (2013). Справочник NCBI, 2-е издание, Белковые ресурсы NCBI
- ^ Ван Ю. и Брайант С.Х. (2014). Справочник NCBI, 2-е издание, База данных биоанализов NCBI PubChem.
Внешние ссылки
[ редактировать ]- Официальный сайт
- Официальный сайт Национальной медицинской библиотеки]
- Официальный сайт Национальных институтов здравоохранения