ПабХим
Эта статья нуждается в дополнительных цитатах для проверки . ( январь 2009 г. ) |
![]() | |
Содержание | |
---|---|
Описание | Химические вещества и их биоанализы |
Организмы | Люди и другие животные |
Контакт | |
Исследовательский центр | NCBI |
Первичное цитирование | ПМИД 15879180 |
Доступ | |
Веб-сайт | пабхим |
URL-адрес загрузки | FTP |
веб-службы URL-адрес | PUG-View [1] |
Разнообразный | |
Лицензия | Общественное достояние |
PubChem — это данных база химических молекул и их активности в биологических анализах . Система поддерживается Национальным центром биотехнологической информации (NCBI), компонентом Национальной медицинской библиотеки , входящей в состав Национальных институтов здравоохранения США (NIH). Доступ к PubChem можно получить бесплатно через веб-интерфейс пользователя . Миллионы составных структур и наборов описательных данных можно бесплатно загрузить через FTP . PubChem содержит описания нескольких веществ и небольших молекул, содержащих менее 100 атомов и 1000 связей. Более 80 поставщиков баз данных вносят свой вклад в растущую базу данных PubChem. [2]
История
[ редактировать ]PubChem был выпущен в 2004 году как компонент Программы молекулярных библиотек (MLP) Национального института здравоохранения. По состоянию на ноябрь 2015 года PubChem содержит более 150 миллионов описаний веществ, предоставленных депозиторами, 60 миллионов уникальных химических структур и 225 миллионов результатов испытаний на биологическую активность (из более чем 1 миллиона аналитических экспериментов, проведенных на более чем 2 миллионах малых молекул, охватывающих почти 10 000 уникальных целевые последовательности белков, которые соответствуют более чем 5000 генам). Он также содержит анализы скрининга РНК-интерференции (RNAi), нацеленные на более чем 15 000 генов. [3]
По состоянию на август 2018 года PubChem содержит 247,3 миллиона описаний веществ и 96,5 миллиона уникальных химических структур, предоставленных 629 источниками данных из 40 стран. Он также содержит 237 миллионов результатов тестов на биологическую активность из 1,25 миллиона биологических анализов, охватывающих> 10 000 последовательностей целевых белков. [4]
По состоянию на 2020 год, благодаря интеграции данных из более чем 100 новых источников, PubChem содержит более 293 миллионов описаний веществ, предоставленных депозиторами, 111 миллионов уникальных химических структур и 271 миллион точек данных о биологической активности из 1,2 миллиона экспериментов по биологическим анализам. [5]
Базы данных
[ редактировать ]PubChem состоит из трех динамически растущих основных баз данных. По состоянию на 5 ноября 2020 г. (количество биоанализов не изменилось):
- Соединения, 111 миллионов записей [5] (по сравнению с 94 миллионами записей в 2017 году) [4] ), содержит чистые и охарактеризованные химические соединения. [6]
- Вещества, 293 миллиона записей [5] (по сравнению с 236 миллионами записей в 2017 году) [7] и 163 миллиона в сентябре 2014 г. [8] ), содержит также смеси, экстракты , комплексы и неохарактеризованные вещества.
- BioAssay, результаты биоактивности 1,25 миллиона [9] (по сравнению с 6000 в сентябре 2014 г.) [10] ) высокопроизводительные программы скрининга с несколькими миллионами значений.
Идет поиск
[ редактировать ]Поиск в базах данных возможен по широкому спектру свойств, включая химическую структуру, фрагменты названий, химическую формулу , молекулярную массу , XLogP , а также водородных связей количество доноров и акцепторов .
PubChem содержит собственный онлайн- редактор молекул с поддержкой SMILES /SMARTS и InChI , который позволяет импортировать и экспортировать все распространенные форматы химических файлов для поиска структур и фрагментов.
Каждое попадание предоставляет информацию о синонимах, химических свойствах, химической структуре, включая строки SMILES и InChI, биологической активности, а также ссылки на структурно родственные соединения и другие базы данных NCBI, такие как PubMed .
В форме текстового поиска поля базы данных можно искать, добавив к искомому слову имя поля в квадратных скобках. Числовой диапазон представлен двумя числами, разделенными двоеточием. Условия поиска и имена полей не чувствительны к регистру. круглые скобки и логические операторы Можно использовать И, ИЛИ и НЕ. И предполагается, если оператор не используется.
Пример ( Правило пяти Липински ):
0:500[mw] 0:5[hbdc] 0:10[hbac] -5:5[logp]
Поля базы данных
[ редактировать ]Идентификационные номера | ||
• | Идентификационный номер в текущей базе данных | [UID] |
• | Идентификационный номер вещества | [СИД] |
• | Идентификационный номер соединения | [ИД] |
• | Идентификационный номер биоанализа | [БАИД], [ПОМОЩЬ] |
Общий | ||
• | Любое поле базы данных | [ВСЕ] |
• | Комментарий | [СМТ] |
• | Дата депонирования | [ДДАТ], [ДЕПДАТ] |
• | Внешний идентификатор вкладчика | [SRID], [SRCID] |
• | Название источника | [SRC], [SRCNAM], [SRCNAME] |
• | Дата выхода исходника | [СРД], [СРДАТ], [РЛСДАТ] |
• | Термин «Медицинская предметная рубрика» (MeSH) | [МЭСТ], [МЭСТ] |
• | Узел дерева MeSH | [МШН], [МЕШТН] |
• | Фармакологическое действие MeSH | [Фармацевтика], [Фармацевтика] |
Свойства вещества | ||
• | Синонимы веществ | [SYNO] |
• | Название ИЮПАК | [ЮПАК], [ИЮПАК] |
• | Международный химический идентификатор (InChI) | [ДЮЙМЫ] |
• | Молекулярный вес | [МВт], [МВТ], [МОЛВТ] |
• | Химические элементы | [ЭЛМТ], [ЭЛ] |
• | Неводородные атомы | [ХАК], [ХАКНТ] |
• | изотопов Количество | [МАК], [ИАКНТ] |
• | Общая сумма официальных расходов | [TFC], [CHG], [CHRG] |
• | хиральных атомов Количество | [АКК], [АККНТ] |
• | Определенное количество киральных атомов | [ACDC], [ACDCNT] |
• | Неопределенное количество хиральных атомов | [ACUC], [ACUCNT] |
• | водородной связи Количество акцепторов | [HBAC], [HBACNT] |
• | Количество доноров водородных связей | [HBDC], [HBDCNT] |
• | таутомеров Количество | [TC], [TCNT], [TTMC] |
• | Вращающееся количество облигаций | [РБК], [РБКНТ] |
• | XLogP [11] | [XLGP], [LOGP] |
Свойства соединения | ||
• | Сложные синонимы | [CSYN], [CSYNO] |
• | Количество компонентов | [КК], [ККНТ] |
• | Количество ковалентных единиц (молекул) | [CUC], [CUCNT] |
• | Общее количество биоактивности | [ТАС] |
См. также
[ редактировать ]- Химическая база данных
- CAS Common Chemistry - проводится Американским химическим обществом.
- База данных сравнительной токсикогеномики - находится в ведении Университета штата Северная Каролина.
- ChEMBL - под управлением Европейского института биоинформатики.
- ChemSpider - под управлением Королевского химического общества Великобритании.
- DrugBank - находится в ведении Университета Альберты.
- ИЮПАК - находится под управлением Швейцарского Международного союза теоретической и прикладной химии (ИЮПАК).
- Moltable - находится в ведении Национальной химической лаборатории Индии.
- PubChem - находится в ведении Национального института здравоохранения США.
- BindingDB — находится в ведении Калифорнийского университета в Сан-Диего.
- SCRIPDB - находится в ведении Университета Торонто, Канада.
- Национальный центр биотехнологической информации (NCBI) - находится в ведении Национального института здравоохранения США.
- Энтрез - находится в ведении Национального института здравоохранения США.
- GenBank - находится в ведении Национального института здравоохранения США.
Ссылки
[ редактировать ]- ^ Ким, Сонхван; Тиссен, Пол А.; Ченг, Теджун; Чжан, Цзянь; Гиндулит, Аста; Болтон, Эван Э. (9 августа 2019 г.). «PUG-View: программный доступ к химическим аннотациям, интегрированным в PubChem» . Журнал хеминформатики . 11 (1): 56. дои : 10.1186/s13321-019-0375-2 . ПМК 6688265 . ПМИД 31399858 .
- ^ «Исходная информация PubChem» . Проект ПабХим . США: Национальный центр биотехнологической информации.
- ^ Ким, Сонхван; Тиссен, Пол А.; Ченг, Теджун; Ю, Бо; Шумейкер, Бенджамин А.; Ван, Цзияо; Болтон, Эван Э.; Ван, Янли; Брайант, Стивен Х. (2016). «Литературная информация в PubChem: связи между записями PubChem и научными статьями» . Журнал хеминформатики . 8 : Статья 32. doi : 10.1186/s13321-016-0142-6 . ПМЦ 4901473 . ПМИД 27293485 .
- ^ Перейти обратно: а б «Результаты поиска по всем соединениям» . Проверено 28 января 2016 г.
- ^ Перейти обратно: а б с Ким, Сонхван; Чен, Цзе; Ченг, Теджун; Разбавленный, Аста; Он, Цзя; Он, Сикиан; Ли, Цинлян; Шумейкер, Бенджамин А; Тиссен, Пол А; Ю, Бо; Заславский, Леонид; Чжан, Цзянь; Болтон, Эван Э (8 января 2021 г.). «PubChem в 2021 году: новый контент данных и улучшенные веб-интерфейсы» . Исследования нуклеиновых кислот . 49 (Д1): Д1388–Д1395. дои : 10.1093/nar/gkaa971 . ПМЦ 7778930 . ПМИД 33151290 .
- ^ «all[filt] — Результаты соединений PubChem» . Проект ПабХим . США: Национальный центр биотехнологической информации . Проверено 7 января 2011 г.
- ^ «all[filt] — Результаты по веществам PubChem» . Проект ПабХим . США: Национальный центр биотехнологической информации . Проверено 28 января 2016 г.
- ^ «all[filt] — Результаты по веществам PubChem» . Проект ПабХим . США: Национальный центр биотехнологической информации . Проверено 7 января 2011 г.
- ^ «all[filt] — результаты биоанализа PubChem» . Проект ПабХим . США: Национальный центр биотехнологической информации . Проверено 28 января 2016 г.
- ^ «all[filt] — результаты биоанализа PubChem» . Проект ПабХим . США: Национальный центр биотехнологической информации . Проверено 7 января 2011 г.
- ^ Ченг Т. (ноябрь 2007 г.). «Расчет коэффициентов распределения октанол-вода на основе знаний аддитивной модели». Журнал химической информации и моделирования . 47 (6): 2140–2148. дои : 10.1021/ci700257y . ПМИД 17985865 .
Внешние ссылки
[ редактировать ]