Jump to content

Кембриджская база данных структурных конструкций

Кембриджская база данных структурных конструкций
Содержание
Описание
Контакт
Исследовательский центр Кембриджский центр кристаллографических данных
Доступ
Формат данных .cif
Веб-сайт
веб-службы URL-адрес www .ccdc .камера .uk /структуры
Инструменты
Интернет ВебКСД
Автономный
  • Система CSD
  • CSD (база данных)
  • Конквест
  • Меркурий
  • ИзоСтар
  • Могул
  • ЗОЛОТО
  • CSD-CrossMiner

Кембриджская структурная база данных ( CSD ) является одновременно хранилищем, а также проверенным и курируемым ресурсом для трехмерных структурных данных молекул , обычно содержащих как минимум углерод и водород , включая широкий спектр органических , металлоорганических и металлоорганических молекул. Конкретные записи дополняют другие кристаллографические базы данных, такие как Банк данных белков (PDB), База данных неорганических кристаллических структур и Международный центр дифракционных данных . Данные, обычно полученные с помощью рентгеновской кристаллографии и реже с помощью дифракции электронов или нейтронографии и представленные кристаллографами и химиками со всего мира, находятся в свободном доступе (как депонировано авторами) в Интернете через веб-сайт головной организации CSD ( CCDC, Репозиторий [1] ). CSD контролируется некоммерческой зарегистрированной компанией под названием Кембриджский центр кристаллографических данных (CCDC).

Внутри штаб-квартиры CCDC Кембридж, Великобритания

CSD является широко используемым учеными хранилищем низкомолекулярных органических и металлоорганических кристаллических структур. Структуры, депонированные в Кембриджском центре кристаллографических данных (CCDC), общедоступны для скачивания в момент публикации или с согласия депонента. Они также научно обогащены и включены в базу данных, используемую программным обеспечением центра. Целевые подмножества CSD также доступны бесплатно для поддержки обучения и других видов деятельности. [2]

История [ править ]

CCDC ОБЕ ФРС вырос из деятельности группы кристаллографии под руководством Ольги Кеннард на кафедре органической, неорганической и теоретической химии Кембриджского университета . С 1965 года группа начала собирать опубликованные библиографические, химические и кристаллические данные о структуре всех малых молекул, изученных методами рентгеновской или нейтронной дифракции . В связи с быстрым развитием вычислительной техники, происходившим в то время, эта коллекция была закодирована в электронной форме и стала известна как Кембриджская структурная база данных (CSD).

CSD была одной из первых числовых научных баз данных, которая начала свою деятельность в любой точке мира и получила академические гранты от Управления научной и технической информации Великобритании, а затем от Совета по науке и инженерным исследованиям Великобритании . Эти средства вместе с субвенциями Национальных дочерних центров позволили разработать CSD и связанное с ним программное обеспечение в 1970-х и 1980-х годах. Первые выпуски системы CSD в США, Италии и Японии произошли в начале 1970-х годов. К началу 1980-х годов система CSD распространялась более чем в 30 странах. По состоянию на 2014 год система CSD была распространена среди ученых в 70 странах.

В 1980-е годы интерес к системе CSD со стороны фармацевтических и агрохимических компаний значительно возрос. Это привело к созданию в 1987 году Кембриджского центра кристаллографических данных (CCDC) как независимой компании с юридическим статусом некоммерческой благотворительной организации, а ее деятельность контролируется международным советом управляющих. В 1992 году CCDC переехал в специально построенное помещение на территории химического факультета университета.

Кеннард ушел с поста директора в 1997 году, и его сменили Дэвид Хартли (1997–2002) и Фрэнк Аллен (2002–2008). Колин Грум был назначен исполнительным директором с 1 октября 2008 г. [3] по сентябрь 2017 года. [4] А совсем недавно, в июне 2018 года, генеральным директором был назначен Юрген Хартер. [5]

Программные продукты CCDC позволяют использовать кристаллографические данные в приложениях в области наук о жизни и кристаллографии. Большая часть разработки и маркетинга программного обеспечения осуществляется компанией CCDC Software Limited (основанной в 1998 году), дочерней компанией, находящейся в полной собственности, которая передает всю свою прибыль обратно CCDC.

Хотя CCDC является самоуправляемой организацией, она сохраняет тесные связи с Кембриджским университетом и является партнерским учреждением университета, имеющим право обучать аспирантов для получения более высоких степеней (PhD, MPhil).

CCDC организовал приложения для США и операции по поддержке в США в октябре 2013 года. [6] [7] первоначально в Рутгерсе, Университете штата Нью-Джерси , где он расположен совместно с Банком данных белков RCSB.

Содержание [ править ]

К CSD добавлена ​​миллионная структура
К CSD добавлена ​​миллионная структура, ID CSD: XOPCAJ

Ежегодно в CSD появляется около 50 000 новых структур. [8] и с улучшениями существующих записей. Записи (структуры) в репозитории публикуются для публичного доступа сразу после появления соответствующей записи в рецензируемой научной литературе. Между тем, данные также могут быть депонированы и опубликованы непосредственно через CSD без сопроводительной научной статьи, что известно как сообщение CSD .

Периодически публикуются общие статистические данные об объеме депозитов ЦДЦБ, например, отчет за январь 2014 года. [9] По состоянию на январь 2019 г. , сводная статистика такова: [10]

Запрос структуры % ЦДЦД
Общее количество структур 995,907 100.0
Количество различных соединений 900,984 -
Количество литературных источников 2,004 -
Органические структуры 431,037 43.5
Переходный металл присутствует 478,138 48.2
наличие щелочного или щелочноземельного металла 48,056 4.8
металл основной группы присутствует 101,948 10.3
3D-координаты присутствуют 937,809 94.6
Безошибочные координаты 926,422 98.81
Нейтронные исследования 2,142 0.2
Порошковые дифракционные исследования 4,761 0.5
Низкая/высокая темп. исследования 503,368 50.8
Определена абсолютная конфигурация 28,834 2.9
Нарушение присутствует в структуре 256,019 25.8
Полиморфные структуры 29,817 3.0
R-фактор < 0,100 935,419 94.4
R-фактор < 0,075 845,708 85.3
R-фактор < 0,050 553,042 55.8
R-фактор < 0,030 121,806 12.3
Количество атомов с 3D-координатами 85,791,623 -

По состоянию на январь 2019 года в топ-25 научных журналов по публикации структур в репозитории CSD вошли: [11]

1. 73 070 В Inorg зарегистрировано структур . хим.
2. 62 072 сообщалось о В Dalton & J. Chem. структурах. Soc., Далтон Транс.
3. 54 160 структур. зарегистрировано В металлоорганических соединениях
4. 48 967 В Дж. Ам было зарегистрировано построек . хим. Соц.
5. 42 422 В Acta Crystallogr зарегистрировано структуры . Секта. Э
6. 32 610 было зарегистрировано В Chem. структур. Евро. Дж.
7. 29 790 В журнале J. Organomet сообщалось о структурах . хим.
8. 29 640 В Анжью зарегистрировано построек . хим. Межд. Эд.
9. 28 682 В Inorg зарегистрировано структуры . Хим. Акта
10. было зарегистрировано 28 351 структура В Chem. . Коммун. и Дж. Хим. Соц.
11. 27 328 структурах. сообщалось о В CSD Communications
12. 26 774 В Acta Crystallogr зарегистрировано структуры . Секта. С
13. 26 734 структуры. зарегистрировано В «Многограннике»
14. 24 045 В Европе зарегистрировано структур . Дж. Неорг. хим.
15. было зарегистрировано 23 483 В J. Org. структуры. хим.
16. 22 286 В Cryst зарегистрировано структур . Рост Дез.
17. 22 011 структур. зарегистрировано В CrystEngComm
18. 15 985 строениях. сообщалось о В Organic Letters
19. 15 424 В З. Анорге зарегистрировано строения . Аллг. хим.
20. 14 864 В Acta Crystallogr зарегистрировано структуры . Секта. Б
21. 13 909 структур было зарегистрировано в Тетраэдре. 8 597 структур было зарегистрировано как частное сообщение в CSD.
22. было зарегистрировано 12 734 В J. Mol. структуры. Структура.
23. 11 234 В Tetrahedron Lett зарегистрировано структуры .
24. 9 150 В Европе зарегистрировано построек . Дж. Орг. хим.
25. 8789 структурах. сообщалось о В New Journal of Chemistry

На эти 25 журналов приходится 704 541 из 996 193, или 70,7% структур ЦД.

Эти данные показывают, что большинство структур определяются методом рентгеновской дифракции, при этом менее 1% структур определяются методами нейтронографии или порошковой дифракции . Количество безошибочных координат принималось в процентах от структур, для которых в CSD присутствуют 3D-координаты.

Значение файлов структурных факторов, упомянутых выше, заключается в том, что для структур CSD, определенных методом рентгеновской дифракции, имеющих файл структуры, кристаллограф может проверить интерпретацию наблюдаемых измерений.

роста Тенденция

Исторически количество структур в ЦД росло примерно экспоненциально, преодолев отметку в 25 000 структур в 1977 году, отметку в 50 000 структур в 1983 году, отметку в 125 000 структур в 1992 году, отметку в 250 000 структур в 2001 году, отметку в 500 000 структур в 1992 году. 2009, [12] [13] [14] и рубеж в 1 000 000 построек 8 июня 2019 года. [15] Миллионная структура, добавленная к CSD, представляет собой кристаллическую структуру 1-(7,9-диацетил-11-метил-6H-азепино[1,2-а]индол-6-ил)пропан-2-она.

Тенденция роста структуры центральных депозитариев с 1965 по 2018 гг. [11]
Количество опубликованных структур в год
Год # опубликовано Общий
2018 53429 974,653
2017 55031 921,224
2016 54975 866,193
2015 53610 811,218
2014 50759 757,608
2013 48025 706,849
2012 45199 661,121
2011 43882 615,922
2010 41240 572,040
2009 40627 530,800
2008 36802 490,173
2007 36569 453,371
2006 34713 416,802
2005 31733 382,089
2004 27988 350,356
2003 26287 322,368
2002 24306 296,081
2001 21781 271,775
2000 19998 249,994
1999 18780 229,996
1998 17289 211,216
1997 15896 193,927
1996 15487 178,031
1995 13001 162,544
1994 12290 149,543
1993 12032 137,253
1992 10691 125,221
1991 9941 114,530
1990 8935 104,589
1989 7750 95,654
1988 7644 87,904
1987 7472 80,260
1986 6873 72,788
1985 6911 65,915
1984 6511 59,004
1983 5250 52,493
1982 5233 47,243
1981 4666 42,010
1980 4252 37,344
1979 3876 33,092
1978 3415 29,216
1977 3092 25,801
1976 2735 22,709
1975 2171 19,974
1974 2142 17,803
1973 1991 15,661
1972 1969 13,670
1971 1548 11,701
1970 1261 10,153
1969 1130 8,892
1968 975 7,762
1967 936 6,787
1966 683 5,851
1965 656 5,168
1923-1964 4512 4,512

Примечание: данные за 1923-1964 гг. суммированы в последней строке таблицы.

Формат файла [ править ]

3D-печатная модель бензойной кислоты
3D-печатная модель бензойной кислоты, полученная в результате определения кристаллической структуры, созданная с использованием координат из Кембриджской базы данных структурных данных и с помощью программы CCDC Mercury . Топ-модель показывает одну молекулу бензойной кислоты. Нижняя модель показывает димер с водородными связями.

Основным форматом файла для осаждения структур CSD, принятым примерно в 1991 году, является формат «Файла кристаллографической информации» , CIF. [16]

Депонированные файлы CSD можно загрузить в формате CIF. Проверенные и проверенные файлы CSD можно экспортировать в широкий спектр форматов, включая CIF, MOL, Mol2, PDB, SHELX и XMol, с использованием инструментов системы CSD.

CCDC . использует два разных кода, чтобы различать депонированный набор данных и курируемую запись CSD Например, одно конкретное « сообщение CSD » органической молекулы было депонировано в CCDC и ему присвоен номер депонирования «CCDC-991327». Это обеспечивает свободный публичный доступ к депонированным данным. Из депонированных данных извлекается выбранная информация для подготовки проверенной и курируемой записи CSD, которой присвоен рефкод «MITGUT». В рамках процесса курирования CCDC также применяет алгоритм DeCIFer, который помогает редакторам назначать химический состав структурам, когда эти представления (например, типы связей, распределение зарядов и т. д.) отсутствуют в исходных представленных файлах CIF. [8] Проверенная и курируемая запись включена в дистрибутивы CSD System и WebCSD, причем доступность ограничена теми, кто вносит соответствующий вклад.

Просмотр данных [ править ]

3D-печатная модель структуры 1-метил-2,3,4,5-тетракис((триметилсилил)этинил)-1H-пиррола. Идентификатор CSD: XURZAN

Каждый набор данных в CSD можно открыто просмотреть и получить с помощью бесплатного сервиса структуры доступа . С помощью этой службы на базе веб-браузера пользователи могут просматривать набор данных в 2D и 3D, получать некоторую базовую информацию о структуре и загружать депонированный набор данных. Более расширенные функции поиска и тщательно подобранная информация доступны через систему CSD на основе подписки .

Помимо использования системы CSD , структурные файлы можно просмотреть с помощью одной из нескольких компьютерных программ с открытым исходным кодом, таких как Jmol . Некоторые другие бесплатные программы, но не с открытым исходным кодом, включают MDL Chime , Pymol , UCSF Chimera , Rasmol , WINGX, [17] CCDC визуализации предоставляет бесплатную версию своей программы Mercury .

Начиная с 2015 года Mercury от CCDC также предоставляет функцию создания файла, готового к 3D-печати, из структур в CSD. [18]

См. также [ править ]

Ссылки [ править ]

  1. ^ «Форма запроса депозитария CCDC CIF» . Кембриджский центр кристаллографических данных . Проверено 16 сентября 2014 г.
  2. ^ «Домашняя страница CCDC» . Кембриджский центр кристаллографических данных . Проверено 16 сентября 2014 г.
  3. ^ Жених С., Аллен Ф. (июль 2009 г.). «CCDC ухожен: интервью с Колином Грумом, исполнительным директором Кембриджского центра кристаллографических данных, и Фрэнком Алленом, почетным научным сотрудником». Журнал компьютерного молекулярного дизайна . 23 (7): 391–4. Бибкод : 2009JCAMD..23..391W . дои : 10.1007/s10822-009-9272-5 . ПМИД   19421719 .
  4. ^ «Объявление председателя от имени попечителей» . Кембриджский центр кристаллографических данных . 11 сентября 2017 года . Проверено 15 мая 2019 г.
  5. ^ «CCDC приветствует Юргена Хартера в качестве генерального директора» . Кембриджский центр кристаллографических данных (CCDC) . 11 июня 2018 г. Проверено 15 мая 2019 г.
  6. ^ «CCDC открывает операции в США» . Кембриджский центр кристаллографических данных (CCDC) . 30 октября 2013 года . Проверено 15 мая 2019 г.
  7. ^ «Кембриджский центр кристаллографических данных начинает свою деятельность в США в рамках нового партнерства с Центром интегративных протеомных исследований Рутгерса» . Управление исследований и экономического развития Рутгерса . Проверено 15 мая 2019 г.
  8. ^ Jump up to: Перейти обратно: а б Бруно И.Дж., жених CR (октябрь 2014 г.). «Кристаллографический взгляд на обмен данными и знаниями» . Журнал компьютерного молекулярного дизайна . 28 (10): 1015–22. Бибкод : 2014JCAMD..28.1015B . дои : 10.1007/s10822-014-9780-9 . ПМК   4196029 . ПМИД   25091065 .
  9. ^ «Записи ЦД: сводная статистика» (PDF) . Кембриджский центр кристаллографических данных. Архивировано из оригинала (PDF) 11 июня 2014 г. Проверено 16 сентября 2014 г.
  10. ^ «Записи ЦД: сводная статистика» (PDF) . Кембриджская структурная база данных . 1 января 2019 года . Проверено 15 мая 2019 г.
  11. ^ Jump up to: Перейти обратно: а б «Статистика журнала ЦД» (PDF) . Кембриджская структурная база данных . 1 января 2019 года . Проверено 16 мая 2019 г.
  12. ^ Жених CR, Аллен Ф.Х. (январь 2014 г.). «Кембриджская структурная база данных в ретроспективе и перспективе» . Ангеванде Хеми . 53 (3): 662–71. дои : 10.1002/anie.201306438 . ПМИД   24382699 .
  13. ^ «Рост Кембриджской структурной базы данных (CSD) с 1970 года» . CCDC . Проверено 16 сентября 2014 г.
  14. ^ «Статистика ЦД» . Кембриджский центр кристаллографических данных (CCDC) . Проверено 17 мая 2019 г.
  15. ^ Робинсон, Филип; Уизерс, Нил; Пинк, Крис; Валслер, Бен. «Кембриджская база данных структурных данных охватывает один миллион структур» . Химический мир . Проверено 7 июня 2019 г.
  16. ^ Холл С.Р., Аллен Ф.Х., Браун И.Д. (1991). «Файл кристаллографической информации (CIF): новый стандартный архивный файл для кристаллографии» . Акта Кристаллографика . А47 (6): 655–685. дои : 10.1107/S010876739101067X .
  17. ^ Фарруджа LJ (1 августа 1999 г.). «Комплекс WinGX для кристаллографии монокристаллов малых молекул». Журнал прикладной кристаллографии . 32 (4): 837–838. дои : 10.1107/S0021889899006020 .
  18. ^ «3D-печать: просто, как раз, два, три!» . Кембриджский центр кристаллографических данных (CCDC) . 19 августа 2015 года . Проверено 18 мая 2019 г.

Внешние ссылки [ править ]


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4093da143b23c43e92402c64db9db730__1700487720
URL1:https://arc.ask3.ru/arc/aa/40/30/4093da143b23c43e92402c64db9db730.html
Заголовок, (Title) документа по адресу, URL1:
Cambridge Structural Database - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)