Кембриджская база данных структурных конструкций
![]() | |
Содержание | |
---|---|
Описание | |
Контакт | |
Исследовательский центр | Кембриджский центр кристаллографических данных |
Доступ | |
Формат данных | .cif |
Веб-сайт | |
веб-службы URL-адрес | www |
Инструменты | |
Интернет | ВебКСД |
Автономный |
|
Кембриджская структурная база данных ( CSD ) является одновременно хранилищем, а также проверенным и курируемым ресурсом для трехмерных структурных данных молекул , обычно содержащих как минимум углерод и водород , включая широкий спектр органических , металлоорганических и металлоорганических молекул. Конкретные записи дополняют другие кристаллографические базы данных, такие как Банк данных белков (PDB), База данных неорганических кристаллических структур и Международный центр дифракционных данных . Данные, обычно полученные с помощью рентгеновской кристаллографии и реже с помощью дифракции электронов или нейтронографии и представленные кристаллографами и химиками со всего мира, находятся в свободном доступе (как депонировано авторами) в Интернете через веб-сайт головной организации CSD ( CCDC, Репозиторий [1] ). CSD контролируется некоммерческой зарегистрированной компанией под названием Кембриджский центр кристаллографических данных (CCDC).

CSD является широко используемым учеными хранилищем низкомолекулярных органических и металлоорганических кристаллических структур. Структуры, депонированные в Кембриджском центре кристаллографических данных (CCDC), общедоступны для скачивания в момент публикации или с согласия депонента. Они также научно обогащены и включены в базу данных, используемую программным обеспечением центра. Целевые подмножества CSD также доступны бесплатно для поддержки обучения и других видов деятельности. [2]
История [ править ]
CCDC ОБЕ ФРС вырос из деятельности группы кристаллографии под руководством Ольги Кеннард на кафедре органической, неорганической и теоретической химии Кембриджского университета . С 1965 года группа начала собирать опубликованные библиографические, химические и кристаллические данные о структуре всех малых молекул, изученных методами рентгеновской или нейтронной дифракции . В связи с быстрым развитием вычислительной техники, происходившим в то время, эта коллекция была закодирована в электронной форме и стала известна как Кембриджская структурная база данных (CSD).
CSD была одной из первых числовых научных баз данных, которая начала свою деятельность в любой точке мира и получила академические гранты от Управления научной и технической информации Великобритании, а затем от Совета по науке и инженерным исследованиям Великобритании . Эти средства вместе с субвенциями Национальных дочерних центров позволили разработать CSD и связанное с ним программное обеспечение в 1970-х и 1980-х годах. Первые выпуски системы CSD в США, Италии и Японии произошли в начале 1970-х годов. К началу 1980-х годов система CSD распространялась более чем в 30 странах. По состоянию на 2014 год система CSD была распространена среди ученых в 70 странах.
В 1980-е годы интерес к системе CSD со стороны фармацевтических и агрохимических компаний значительно возрос. Это привело к созданию в 1987 году Кембриджского центра кристаллографических данных (CCDC) как независимой компании с юридическим статусом некоммерческой благотворительной организации, а ее деятельность контролируется международным советом управляющих. В 1992 году CCDC переехал в специально построенное помещение на территории химического факультета университета.
Кеннард ушел с поста директора в 1997 году, и его сменили Дэвид Хартли (1997–2002) и Фрэнк Аллен (2002–2008). Колин Грум был назначен исполнительным директором с 1 октября 2008 г. [3] по сентябрь 2017 года. [4] А совсем недавно, в июне 2018 года, генеральным директором был назначен Юрген Хартер. [5]
Программные продукты CCDC позволяют использовать кристаллографические данные в приложениях в области наук о жизни и кристаллографии. Большая часть разработки и маркетинга программного обеспечения осуществляется компанией CCDC Software Limited (основанной в 1998 году), дочерней компанией, находящейся в полной собственности, которая передает всю свою прибыль обратно CCDC.
Хотя CCDC является самоуправляемой организацией, она сохраняет тесные связи с Кембриджским университетом и является партнерским учреждением университета, имеющим право обучать аспирантов для получения более высоких степеней (PhD, MPhil).
CCDC организовал приложения для США и операции по поддержке в США в октябре 2013 года. [6] [7] первоначально в Рутгерсе, Университете штата Нью-Джерси , где он расположен совместно с Банком данных белков RCSB.
Содержание [ править ]

Ежегодно в CSD появляется около 50 000 новых структур. [8] и с улучшениями существующих записей. Записи (структуры) в репозитории публикуются для публичного доступа сразу после появления соответствующей записи в рецензируемой научной литературе. Между тем, данные также могут быть депонированы и опубликованы непосредственно через CSD без сопроводительной научной статьи, что известно как сообщение CSD .
Периодически публикуются общие статистические данные об объеме депозитов ЦДЦБ, например, отчет за январь 2014 года. [9] По состоянию на январь 2019 г. [update], сводная статистика такова: [10]
Запрос | структуры | % ЦДЦД |
---|---|---|
Общее количество структур | 995,907 | 100.0 |
Количество различных соединений | 900,984 | - |
Количество литературных источников | 2,004 | - |
Органические структуры | 431,037 | 43.5 |
Переходный металл присутствует | 478,138 | 48.2 |
наличие щелочного или щелочноземельного металла | 48,056 | 4.8 |
металл основной группы присутствует | 101,948 | 10.3 |
3D-координаты присутствуют | 937,809 | 94.6 |
Безошибочные координаты | 926,422 | 98.81 |
Нейтронные исследования | 2,142 | 0.2 |
Порошковые дифракционные исследования | 4,761 | 0.5 |
Низкая/высокая темп. исследования | 503,368 | 50.8 |
Определена абсолютная конфигурация | 28,834 | 2.9 |
Нарушение присутствует в структуре | 256,019 | 25.8 |
Полиморфные структуры | 29,817 | 3.0 |
R-фактор < 0,100 | 935,419 | 94.4 |
R-фактор < 0,075 | 845,708 | 85.3 |
R-фактор < 0,050 | 553,042 | 55.8 |
R-фактор < 0,030 | 121,806 | 12.3 |
Количество атомов с 3D-координатами | 85,791,623 | - |
По состоянию на январь 2019 года в топ-25 научных журналов по публикации структур в репозитории CSD вошли: [11]
- 1. 73 070 В Inorg зарегистрировано структур . хим.
- 2. 62 072 сообщалось о В Dalton & J. Chem. структурах. Soc., Далтон Транс.
- 3. 54 160 структур. зарегистрировано В металлоорганических соединениях
- 4. 48 967 В Дж. Ам было зарегистрировано построек . хим. Соц.
- 5. 42 422 В Acta Crystallogr зарегистрировано структуры . Секта. Э
- 6. 32 610 было зарегистрировано В Chem. структур. Евро. Дж.
- 7. 29 790 В журнале J. Organomet сообщалось о структурах . хим.
- 8. 29 640 В Анжью зарегистрировано построек . хим. Межд. Эд.
- 9. 28 682 В Inorg зарегистрировано структуры . Хим. Акта
- 10. было зарегистрировано 28 351 структура В Chem. . Коммун. и Дж. Хим. Соц.
- 11. 27 328 структурах. сообщалось о В CSD Communications
- 12. 26 774 В Acta Crystallogr зарегистрировано структуры . Секта. С
- 13. 26 734 структуры. зарегистрировано В «Многограннике»
- 14. 24 045 В Европе зарегистрировано структур . Дж. Неорг. хим.
- 15. было зарегистрировано 23 483 В J. Org. структуры. хим.
- 16. 22 286 В Cryst зарегистрировано структур . Рост Дез.
- 17. 22 011 структур. зарегистрировано В CrystEngComm
- 18. 15 985 строениях. сообщалось о В Organic Letters
- 19. 15 424 В З. Анорге зарегистрировано строения . Аллг. хим.
- 20. 14 864 В Acta Crystallogr зарегистрировано структуры . Секта. Б
- 21. 13 909 структур было зарегистрировано в Тетраэдре. 8 597 структур было зарегистрировано как частное сообщение в CSD.
- 22. было зарегистрировано 12 734 В J. Mol. структуры. Структура.
- 23. 11 234 В Tetrahedron Lett зарегистрировано структуры .
- 24. 9 150 В Европе зарегистрировано построек . Дж. Орг. хим.
- 25. 8789 структурах. сообщалось о В New Journal of Chemistry
На эти 25 журналов приходится 704 541 из 996 193, или 70,7% структур ЦД.
Эти данные показывают, что большинство структур определяются методом рентгеновской дифракции, при этом менее 1% структур определяются методами нейтронографии или порошковой дифракции . Количество безошибочных координат принималось в процентах от структур, для которых в CSD присутствуют 3D-координаты.
Значение файлов структурных факторов, упомянутых выше, заключается в том, что для структур CSD, определенных методом рентгеновской дифракции, имеющих файл структуры, кристаллограф может проверить интерпретацию наблюдаемых измерений.
роста Тенденция
Исторически количество структур в ЦД росло примерно экспоненциально, преодолев отметку в 25 000 структур в 1977 году, отметку в 50 000 структур в 1983 году, отметку в 125 000 структур в 1992 году, отметку в 250 000 структур в 2001 году, отметку в 500 000 структур в 1992 году. 2009, [12] [13] [14] и рубеж в 1 000 000 построек 8 июня 2019 года. [15] Миллионная структура, добавленная к CSD, представляет собой кристаллическую структуру 1-(7,9-диацетил-11-метил-6H-азепино[1,2-а]индол-6-ил)пропан-2-она.

Количество опубликованных структур в год | ||
Год | # опубликовано | Общий |
---|---|---|
2018 | 53429 | 974,653 |
2017 | 55031 | 921,224 |
2016 | 54975 | 866,193 |
2015 | 53610 | 811,218 |
2014 | 50759 | 757,608 |
2013 | 48025 | 706,849 |
2012 | 45199 | 661,121 |
2011 | 43882 | 615,922 |
2010 | 41240 | 572,040 |
2009 | 40627 | 530,800 |
2008 | 36802 | 490,173 |
2007 | 36569 | 453,371 |
2006 | 34713 | 416,802 |
2005 | 31733 | 382,089 |
2004 | 27988 | 350,356 |
2003 | 26287 | 322,368 |
2002 | 24306 | 296,081 |
2001 | 21781 | 271,775 |
2000 | 19998 | 249,994 |
1999 | 18780 | 229,996 |
1998 | 17289 | 211,216 |
1997 | 15896 | 193,927 |
1996 | 15487 | 178,031 |
1995 | 13001 | 162,544 |
1994 | 12290 | 149,543 |
1993 | 12032 | 137,253 |
1992 | 10691 | 125,221 |
1991 | 9941 | 114,530 |
1990 | 8935 | 104,589 |
1989 | 7750 | 95,654 |
1988 | 7644 | 87,904 |
1987 | 7472 | 80,260 |
1986 | 6873 | 72,788 |
1985 | 6911 | 65,915 |
1984 | 6511 | 59,004 |
1983 | 5250 | 52,493 |
1982 | 5233 | 47,243 |
1981 | 4666 | 42,010 |
1980 | 4252 | 37,344 |
1979 | 3876 | 33,092 |
1978 | 3415 | 29,216 |
1977 | 3092 | 25,801 |
1976 | 2735 | 22,709 |
1975 | 2171 | 19,974 |
1974 | 2142 | 17,803 |
1973 | 1991 | 15,661 |
1972 | 1969 | 13,670 |
1971 | 1548 | 11,701 |
1970 | 1261 | 10,153 |
1969 | 1130 | 8,892 |
1968 | 975 | 7,762 |
1967 | 936 | 6,787 |
1966 | 683 | 5,851 |
1965 | 656 | 5,168 |
1923-1964 | 4512 | 4,512 |
Примечание: данные за 1923-1964 гг. суммированы в последней строке таблицы.
Формат файла [ править ]

Основным форматом файла для осаждения структур CSD, принятым примерно в 1991 году, является формат «Файла кристаллографической информации» , CIF. [16]
Депонированные файлы CSD можно загрузить в формате CIF. Проверенные и проверенные файлы CSD можно экспортировать в широкий спектр форматов, включая CIF, MOL, Mol2, PDB, SHELX и XMol, с использованием инструментов системы CSD.
CCDC . использует два разных кода, чтобы различать депонированный набор данных и курируемую запись CSD Например, одно конкретное « сообщение CSD » органической молекулы было депонировано в CCDC и ему присвоен номер депонирования «CCDC-991327». Это обеспечивает свободный публичный доступ к депонированным данным. Из депонированных данных извлекается выбранная информация для подготовки проверенной и курируемой записи CSD, которой присвоен рефкод «MITGUT». В рамках процесса курирования CCDC также применяет алгоритм DeCIFer, который помогает редакторам назначать химический состав структурам, когда эти представления (например, типы связей, распределение зарядов и т. д.) отсутствуют в исходных представленных файлах CIF. [8] Проверенная и курируемая запись включена в дистрибутивы CSD System и WebCSD, причем доступность ограничена теми, кто вносит соответствующий вклад.
Просмотр данных [ править ]

Каждый набор данных в CSD можно открыто просмотреть и получить с помощью бесплатного сервиса структуры доступа . С помощью этой службы на базе веб-браузера пользователи могут просматривать набор данных в 2D и 3D, получать некоторую базовую информацию о структуре и загружать депонированный набор данных. Более расширенные функции поиска и тщательно подобранная информация доступны через систему CSD на основе подписки .
Помимо использования системы CSD , структурные файлы можно просмотреть с помощью одной из нескольких компьютерных программ с открытым исходным кодом, таких как Jmol . Некоторые другие бесплатные программы, но не с открытым исходным кодом, включают MDL Chime , Pymol , UCSF Chimera , Rasmol , WINGX, [17] CCDC визуализации предоставляет бесплатную версию своей программы Mercury .
Начиная с 2015 года Mercury от CCDC также предоставляет функцию создания файла, готового к 3D-печати, из структур в CSD. [18]
См. также [ править ]
Ссылки [ править ]
- ^ «Форма запроса депозитария CCDC CIF» . Кембриджский центр кристаллографических данных . Проверено 16 сентября 2014 г.
- ^ «Домашняя страница CCDC» . Кембриджский центр кристаллографических данных . Проверено 16 сентября 2014 г.
- ^ Жених С., Аллен Ф. (июль 2009 г.). «CCDC ухожен: интервью с Колином Грумом, исполнительным директором Кембриджского центра кристаллографических данных, и Фрэнком Алленом, почетным научным сотрудником». Журнал компьютерного молекулярного дизайна . 23 (7): 391–4. Бибкод : 2009JCAMD..23..391W . дои : 10.1007/s10822-009-9272-5 . ПМИД 19421719 .
- ^ «Объявление председателя от имени попечителей» . Кембриджский центр кристаллографических данных . 11 сентября 2017 года . Проверено 15 мая 2019 г.
- ^ «CCDC приветствует Юргена Хартера в качестве генерального директора» . Кембриджский центр кристаллографических данных (CCDC) . 11 июня 2018 г. Проверено 15 мая 2019 г.
- ^ «CCDC открывает операции в США» . Кембриджский центр кристаллографических данных (CCDC) . 30 октября 2013 года . Проверено 15 мая 2019 г.
- ^ «Кембриджский центр кристаллографических данных начинает свою деятельность в США в рамках нового партнерства с Центром интегративных протеомных исследований Рутгерса» . Управление исследований и экономического развития Рутгерса . Проверено 15 мая 2019 г.
- ^ Jump up to: Перейти обратно: а б Бруно И.Дж., жених CR (октябрь 2014 г.). «Кристаллографический взгляд на обмен данными и знаниями» . Журнал компьютерного молекулярного дизайна . 28 (10): 1015–22. Бибкод : 2014JCAMD..28.1015B . дои : 10.1007/s10822-014-9780-9 . ПМК 4196029 . ПМИД 25091065 .
- ^ «Записи ЦД: сводная статистика» (PDF) . Кембриджский центр кристаллографических данных. Архивировано из оригинала (PDF) 11 июня 2014 г. Проверено 16 сентября 2014 г.
- ^ «Записи ЦД: сводная статистика» (PDF) . Кембриджская структурная база данных . 1 января 2019 года . Проверено 15 мая 2019 г.
- ^ Jump up to: Перейти обратно: а б «Статистика журнала ЦД» (PDF) . Кембриджская структурная база данных . 1 января 2019 года . Проверено 16 мая 2019 г.
- ^ Жених CR, Аллен Ф.Х. (январь 2014 г.). «Кембриджская структурная база данных в ретроспективе и перспективе» . Ангеванде Хеми . 53 (3): 662–71. дои : 10.1002/anie.201306438 . ПМИД 24382699 .
- ^ «Рост Кембриджской структурной базы данных (CSD) с 1970 года» . CCDC . Проверено 16 сентября 2014 г.
- ^ «Статистика ЦД» . Кембриджский центр кристаллографических данных (CCDC) . Проверено 17 мая 2019 г.
- ^ Робинсон, Филип; Уизерс, Нил; Пинк, Крис; Валслер, Бен. «Кембриджская база данных структурных данных охватывает один миллион структур» . Химический мир . Проверено 7 июня 2019 г.
- ^ Холл С.Р., Аллен Ф.Х., Браун И.Д. (1991). «Файл кристаллографической информации (CIF): новый стандартный архивный файл для кристаллографии» . Акта Кристаллографика . А47 (6): 655–685. дои : 10.1107/S010876739101067X .
- ^ Фарруджа LJ (1 августа 1999 г.). «Комплекс WinGX для кристаллографии монокристаллов малых молекул». Журнал прикладной кристаллографии . 32 (4): 837–838. дои : 10.1107/S0021889899006020 .
- ^ «3D-печать: просто, как раз, два, три!» . Кембриджский центр кристаллографических данных (CCDC) . 19 августа 2015 года . Проверено 18 мая 2019 г.
Внешние ссылки [ править ]
- Кембриджский центр кристаллографических данных (CCDC) — головной объект CSD