Основной архив Дарвина
Darwin Core Archive (DwC-A) — это стандарт данных по биоразнообразию , в котором используются термины Darwin Core для создания единого автономного набора данных о встречаемости видов, контрольном списке, событиях отбора проб или данных об образцах материалов. По сути, это набор текстовых файлов (CSV) с простым дескриптором (meta.xml), позволяющим информировать других о том, как организованы ваши файлы. Формат определен в Руководстве по основному тексту Дарвина. [1] Это предпочтительный формат для публикации данных в сети GBIF .
Дарвин Ядро
[ редактировать ]Стандарт ядра Дарвина [2] использовался для мобилизации подавляющего большинства записей о встречаемости образцов и наблюдений в сети GBIF. [3] Стандарт Darwin Core изначально был задуман для облегчения открытия, поиска и интеграции информации о современных биологических образцах, их пространственно-временном появлении и подтверждающих доказательствах, хранящихся в коллекциях (физических или цифровых).
Ядро Дарвина сегодня имеет более широкий охват. Его цель – предоставить стабильный стандартный справочник для обмена информацией о биологическом разнообразии. В качестве глоссария терминов Darwin Core предоставляет стабильные семантические определения с целью обеспечения максимального повторного использования в различных контекстах. Это означает, что Darwin Core по-прежнему может использоваться так же, как оно использовалось исторически, но также может служить основой для создания более сложных форматов обмена, при этом обеспечивая совместимость посредством общего набора терминов.
Формат архива
[ редактировать ]Основная идея архива заключается в том, что его файлы данных логически расположены звездообразно, при этом один основной файл данных окружен любым количеством «расширений». Каждая запись расширения (или «строка файла расширения») указывает на запись в основном файле; Таким образом, для каждой отдельной основной записи может существовать от нуля до множества записей расширения, что является более экономичным методом передачи данных, чем альтернатива включению всех данных в одну таблицу, которая в противном случае могла бы содержать много пустых ячеек.
Подробную информацию о рекомендуемых расширениях можно найти в соответствующих подразделах, и они будут подробно документированы в реестре GBIF, в котором будут каталогизированы все доступные расширения.
Совместное использование целых наборов данных вместо использования постраничных веб-сервисов, таких как DiGIR и TAPIR, позволяет гораздо проще и эффективнее передавать данные. Например, получение 260 000 записей через TAPIR занимает около девяти часов, при этом выполняется 1300 HTTP-запросов для передачи 500 МБ данных в формате XML. Тот же самый набор данных, закодированный как DwC-A и заархивированный, превращается в файл размером 3 МБ. Поэтому GBIF настоятельно рекомендует сжимать архив с использованием ZIP или GZIP при создании DwC-A.
Архиву требуются стабильные идентификаторы для основных записей, но не для расширений. Поэтому для любого типа общих данных необходимо иметь какие-то идентификаторы локальных записей. Хорошей практикой является сохранение вместе с исходными данными идентификаторов, которые остаются стабильными во времени и не используются повторно после удаления записи. Если можете, укажите глобальные уникальные идентификаторы вместо локальных.
Дескриптор архива
[ редактировать ]Будет завершено.
Метаданные набора данных
[ редактировать ]Основной архив Дарвина должен содержать файл, содержащий метаданные, описывающие весь набор данных. Язык экологических метаданных (EML) является наиболее распространенным форматом для этого, но также используются и простые файлы Dublin Core.
Ссылки
[ редактировать ]- ^ Рекомендации по основному тексту Дарвина
- ^ Вечорек, Джон; Д. Блум; Р. Гуральник; С. Блюм; М. Дёринг; Р. Де Джованни; Т. Робертсон; Д. Вьегле (2012). «Darwin Core: развивающийся стандарт данных о биоразнообразии, разработанный сообществом» . ПЛОС ОДИН . 7 (1): e29715. Бибкод : 2012PLoSO...729715W . дои : 10.1371/journal.pone.0029715 . ПМЦ 3253084 . ПМИД 22238640 .
- ^ Основные архивы Дарвина - Практическое руководство