Jump to content

Основной архив Дарвина

Darwin Core Archive (DwC-A) — это стандарт данных по биоразнообразию , в котором используются термины Darwin Core для создания единого автономного набора данных о встречаемости видов, контрольном списке, событиях отбора проб или данных об образцах материалов. По сути, это набор текстовых файлов (CSV) с простым дескриптором (meta.xml), позволяющим информировать других о том, как организованы ваши файлы. Формат определен в Руководстве по основному тексту Дарвина. [1] Это предпочтительный формат для публикации данных в сети GBIF .

Дарвин Ядро

[ редактировать ]

Стандарт ядра Дарвина [2] использовался для мобилизации подавляющего большинства записей о встречаемости образцов и наблюдений в сети GBIF. [3] Стандарт Darwin Core изначально был задуман для облегчения открытия, поиска и интеграции информации о современных биологических образцах, их пространственно-временном появлении и подтверждающих доказательствах, хранящихся в коллекциях (физических или цифровых).

Ядро Дарвина сегодня имеет более широкий охват. Его цель – предоставить стабильный стандартный справочник для обмена информацией о биологическом разнообразии. В качестве глоссария терминов Darwin Core предоставляет стабильные семантические определения с целью обеспечения максимального повторного использования в различных контекстах. Это означает, что Darwin Core по-прежнему может использоваться так же, как оно использовалось исторически, но также может служить основой для создания более сложных форматов обмена, при этом обеспечивая совместимость посредством общего набора терминов.

Формат архива

[ редактировать ]

Основная идея архива заключается в том, что его файлы данных логически расположены звездообразно, при этом один основной файл данных окружен любым количеством «расширений». Каждая запись расширения (или «строка файла расширения») указывает на запись в основном файле; Таким образом, для каждой отдельной основной записи может существовать от нуля до множества записей расширения, что является более экономичным методом передачи данных, чем альтернатива включению всех данных в одну таблицу, которая в противном случае могла бы содержать много пустых ячеек.

Подробную информацию о рекомендуемых расширениях можно найти в соответствующих подразделах, и они будут подробно документированы в реестре GBIF, в котором будут каталогизированы все доступные расширения.

Совместное использование целых наборов данных вместо использования постраничных веб-сервисов, таких как DiGIR и TAPIR, позволяет гораздо проще и эффективнее передавать данные. Например, получение 260 000 записей через TAPIR занимает около девяти часов, при этом выполняется 1300 HTTP-запросов для передачи 500 МБ данных в формате XML. Тот же самый набор данных, закодированный как DwC-A и заархивированный, превращается в файл размером 3 МБ. Поэтому GBIF настоятельно рекомендует сжимать архив с использованием ZIP или GZIP при создании DwC-A.

Архиву требуются стабильные идентификаторы для основных записей, но не для расширений. Поэтому для любого типа общих данных необходимо иметь какие-то идентификаторы локальных записей. Хорошей практикой является сохранение вместе с исходными данными идентификаторов, которые остаются стабильными во времени и не используются повторно после удаления записи. Если можете, укажите глобальные уникальные идентификаторы вместо локальных.

Дескриптор архива

[ редактировать ]

Будет завершено.


Метаданные набора данных

[ редактировать ]

Основной архив Дарвина должен содержать файл, содержащий метаданные, описывающие весь набор данных. Язык экологических метаданных (EML) является наиболее распространенным форматом для этого, но также используются и простые файлы Dublin Core.

  1. ^ Рекомендации по основному тексту Дарвина
  2. ^ Вечорек, Джон; Д. Блум; Р. Гуральник; С. Блюм; М. Дёринг; Р. Де Джованни; Т. Робертсон; Д. Вьегле (2012). «Darwin Core: развивающийся стандарт данных о биоразнообразии, разработанный сообществом» . ПЛОС ОДИН . 7 (1): e29715. Бибкод : 2012PLoSO...729715W . дои : 10.1371/journal.pone.0029715 . ПМЦ   3253084 . ПМИД   22238640 .
  3. ^ Основные архивы Дарвина - Практическое руководство
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 7c9f9042fad891dfe822a4087df065c5__1629997260
URL1:https://arc.ask3.ru/arc/aa/7c/c5/7c9f9042fad891dfe822a4087df065c5.html
Заголовок, (Title) документа по адресу, URL1:
Darwin Core Archive - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)