Таксономическая база данных
Таксономическая база данных – это база данных , созданная для хранения информации о биологических таксонах – например, группах организмов, организованных по названию вида или другому таксономическому идентификатору – для эффективного управления данными и поиска информации . Таксономические базы данных обычно используются для автоматического создания биологических контрольных списков, таких как флора и фауна , как для печатных публикаций, так и в Интернете; поддерживать работу сетевых информационных систем по видам; как часть управления биологическими коллекциями (например, в музеях и гербариях ); а также обеспечение, в некоторых случаях, компонента управления таксонами в более широких научных или биологических информационных системах. Они также являются фундаментальным вкладом в дисциплину информатики биоразнообразия .
Цели
[ редактировать ]Таксономические базы данных оцифровывают научные данные о биоразнообразии и обеспечивают доступ к таксономическим данным для исследований. [1] Таксономические базы данных различаются по широте групп таксонов и географическому пространству, которое они стремятся включить, например: жуки в определенном регионе, млекопитающие во всем мире или все описанные таксоны на древе жизни. [2] Таксономическая база данных может включать идентификаторы организмов (научное название, автор и – для зоологических таксонов – год первоначальной публикации), синонимы, таксономические мнения, литературные источники или цитаты, иллюстрации или фотографии, а также биологические атрибуты для каждого таксона (например, географическое распространение). , экология, описательная информация, статус под угрозой или уязвимости и т. д.). [2] [3] [4] [5] В некоторых базах данных, таких как база данных Глобального информационного фонда по биоразнообразию (GBIF) и Система данных о штрих-коде жизни , хранится штрих-код ДНК таксона, если он существует (также называемый индексным номером штрих-кода (BIN), который может быть присвоен, например, Международным проектом «Штрих-код жизни» (iBOL) или UNITE, базой данных для штрих-кодирования ДНК грибов ). [6] [7]
Целью таксономической базы данных является точное моделирование интересующих характеристик, которые имеют отношение к организмам, попадающим в сферу предполагаемого охвата и использования системы. [8] Например, базы данных грибов , водорослей , мохообразных и сосудистых растений («высшие растения») кодируют правила Международного кодекса ботанической номенклатуры , тогда как их аналоги для животных и большинства простейших кодируют эквивалентные правила Международного кодекса зоологической номенклатуры . Моделирование соответствующей таксономической иерархии для любого таксона естественным образом соответствует реляционной модели, используемой почти во всех системах баз данных. [ нужна ссылка ] Научный консенсус не достигнут для всех групп таксонов, и продолжают описываться новые виды; следовательно, еще одна цель таксономических баз данных — помочь разрешить конфликты научных мнений и унифицировать таксономию. [2]
История
[ редактировать ]Возможно, самое раннее задокументированное управление таксономической информацией в компьютеризированной форме включало систему таксономического кодирования, разработанную Ричардом Шварцем и др. в Институте морских наук Вирджинии по изучению биоты Чесапикского залива и описан в опубликованном отчете в 1972 году. [9] Эта работа прямо или косвенно привела к другим проектам более высокого уровня, включая систему таксономических кодов NODC. [10] которая прошла через 8 версий, прежде чем была прекращена в 1996 году, чтобы быть включенной и преобразованной во все еще действующую Интегрированную систему таксономической информации (ITIS). Ряд других таксономических баз данных, специализирующихся на отдельных группах организмов, появившихся в 1970-х годах и по настоящее время, совместно вносят вклад в проект «Виды 2000», который с 2001 года сотрудничает с ITIS для создания комбинированного продукта — « Каталога жизни» . В то время как Каталог жизни в настоящее время концентрируется на сборе базовой информации о названиях в виде глобального контрольного списка видов, многочисленные другие проекты таксономических баз данных, такие как Fauna Europaea , Справочник австралийской фауны, [11] и другие предоставляют богатую вспомогательную информацию, включая описания, иллюстрации, карты и многое другое. Многие проекты таксономических баз данных в настоящее время перечислены на сайте TDWG «Мировые информационные проекты по биоразнообразию». [12]
Проблемы
[ редактировать ]Представление таксономической информации в машинно-кодируемой форме поднимает ряд проблем, не встречающихся в других областях, таких как различные способы цитирования одного и того же вида или названия другого таксона, одно и то же название, используемое для нескольких таксонов ( омонимов ), множественные устаревшие названия. названия одного и того же таксона ( синонимы ), изменения в названии и определении концепции таксона с течением времени и многое другое. [8] [2] [1] Нестандартизированные категории и метаданные в таксономических базах данных затрудняют способность исследователей анализировать данные. [3] Одним из форумов, который способствовал обсуждению и возможным решениям этих и связанных с ними проблем с 1985 года, является « Стандарты информации о биоразнообразии» (TDWG) , первоначально называвшаяся «Рабочая группа по таксономическим базам данных».
Хотя онлайновые базы данных имеют большие преимущества (например, расширенный доступ к таксономической информации), у них также есть проблемы, такие как риски целостности данных из-за онлайн- и офлайн-версий и постоянных обновлений, проблемы технического доступа из-за сбоев сервера или Интернета и различные возможности сложных запросов по извлечению таксономических данных в списки. [2] Поскольку количество информации в таксономических онлайн-базах данных быстро увеличивается, агрегирование данных, а также интеграция и согласование нестандартизированных данных между базами данных становятся серьезной проблемой в области таксономии и информатики биоразнообразия. [1]
См. также
[ редактировать ]- Список баз данных по биоразнообразию
- Биологическая классификация
- Darwin Core — свод стандартов для обмена машиночитаемыми таксономическими данными о биоразнообразии.
- Панъевропейские каталоги видов Инфраструктура
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Фэн, Сяо; Энквист, Брайан Дж.; Парк, Дэниел С.; Бойл, Брэд; Бреширс, Дэвид Д.; Галлахер, Рэйчел В.; Лиен, Аарон; Ньюман, Эрика А.; Бургер, Джозеф Р.; Мейтнер, Брайан С.; Мероу, Кори; Ли, Яоци; Хьюнь, Кимберли М.; Эрнст, Кейси; Болдуин, Элизабет (июль 2022 г.). «Обзор неоднородного ландшафта баз данных о биоразнообразии: возможности и проблемы для синтезированной базы знаний о биоразнообразии» . Глобальная экология и биогеография . 31 (7): 1242–1260. Бибкод : 2022GloEB..31.1242F . дои : 10.1111/geb.13497 . ISSN 1466-822X .
- ^ Перейти обратно: а б с д и Гренье, Матиас; Берти, Эмилио; Карвахаль-Кинтеро, Хуан; Дэдлоу, Гала Мона Луиза; Сагуи, Альбан; Зима, Куница (январь 2023 г.). «Гармонизация названий таксонов в данных о биоразнообразии: обзор инструментов, баз данных и передовой практики» . Методы экологии и эволюции . 14 (1): 12–25. Бибкод : 2023MEcEv..14...12G . дои : 10.1111/2041-210X.13802 . ISSN 2041-210X . S2CID 246055874 .
- ^ Перейти обратно: а б Блэр, Джарретт; Гвяздовски, Роджер; Боррелли, Эндрю; Хочкисс, Мишель; Парк, Кэндис; Перретт, Глеаннан; Ханнер, Роберт (27 марта 2020 г.). «На пути к каталогу баз данных по биоразнообразию: онтологический пример» . Журнал данных по биоразнообразию . 8 : е32765. дои : 10.3897/BDJ.8.e32765 . ISSN 1314-2828 . ПМК 7125240 . ПМИД 32269475 . S2CID 215516714 .
- ^ «ИТИС – Определение данных» . www.itis.gov . Проверено 11 апреля 2023 г.
- ^ Гледхилл, Т.; Вальдекасас, АГ; Бесерра, Дж. М. (1 февраля 2007 г.). «Шаблон для будущего: оцифровка и создание базы данных коллекции таксономических иллюстраций» . Экспериментальная и прикладная акарология . 41 (1): 109–113. дои : 10.1007/s10493-007-9054-5 . ISSN 1572-9702 . ПМИД 17340214 . S2CID 27575884 .
- ^ Registry-Migration.Gbif.Org (2022 г.). «Таксономия магистральной сети GBIF» . Глобальный информационный фонд по биоразнообразию . Секретариат GBIF. дои : 10.15468/39омей .
- ^ «Царства жизни со штрих-кодом | BOLDSYSTEMS» . www.boldsystems.org . Проверено 11 апреля 2023 г.
- ^ Перейти обратно: а б Годфрей, HCJ (2002). «Проблемы систематики» . Природа . 417 (6884): 17–19. Бибкод : 2002Natur.417...17G . дои : 10.1038/417017a . ПМИД 11986643 . S2CID 19116252 .
- ^ Шварц, Р.К.; Васс, МЛ.; Боеш, Д.Ф. (1972). Таксономический код биоты Чесапикского залива. Специальный научный отчет №. 62 Института морских наук Вирджинии (PDF) . Глостер-Пойнт, Вирджиния: Институт морских наук Вирджинии. п. 117.
- ^ «Таксономический код NODC» . Национальный центр экологической информации . НОАА.
- ^ «Австралийский фаунистический справочник» . Исследование австралийских биологических ресурсов . Правительство Австралии.
- ^ «База данных TDWG «Всемирные информационные проекты по биоразнообразию» . Проверено 6 августа 2009 г.