Информатика биоразнообразия
Информатика биоразнообразия — это применение методов информатики к информации о биоразнообразии , такой как таксономия , биогеография или экология . Это определяется как применение технологий информационных технологий для управления, алгоритмического исследования, анализа и интерпретации первичных данных о жизни, особенно на уровне организации вида. [1] Современные компьютерные технологии могут открыть новые способы просмотра и анализа существующей информации, а также прогнозирования будущих ситуаций (см. Моделирование ниши ). Информатика биоразнообразия — это термин, который был придуман только примерно в 1992 году, но с быстрым увеличением объемов данных стал полезен в многочисленных исследованиях и приложениях, таких как создание таксономических баз данных или географических информационных систем . Информатика биоразнообразия контрастирует с « биоинформатикой », которая часто используется как синоним компьютеризированной обработки данных в специализированной области молекулярной биологии .
Обзор
[ редактировать ]Информатика биоразнообразия (отличная, но связанная с биоинформатикой) — это применение методов информационных технологий к проблемам организации, доступа, визуализации и анализа первичных данных о биоразнообразии. Первичные данные о биоразнообразии состоят из названий, наблюдений и записей об образцах, а также генетических и морфологических данных, связанных с экземпляром. Информатике биоразнообразия, возможно, также придется справляться с управлением информацией о неназванных таксонах, например, полученной путем отбора проб из окружающей среды и секвенирования проб из смешанных полей. Термин «информатика биоразнообразия» также используется для обозначения вычислительных проблем, характерных для названий биологических объектов, таких как разработка алгоритмов для работы с вариантами представлений идентификаторов, таких как названия видов и авторитетные источники, а также множественных схем классификации, в рамках которых эти объекты могут жить в соответствии с предпочтениями различных работников в этой области, а также синтаксисом и семантикой, с помощью которых содержимое таксономических баз данных может быть сделано машинным для запроса и взаимодействия для целей информатики биоразнообразия...
История дисциплины
[ редактировать ]Можно считать, что информатика биоразнообразия началась с создания первых компьютеризированных таксономических баз данных в начале 1970-х годов и развивалась за счет последующей разработки инструментов распределенного поиска к концу 1990-х годов, включая аналитика видов из Канзасского университета, Североамериканскую информационную сеть по биоразнообразию NABIN. , CONABIO в Мексике, INBio в Коста-Рике и другие, [2] создание Глобального информационного фонда по биоразнообразию в 2001 году и параллельная разработка различных нишевых моделей и других инструментов для работы с оцифрованными данными о биоразнообразии, начиная с середины 1980-х годов (например, см. [3] ). В сентябре 2000 года американский журнал Science посвятил специальный выпуск «Биоинформатике для биоразнообразия». [4] журнал «Информатика биоразнообразия» начал публиковаться в 2004 году, а несколько международных конференций в течение 2000-х годов собирали специалистов-практиков в области информатики биоразнообразия, в том числе Лондонскую конференцию по электронной биосфере в июне 2009 года. Приложение к журналу « Биоинформатика BMC» (том 10, приложение 14). [5] ), опубликованный в ноябре 2009 года, также посвящен информатике биоразнообразия.
История термина
[ редактировать ]Согласно переписке, воспроизведенной Уолтером Берендсоном, [6] Термин «Информатика биоразнообразия» был придуман Джоном Уайтингом в 1992 году для обозначения деятельности организации, известной как Канадский консорциум информатики биоразнообразия, группы, занимающейся объединением базовой информации о биоразнообразии с экономикой окружающей среды и геопространственной информацией в форме GPS и ГИС . Впоследствии, похоже, он утратил всякую обязательную связь с миром GPS/ГИС и стал ассоциироваться с компьютеризированным управлением любыми аспектами информации о биоразнообразии (например, см. [7] )
Цифровая таксономия (систематика)
[ редактировать ]Глобальный список всех видов
[ редактировать ]Одной из основных целей информатики биоразнообразия является создание полного основного списка признанных в настоящее время видов мира . Эта цель была в значительной степени достигнута благодаря проекту «Каталог жизни» , в ежегодном контрольном списке которого на 2022 год перечислено более 2 миллионов видов. [8] Аналогичная попытка для ископаемых таксонов - Палеобиологическая база данных. [9] документирует около 100 000+ названий ископаемых видов из неизвестного общего числа.
Научные названия родов и видов как уникальные идентификаторы
[ редактировать ]Применение системы Линнея биномиальной номенклатуры для видов и однономиальной номенклатуры для родов и более высоких рангов привело ко многим преимуществам, но также и к проблемам с омонимами (одно и то же название используется для нескольких таксонов, случайно или законно в нескольких царствах), синонимами ( несколько названий одного и того же таксона), а также варианты представления одного и того же названия из-за орфографических различий, незначительных орфографических ошибок, различий в способе цитирования имен и дат авторов и т. д. Кроме того, названия могут меняться с течением времени в связи с изменением таксономических взглядов (например, правильное родовое положение вида или повышение подвида до видового ранга или наоборот), а также границы таксона могут меняться в зависимости от таксономическим концепциям разных авторов. Одним из предлагаемых решений этой проблемы является использование идентификаторов медико-биологических наук ( LSID ) для целей межмашинной связи, хотя есть как сторонники, так и противники этого подхода.
Согласованная классификация организмов
[ редактировать ]Организмы можно классифицировать множеством способов (см. главную страницу «Биологическая классификация »), что может создавать проблемы проектирования систем информатики биоразнообразия, направленных на включение одной или нескольких классификаций для удовлетворения потребностей пользователей или для направления их к единой классификации. Предпочтительная» система. Вопрос о том, может ли когда-либо быть достигнута единая консенсусная классификационная система, вероятно, остается открытым, однако «Каталог жизни» начал работу в этой области. [10] на смену ей пришла опубликованная система, предложенная в 2015 году М. Руджеро и его коллегами. [11]
Карты биоразнообразия
[ редактировать ]Карты биоразнообразия обеспечивают картографическое представление пространственных данных о биоразнообразии. [12] Эти данные можно использовать вместе с контрольными списками видов , чтобы помочь в усилиях по сохранению биоразнообразия . Карты биоразнообразия могут помочь выявить закономерности распределения видов и изменения ареала. Это может отражать потерю биоразнообразия, деградацию среды обитания или изменения в видовом составе . В сочетании с данными о городском развитии карты могут информировать об управлении земельными ресурсами путем моделирования сценариев, которые могут повлиять на биоразнообразие.
крупномасштабные данные, например, из проектов гражданской науки (например, iNaturalist ) и оцифрованных музейных коллекций (например, VertNet Карты биоразнообразия могут создаваться различными способами: традиционно карты ареала рисовались вручную на основе литературных отчетов, но все чаще используются ). ГИС- инструменты, такие как ArcGIS , или пакеты R , такие как dismo, могут конкретно помочь в моделировании распределения видов (моделировании экологических ниш) и даже в прогнозировании воздействия экологических изменений на биоразнообразие. [13] GBIF , OBIS и IUCN — это крупные интернет-хранилища пространственно-временных данных о видах, которые являются источником многих существующих карт биоразнообразия.
Карты биоразнообразия | Описание | Связь |
---|---|---|
Карта Жизни (МОЛ) | Масштабируемая веб-платформа, предназначенная для сбора больших данных о биоразнообразии и окружающей среде. [14] | mol.org |
Карта важности биоразнообразия | Определяет области важности биоразнообразия, имеющие решающее значение для предотвращения вымирания на прилегающей территории Соединенных Штатов. | https://www.natureserve.org/map-biodiversity-importance |
Карты биоразнообразия (Национальный центр данных по биоразнообразию) | Обзор состояния знаний о распределении биоразнообразия Ирландии. | https://maps.biodiversityireland.ie/ |
Сохранение природы | Карты биоразнообразия, на которых изображены закономерности, которые помогут направить усилия по сохранению. | https://savingnature.com/our-biodiversity-maps/ |
Мобилизация первичной информации о биоразнообразии
[ редактировать ]«Первичную» информацию о биоразнообразии можно считать основными данными о распространении и разнообразии видов (или даже любых узнаваемых таксонов), обычно в сочетании с информацией об их распространении в пространстве, времени или и том, и другом. Такая информация может быть в форме сохранившихся образцов и связанной с ними информации, например, собранной в естественноисторических коллекциях музеев и гербариев , или в виде записей наблюдений, например, либо в результате формальных фаунистических или флористических исследований, проведенных профессиональными биологами и студентами, либо как любительские и другие запланированные или незапланированные наблюдения, включая те, которые все чаще попадают в сферу гражданской науки . Обеспечение онлайн-согласованного цифрового доступа к этой обширной коллекции разрозненных первичных данных является основной функцией информатики биоразнообразия, которая лежит в основе региональных и глобальных сетей данных о биоразнообразии, примерами последних являются OBIS и GBIF .
В качестве вторичного источника данных о биоразнообразии соответствующая научная литература может анализироваться либо людьми, либо (потенциально) с помощью специализированных алгоритмов поиска информации для извлечения соответствующей первичной информации о биоразнообразии, которая сообщается в ней, иногда в агрегированной / сводной форме, но часто в виде первичных наблюдений в повествовательная или табличная форма. Элементы такой деятельности (такие как извлечение ключевых таксономических идентификаторов, ключевые слова/ индексные термины и т. д.) уже много лет практикуются на более высоком уровне отдельными академическими базами данных и поисковыми системами . Однако для достижения максимальной ценности информатики биоразнообразия фактические данные о первичных проявлениях в идеале должны быть получены и затем предоставлены в стандартизированной форме или формах; например, проекты Plazi и INOTAXA преобразуют таксономическую литературу в форматы XML , которые затем могут быть прочитаны клиентскими приложениями, причем первый использует TaxonX-XML. [15] а последний использует формат taXMLit. Библиотека наследия биоразнообразия также добилась значительного прогресса в своей цели по оцифровке значительной части таксономической литературы, на которую не распространяются авторские права, которая затем подвергается оптическому распознаванию символов (OCR), чтобы ее можно было подвергнуть дальнейшей обработке с использованием инструментов информатики биоразнообразия.
Стандарты и протоколы
[ редактировать ]Как и другие дисциплины, связанные с данными, информатика биоразнообразия извлекает выгоду из принятия соответствующих стандартов и протоколов для поддержки межмашинной передачи и функциональной совместимости информации в ее конкретной области. Примеры соответствующих стандартов включают базовую Darwin Core XML- схему для данных о биоразнообразии, основанных на образцах и наблюдениях, разработанную с 1998 года, а также ее расширения, Схему передачи таксономических концепций, [16] плюс стандарты структурированных описательных данных, [17] и доступ к данным биологических коллекций (ABCD); [18] в то время как протоколы поиска и передачи данных включают DiGIR (теперь в основном замененный) и TAPIR (протокол доступа TDWG для поиска информации). [19] Многие из этих стандартов и протоколов в настоящее время поддерживаются, а их разработка контролируется Стандартами информации о биоразнообразии (TDWG) .
Текущая деятельность
[ редактировать ]На конференции «Электронная биосфера» в Великобритании в 2009 г. [20] были приняты следующие темы, что свидетельствует о широком спектре текущей деятельности в области информатики биоразнообразия и о том, как их можно классифицировать:
- Применение: Сохранение/Сельское хозяйство/Рыболовство/Промышленность/Лесное хозяйство
- Применение: Инвазивные чужеродные виды
- Приложение: Систематическая и эволюционная биология.
- Применение: Таксономия и системы идентификации.
- Новые инструменты, услуги и стандарты управления данными и доступа к ним
- Новые инструменты моделирования
- Новые инструменты для интеграции данных
- Новые подходы к инфраструктуре биоразнообразия
- Новые подходы к идентификации видов
- Новые подходы к картированию биоразнообразия
- Национальные и региональные базы данных и сети по биоразнообразию
Семинар после конференции с участием ключевых лиц, занимающих в настоящее время важную роль в информатике биоразнообразия, также привел к принятию резолюции семинара, в которой, среди прочего, подчеркивалась необходимость создания надежных глобальных реестров ресурсов, которые являются базовыми для информатики биоразнообразия (например, репозитории, коллекции ); завершить создание прочной таксономической инфраструктуры; и создавать онтологии для данных о биоразнообразии. [21]
Примеры проектов
[ редактировать ]Глобальный:
- Глобальный информационный фонд по биоразнообразию (GBIF) и Океанская биогеографическая информационная система (OBIS) (для морских видов)
- «Виды 2000» , ITIS (Интегрированная система таксономической информации) и «Каталог жизни» Проекты
- Глобальные имена
- EOL , проект «Энциклопедия жизни»
- Консорциум «Штрих-код жизни» проекта
- Проект Карта жизни
- Проект базы данных рептилий
- Проект AmphibiaWeb
- Универсальный биологический индексатор и органайзер uBio из Морской биологической лаборатории Вудс-Хоул.
- Указатель названий организмов (ION) от Clarivate Analytics, обеспечивающий доступ к научным названиям таксонов из многочисленных журналов, проиндексированных в Zoological Record.
- Временный реестр морских и неморских видов (ВРМНГ)
- ЗооБанк — реестр номенклатурных актов и соответствующей систематической литературы по зоологии.
- Index Nominum Genericorum, сборник родовых названий, опубликованных для организмов, входящих в Международный кодекс ботанической номенклатуры , поддерживаемый Смитсоновским институтом в США.
- Международный указатель названий растений
- MycoBank , документирующий новые названия и комбинации грибов.
- Список названий прокариот, имеющих номенклатуру ( LPSN ) — Официальный реестр действительных названий бактерий и архей , регулируемый Международным кодексом номенклатуры бактерий.
- Проект « Библиотека наследия биоразнообразия» — оцифровка литературы по биоразнообразию
- Wikispecies , сборник таксономической информации с открытым исходным кодом (редактируемый сообществом), сопутствующий проект Википедии.
- TaxonConcept.org, проект связанных данных , который объединяет базы данных разрозненных видов.
- Институт естественных наук. Национальный университет Колумбии. Отдел виртуальных коллекций и информатики биоразнообразия
- АНТАБИФ. Информационный фонд по биоразнообразию Антарктики предоставляет свободный и открытый доступ к данным по биоразнообразию Антарктики в духе Договора об Антарктике.
- Genesys , база данных генетических ресурсов растений, хранящаяся в национальных, региональных и международных генных банках.
- VertNet, Доступ к данным о первичных встречах позвоночных из наборов данных по всему миру.
Региональные/национальные проекты:
- Европейская фауна
- Атлас живой Австралии
- Инфраструктура Общеевропейских каталогов видов (PESI)
- Симбиота
- iDigBio , Интегрированные оцифрованные биоколлекции (США)
- проект i4Life
- Информационная система по биоразнообразию Колумбии
- Индийский портал биоразнообразия (IBP)
- Портал биоразнообразия Бутана (BBP)
- Идентификация и знание сорняков в западной части Индийского океана (ВИКВИО)
- LifeWatch предлагается ESFRI в качестве общеевропейской исследовательской (электронной) инфраструктуры для поддержки исследований в области биоразнообразия и разработки политики.
- Вермонт Атлас жизни
Список более 600 текущих мероприятий, связанных с информатикой в области биоразнообразия, можно найти в базе данных TDWG «Всемирные информационные проекты по биоразнообразию». [22]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Соберон, Дж., и Петерсон, AT (2004). Информатика биоразнообразия: управление и применение первичных данных о биоразнообразии. Философские труды Королевского общества B: Биологические науки, 359 (1444), 689–698.
- ^ Кришталка Л., Хамфри П.С. (2000). «Могут ли музеи естествознания запечатлеть будущее?» . Бионаука . 50 (7): 611–617. doi : 10.1641/0006-3568(2000)050[0611:CNHMCT]2.0.CO;2 . hdl : 1808/16508 .
- ^ Петерсон А.Т., Вьегле Д. (2001). «Прогнозирование вторжений видов с помощью моделирования экологической ниши: новые подходы биоинформатики решают насущную проблему» (PDF) . Бионаука . 51 (5): 363–371. doi : 10.1641/0006-3568(2001)051[0363:PSIUEN]2.0.CO;2 . Архивировано из оригинала (PDF) 7 августа 2016 г. Проверено 9 октября 2009 г.
- ^ «Биоинформатика для биоразнообразия?» . Наука . 289 : 2229–2440. 2000.
- ^ «Информатика биоразнообразия» . БМК Биоинформатика . 10 Приложение от 14. 2009 г. Архивировано из оригинала 27 января 2010 г. Проверено 15 ноября 2009 г.
- ^ « Информатика биоразнообразия», Термин» . Проверено 6 августа 2009 г.
- ^ Бисби ФА; и др. (2000). «Тихая революция: информатика биоразнообразия и Интернет». Наука . 289 (5488): 2309–2312. Бибкод : 2000Sci...289.2309B . дои : 10.1126/science.289.5488.2309 . ПМИД 11009408 . S2CID 31852825 .
- ^ «Каталог жизни — Ежегодный контрольный список 2016 года: Ежегодный контрольный список 2016 года» . www.catalogueoflife.org . Проверено 8 сентября 2021 г.
- ^ «Палеобиологическая база данных» . Проверено 6 августа 2009 г.
- ^ «К иерархии управления (классификации) Каталога жизни. Проект документа для обсуждения, подготовленный доктором Деннисом П. Гордоном, май 2009 г.» . Архивировано из оригинала 8 августа 2009 г. Проверено 6 августа 2009 г.
- ^ Руджеро, Массачусетс; Гордон, ДП; Оррелл, ТМ; Байи, Н.; Бургуэн, Т.; Бруска, Колорадо; и др. (2015). «Классификация всех живых организмов более высокого уровня» . ПЛОС ОДИН . 10 (4): e0119248. Бибкод : 2015PLoSO..1019248R . дои : 10.1371/journal.pone.0119248 . ПМЦ 4418965 . ПМИД 25923521 .
- ^ «Карты биоразнообразия: преобразование данных в визуальные инструменты в значимые действия по сохранению биоразнообразия» . 30 ноября 2016 г. Проверено 5 мая 2022 г.
- ^ Элит, Джейн; Франклин, Джанет (2013), «Моделирование распространения видов» , Энциклопедия биоразнообразия , Elsevier, стр. 692–705, doi : 10.1016/b978-0-12-384719-5.00318-x , ISBN 978-0-12-384720-1 , S2CID 82987545 , получено 5 мая 2022 г.
- ^ Джетц, Уолтер; Макферсон, Яна М.; Гуралник, Роберт П. (2012). «Интеграция знаний о распределении биоразнообразия: к глобальной карте жизни» . Тенденции в экологии и эволюции . 27 (3): 151–159. дои : 10.1016/j.tree.2011.09.007 . ПМИД 22019413 .
- ^ «ТаксонХ» . СоурсФордж . Проверено 8 сентября 2021 г.
- ^ «Схема передачи таксономических понятий (TCS)» . Стандарты информации о биоразнообразии (TDWG).
- ^ «Структурированные описательные данные» . Стандарты информации о биоразнообразии (TDWG).
- ^ «Доступ к данным биологических коллекций (ABCD)» . Стандарты информации о биоразнообразии (TDWG).
- ^ «GitHub — tdwg/tapir: протокол доступа TDWG для поиска информации (TAPIR)» . Гитхаб . 16 июня 2020 г. Проверено 8 сентября 2021 г.
- ^ "Дом" . электронная биосфера09.org .
- ^ «Архивная копия» (PDF) . www.e-biSphere09.org . Архивировано из оригинала (PDF) 26 февраля 2012 года . Проверено 12 января 2022 г.
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка ) - ^ «TDWG: Мировые информационные проекты по биоразнообразию» . www.tdwg.org . Архивировано из оригинала 14 июля 2009 года . Проверено 12 января 2022 г.
Дальнейшее чтение
[ редактировать ]- Рабочая группа Форума меганауки ОЭСР по биологической информатике (1999). Заключительный отчет рабочей группы Форума меганауки ОЭСР по биологической информатике, январь 1999 г. стр. 1–74. Архивировано из оригинала 5 марта 2009 г. Проверено 21 марта 2018 г.
- Каньос, вице-президент; Соуза, С.; Джованни Р. и Каньос ДАЛ (2004). «Информатика глобального биоразнообразия: создание условий для «нового мира» экологического моделирования» . Информатика биоразнообразия . 1 :1–13. дои : 10.17161/bi.v1i0.3 .
- Соберон Дж. и Петерсон А.Т. (2004). «Информатика биоразнообразия: управление и применение первичных данных о биоразнообразии» . Фил. Пер. Р. Сок. Лонд . Б359 (1444): 689–698. дои : 10.1098/rstb.2003.1439 . ПМЦ 1693343 . ПМИД 15253354 .
- Чепмен, AD (2005). Использование первичных данных о распространении видов (PDF) . Копенгаген: Глобальный информационный фонд по биоразнообразию. стр. 1–106. Архивировано из оригинала (PDF) 16 февраля 2010 г. Проверено 12 августа 2009 г.
- Джонсон, Н.Ф. (2007). «Информатика биоразнообразия». Ежегодный обзор энтомологии . 52 : 421–438. дои : 10.1146/annurev.ento.52.110405.091259 . ПМИД 16956323 .
- Саркар, Индиана (2007). «Информатика биоразнообразия: организация и связывание информации по всему спектру жизни» . Брифинги по биоинформатике . 8 (5): 347–357. дои : 10.1093/нагрудник/bbm037 . ХДЛ : 1912/1781 . ПМИД 17704120 .
- Гуральник, Р.П.; Хилл, А. (2009). «Информатика биоразнообразия: автоматизированные подходы к документированию глобальных моделей и процессов биоразнообразия» . Биоинформатика . 25 (4): 421–428. doi : 10.1093/биоинформатика/btn659 . ПМИД 19129210 .
Внешние ссылки
[ редактировать ]- Информатика биоразнообразия (журнал)