Jump to content

Автоматизированная идентификация видов

Автоматизированная идентификация видов — это метод, позволяющий сделать опыт систематиков доступным для экологов, паратаксономистов и других специалистов с помощью цифровых технологий и искусственного интеллекта . Сегодня большинство автоматизированных систем идентификации полагаются на изображения, изображающие виды, для идентификации. [1] На основе точно идентифицированных изображений вида классификатор обучается . Получив достаточное количество обучающих данных, этот классификатор может затем идентифицировать обученные виды на ранее невидимых изображениях.

Введение [ править ]

Автоматизированная идентификация биологических объектов, таких как насекомые (особи) и/или группы (например, виды , гильдии, персонажи), была мечтой систематиков на протяжении веков. Целью некоторых из первых многомерных биометрических методов было решение вечной проблемы групповой дискриминации и межгрупповой характеристики. Несмотря на большую предварительную работу в 1950-х и 60-х годах, прогресс в разработке и внедрении практических систем для полностью автоматизированной биологической идентификации объектов оказался удручающе медленным. Совсем недавно, в 2004 году, Дэн Янзен [2] обновил мечту для новой аудитории:

Космический корабль приземляется. Он выходит. Он указывает на него. Там написано «дружественный-недружественный-съедобный-ядовитый-безопасный-опасный-живой-неживой». При следующем проходе там написано: Quercus oleoides — Homo sapiens — Spondias Mombin — Solanum nigrum — Crotalus durissus — Morpho peleides — змеевидный. Это было у меня в голове с тех пор, как полвека назад я читал научную фантастику в девятом классе. [ нужны разъяснения ]

Проблема идентификации вида [ править ]

DFE – графический интерфейс системы Daisy . На изображении — крыло мокреца Culicoides sp., некоторые виды которого являются переносчиками голубого языка . Другие могут также быть переносчиками вируса Шмалленберга — новой болезни скота, особенно овец.
(Фото: Марк А. О'Нил )

Предпочтительное решение Янзена этой классической проблемы заключалось в создании машин для идентификации видов по их ДНК . Однако недавние разработки в области компьютерных архитектур, а также инновации в разработке программного обеспечения предоставили инструменты, необходимые для реализации видения Янзена, в руки сообщества систематики и информатики не через несколько лет, а сейчас; и не только для создания штрих-кодов ДНК , но и для идентификации на основе цифровых изображений .

Исследование, опубликованное в 2004 году, [3] исследования, почему автоматическая идентификация видов не получила широкого распространения в то время и будет ли это реалистичным вариантом в будущем. Авторы обнаружили, что «небольшое, но растущее число исследований было направлено на разработку автоматизированных систем идентификации видов на основе морфологических признаков». Обзор 20 исследований, анализирующих структуры видов, такие как клетки, пыльца, крылья и гениталии, показывает, что вероятность успешной идентификации составляет от 40% до 100% на обучающих наборах, содержащих от 1 до 72 видов. Однако они также выявили четыре фундаментальные проблемы с этими системами: (1) обучающие наборы — были слишком малы (5-10 экземпляров на вид), и их расширение, особенно для редких видов, может быть затруднено; (2) ошибки в идентификации — недостаточно изучены. изучаются, чтобы справиться с ними и найти систематику, (3) масштабирование — исследования рассматривают только небольшое количество видов (<200 видов) и (4) новые виды — системы ограничиваются видами, для которых они были обучены, и будут классифицировать любые новые виды наблюдение как один из известных видов.

Опрос, опубликованный в 2017 году [4] систематически сравнивает и обсуждает прогресс и результаты в области автоматизированной идентификации видов растений за последнее десятилетие (2005–2015 гг.). За это время на высококачественных сайтах было опубликовано 120 первичных исследований, в основном авторами с опытом работы в области компьютерных наук. Эти исследования предлагают множество подходов к компьютерному зрению , то есть функций, уменьшающих высокую размерность данных пиксельного изображения при сохранении характерной информации, а также методов классификации. Подавляющее большинство этих исследований анализируют листья для идентификации, и только 13 исследований предлагают методы идентификации на основе цветов . Причина в том, что листья легче собирать и визуализировать, и они доступны большую часть года. Предлагаемые функции отражают общие характеристики объекта, т. е. форму , текстуру и цвет, а также специфические характеристики листа, т. е. жилкование и край. В большинстве исследований по-прежнему для оценки использовались наборы данных, содержащие не более 250 видов. . Однако прогресс в этом отношении есть: в одном исследовании используется набор данных с >2 тыс. [5] и еще один с >20 тыс. [6] разновидность .

Система, разработанная в 2022 году [7] показали, что автоматизированная идентификация достигает достаточно высокой точности для использования в автоматизированной системе наблюдения за насекомыми с использованием электронных ловушек. Обучая классификаторы на нескольких сотнях изображений, он правильно идентифицировал плодовых мух и может использоваться для непрерывного мониторинга, направленного на обнаружение инвазии видов или вспышек вредителей. Несколько аспектов способствуют успеху этой системы. Прежде всего, использование электронных ловушек обеспечивает стандартизированную настройку, а это означает, что, хотя они развернуты в разных странах и регионах, визуальная изменчивость с точки зрения размера, угла обзора и освещенности контролируется. Это говорит о том, что системы на основе ловушек может быть легче разработать, чем системы свободного обзора для автоматической идентификации вредителей.

Не хватает специалистов, способных выявить то самое биоразнообразие , сохранение которого стало глобальной проблемой. Комментируя эту проблему палеонтологии в 1993 году, Роджер Кеслер [8] признал:

«... у нас заканчиваются палеонтологи-систематики, которые хоть что-то приближают к синоптическим знаниям об основной группе организмов... Палеонтологи следующего столетия вряд ли смогут позволить себе роскошь подробно заниматься таксономическими проблемами... Палеонтологии придется поддерживать уровень волнения без помощи систематиков, которые так много способствовали его успеху».

Этот дефицит знаний столь же глубоко затрагивает те коммерческие отрасли, которые полагаются на точную идентификацию (например, сельское хозяйство , биостратиграфия ), как и широкий спектр чисто и прикладных исследовательских программ (например, сохранение природы , биологическая океанография , климатология , экология ). Также широко, хотя и неофициально, признается, что техническая таксономическая литература всех групп организмов изобилует примерами непоследовательных и неправильных определений. Это происходит из-за множества факторов, включая недостаточную подготовку и навыки систематиков для идентификации (например, использование различных практических правил для распознавания границ между сходными группами), недостаточно подробные исходные описания групп и/или иллюстрации, неадекватный доступ современным монографиям и тщательно подобранным коллекциям и, конечно же, систематикам, имеющим разные мнения относительно концепций групп. Рецензирование отсеивает только наиболее очевидные ошибки совершения или упущения в этой области, и то только тогда, когда автор предоставляет адекватные изображения (например, иллюстрации, записи и последовательности генов) рассматриваемых образцов.

Систематика также может много выиграть от дальнейшего развития и использования автоматизированных систем идентификации. Чтобы привлечь как персонал, так и ресурсы, систематика должна превратиться в «крупное, скоординированное международное научное предприятие». [9] Многие считают использование Интернета особенно через Всемирную паутину – средством, с помощью которого можно осуществить эту трансформацию. Хотя создание виртуальной системы, подобной GenBank, для доступа к морфологическим данным, аудиоклипам, видеофайлам и т. д., было бы значительным шагом в правильном направлении, улучшенный доступ к информации наблюдений и/или текстовым описаниям сам по себе не решит ни одной проблемы. Таксономические препятствия или низкая воспроизводимость идентификации успешно решаются. Вместо этого неизбежная субъективность, связанная с принятием критических решений на основе качественных критериев, должна быть уменьшена или, по крайней мере, встроена в более формально-аналитический контекст.

в SDS- Изображения гусениц сфинксовой моли белковом геле. Его можно использовать аналогично дактилоскопии ДНК.

Правильно спроектированные, гибкие и надежные автоматизированные системы идентификации, организованные вокруг распределенных вычислительных архитектур и связанные с авторитетно идентифицированными коллекциями данных обучающего набора (например, изображений и последовательностей генов ), в принципе могут предоставить всем систематикам доступ к электронным данным. архивы и необходимые аналитические инструменты для рутинной идентификации распространенных таксонов. Правильно спроектированные системы также могут распознавать, когда их алгоритмы не могут провести надежную идентификацию, и направлять это изображение специалисту (адрес которого можно получить из другой базы данных). Такие системы также могут включать в себя элементы искусственного интеллекта и тем выше, чем больше они используются. После того, как морфологические (или молекулярные) модели вида разработаны и продемонстрированы их точность, к этим моделям можно обратиться с просьбой определить, какие аспекты наблюдаемых закономерностей изменчивости и пределов изменчивости используются для идентификации, тем самым открывая путь для открытие новых и (потенциально) более надежных таксономических признаков.

  • iNaturalist — это глобальный гражданский научный проект и социальная сеть натуралистов, которая включает в себя как человеческую, так и автоматическую идентификацию растений, животных и других живых существ через браузер или мобильные приложения. [10]
  • Pl@ntNet — это глобальный гражданский научный проект, который предоставляет приложение и веб-сайт для идентификации растений по фотографиям на основе машинного обучения.
  • Leaf Snap — это приложение для iOS, разработанное Смитсоновским институтом , которое использует программное обеспечение для визуального распознавания для идентификации видов деревьев Северной Америки по фотографиям листьев. [ нужна ссылка ]
  • Google Фото может автоматически идентифицировать различные виды на фотографиях. [11]
  • Plant.id — это веб-приложение и API, созданные компанией FlowerChecker , которые используют нейронную сеть, обученную на фотографиях из мобильного приложения FlowerChecker. [12] [13]

См. также [ править ]

Приведенные ссылки [ править ]

  1. ^ Вельдхен, Яна; Мэдер, Патрик (ноябрь 2018 г.). Купер, Натали (ред.). «Машинное обучение для идентификации видов на основе изображений» . Методы экологии и эволюции . 9 (11): 2216–2225. дои : 10.1111/2041-210X.13075 . S2CID   91666577 .
  2. ^ Янзен, Дэниел Х. (22 марта 2004 г.). «Сейчас самое время» . Философские труды Лондонского королевского общества . Б. 359 (1444): 731–732. дои : 10.1098/rstb.2003.1444 . ПМК   1693358 . ПМИД   15253359 .
  3. ^ Гастон, Кевин Дж .; О'Нил, Марк А. (22 марта 2004 г.). «Автоматическое распознавание видов: почему бы и нет?» . Философские труды Лондонского королевского общества . Б. 359 (1444): 655–667. дои : 10.1098/rstb.2003.1442 . ПМЦ   1693351 . ПМИД   15253351 .
  4. ^ Вельдхен, Яна; Мэдер, Патрик (07 января 2017 г.). «Идентификация видов растений с использованием методов компьютерного зрения: систематический обзор литературы» . Архив вычислительных методов в технике . 25 (2): 507–543. дои : 10.1007/s11831-016-9206-z . ISSN   1134-3060 . ПМК   6003396 . ПМИД   29962832 .
  5. ^ Жоли, Алексис; Гоэо, Эрве; Бонне, Пьер; Бакич, Вера; Барбе, Жюльен; Сельми, Сухейль; Яхиауи, Итери; Карре, Дженнифер; Муиссе, Элиза (01 сентября 2014 г.). «Интерактивная идентификация растений на основе данных социального имиджа» . Экологическая информатика . Специальный выпуск «Мультимедиа в экологии и окружающей среде». 23 : 22–34. дои : 10.1016/j.ecoinf.2013.07.006 .
  6. ^ Ву, Хуиси; Ван, Лей; Чжан, Фэн; Вэнь, Чжэнькунь (01 августа 2015 г.). «Автоматическое распознавание листьев из большой иерархической базы данных изображений» . Международный журнал интеллектуальных систем . 30 (8): 871–886. дои : 10.1002/int.21729 . ISSN   1098-111X . S2CID   12917626 .
  7. ^ Диллер, Йошуа; Шамсян, Авив; Шакед, Бен; Альтман, Ям; Данцигер, Бат-Чен; Манрахан, Аруна; Серфонтейн, Леани; Бали, Эльма; Вернике, Матиас; Эгартнер, Алоис; Колаччи, Марко; Шаретта, Андреа; Чечик, Гал; Альханатис, Виктор; Пападопулос, Никос Т. (28 июня 2022 г.). «Система дистанционного наблюдения в режиме реального времени за плодовыми мухами, имеющими экономическое значение: чувствительность и анализ изображений» (PDF) . Журнал науки о вредителях . 96 (2): 611–622. дои : 10.1007/s10340-022-01528-x . ISSN   1612-4766 . S2CID   250127830 .
  8. ^ Кэслер, Роджер Л. (1993). «Окно возможностей: заглянуть в новый век палеонтологии». Журнал палеонтологии . 67 (3): 329–333. Бибкод : 1993JPal...67..329K . дои : 10.1017/S0022336000036805 . JSTOR   1306022 . S2CID   133097253 .
  9. ^ Уилер, Квентин Д. (2003). «Трансформация таксономии» (PDF) (22). Систематик: 3–5. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  10. ^ «Исследования компьютерного зрения iNaturalist» . iNaturalist.org . 27 июля 2017 г. Проверено 12 августа 2017 г.
  11. ^ «Как Google Фото различает собак, кошек, медведей и любых других животных на ваших фотографиях» . 04.06.2015.
  12. ^ MLMU.cz - FlowerChecker: захватывающее путешествие одного стартапа ML – О. Веселы и Й. Ржигака , получено 12 января 2022 г.
  13. ^ «Создатели FlowerChecker запускают Shazam для цветов. Plant.id основан на искусственном интеллекте» . 7 мая 2018 г. Архивировано из оригинала 12 мая 2018 г. . Проверено 11 мая 2018 г.

Внешние ссылки [ править ]

Вот несколько ссылок на домашние страницы систем идентификации видов. Системы SPIDA и DAISY по сути являются универсальными и способны классифицировать любой представленный графический материал. Системы ABIS и DrawWing предназначены только для насекомых с перепончатыми крыльями, поскольку они работают путем сопоставления определенного набора признаков на основе жилкования крыльев.

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: af478aaa6cb6744b59381c4297d8ed67__1716959100
URL1:https://arc.ask3.ru/arc/aa/af/67/af478aaa6cb6744b59381c4297d8ed67.html
Заголовок, (Title) документа по адресу, URL1:
Automated species identification - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)