Таксономия
Информатика |
---|
Общие аспекты |
Связанные поля и подполя |
Таксономия – это практика и наука классификации или категоризации.

Таксономия (или таксономическая классификация) — это схема классификации, особенно иерархическая классификация , в которой вещи организованы в группы или типы. Помимо прочего, таксономию можно использовать для организации и индексирования знаний (хранящихся в виде документов, статей, видео и т. д.), например, в форме библиотечной системы классификации или таксономии поисковых систем , чтобы пользователям было легче найти информацию, которую они ищут. Многие таксономии представляют собой иерархии (и, следовательно, имеют внутреннюю древовидную структуру ), но не все таксономии.
Первоначально таксономия относилась только к категоризации организмов или к определенной классификации организмов. В более широком и общем смысле это может относиться к категоризации вещей или понятий, а также к принципам, лежащим в основе такой категоризации. Таксономия организует таксономические единицы, известные как «таксоны» (единственное число «таксон»)».
Таксономия отличается от мерономии , которая занимается категоризацией частей целого.
Этимология [ править ]
Это слово было придумано в 1813 году швейцарским ботаником А. П. де Кандолем и состоит из греческого τάξις , таксис «порядок», и νόμος , номос «закон», соединенных французской формой -о- ; регулярной формой будет таксономия , используемая в греческом перезаимствовании ταξινομία . [1] [2]
Приложения [ править ]
Категории Википедии образуют таксономию, [3] которые могут быть извлечены автоматическими средствами. [4] По состоянию на 2009 год [update]Было показано, что таксономия, созданная вручную, такая как таксономия вычислительных лексиконов, таких как WordNet , может использоваться для улучшения и реструктуризации таксономии категорий Википедии. [5]
В более широком смысле таксономия также применима к схемам отношений, отличным от иерархий «родитель-потомок», например, к сетевым структурам . Таксономии могут затем включать одного ребенка с несколькими родителями, например, «Автомобиль» может отображаться с обоими родителями «Транспортное средство» и «Стальные механизмы»; однако для некоторых это просто означает, что «автомобиль» является частью нескольких различных таксономий. [6] Таксономия также может представлять собой просто организацию видов вещей в группы или алфавитный список; здесь, однако, более уместен термин словарь. В современном использовании в управлении знаниями таксономии считаются более узкими, чем онтологии, поскольку онтологии применяют большее разнообразие типов отношений. [7]
С математической точки зрения иерархическая таксономия представляет собой древовидную структуру классификаций для данного набора объектов. Ее также называют иерархией сдерживания . Наверху этой структуры находится единая классификация, корневой узел, который применяется ко всем объектам. Узлы ниже этого корня представляют собой более конкретные классификации, которые применяются к подмножествам общего набора классифицированных объектов. Ход рассуждения идет от общего к более частному.
Напротив, в контексте юридической терминологии используется открытая контекстуальная таксономия — таксономия, применимая только по отношению к конкретному контексту. В сценариях, взятых из юридической области, моделируется формальный учет открытой текстуры юридических терминов, что предполагает различные понятия «ядра» и «полутени» значений понятия. Ход рассуждений идет от частного к более общему. [8]
История [ править ]
Антропологи заметили, что таксономии обычно встроены в местные культурные и социальные системы и выполняют различные социальные функции. Пожалуй, самым известным и влиятельным исследованием народной систематики является работа Эмиля Дюркгейма « Элементарные формы религиозной жизни» . Более позднюю трактовку народных таксономий (включая результаты нескольких десятилетий эмпирических исследований) и обсуждение их связи с научной таксономией можно найти в книге Скотта Атрана « Когнитивные основы естественной истории». Было обнаружено, что народная систематика организмов в значительной степени согласуется с научной классификацией, по крайней мере, для более крупных и очевидных видов, а это означает, что народная систематика не основана исключительно на утилитарных характеристиках. [9]
В семнадцатом веке немецкий математик и философ Готфрид Лейбниц , следуя работе майоркского философа тринадцатого века Рамона Лулля над его Ars Generalis ultima , системой процедурного генерирования концепций путем объединения фиксированного набора идей, стремился разработать алфавит человеческая мысль . Лейбниц задумал свою универсальную характеристику как «алгебру», способную выразить всю концептуальную мысль. Идея создания такого « универсального языка » часто рассматривалась в 17 веке, в частности, английским философом Джоном Уилкинсом в его работе «Очерк реального характера и философского языка» (1668), на основе которого была взята классификационная схема Роже. конечном итоге возникает тезаурус В .
Таксономия в различных дисциплинах [ править ]
Естественные науки [ править ]
Таксономия в биологии включает описание, идентификацию, номенклатуру и классификацию организмов. Использование таксономии включает:
- Альфа-таксономия , описание и базовая классификация новых видов, подвидов и других таксонов.
- Линнеевская систематика , первоначальная классификационная схема Карла Линнея.
- научная классификация на основе рангов в отличие от классификации на основе кладов
- Эволюционная таксономия , традиционная постдарвиновская иерархическая биологическая классификация.
- Числовая таксономия , различные таксономические методы, использующие числовые алгоритмы.
- Фенетика , система упорядочивания видов на основе общего сходства.
- Филогенетика , биологическая таксономия, основанная на предполагаемом предковом происхождении организмов.
- Таксономия растений
- Классификация вирусов , таксономическая система вирусов.
- Народная таксономия , описание и организация отдельными людьми или группами своей среды обитания.
- Нозология , классификация болезней
- Классификация почв , систематическая категоризация почв.
Бизнес и экономика [ править ]
Использование таксономии в бизнесе и экономике включает:
- Корпоративная таксономия , иерархическая классификация объектов, представляющих интерес для предприятия, организации или администрации.
- Экономическая таксономия — система классификации экономической деятельности.
- Стандарт глобальной отраслевой классификации — отраслевая таксономия, разработанная MSCI и Standard & Poor's (S&P).
- Индекс отраслевой классификации — таксономия отраслевой классификации, запущенная Dow Jones и FTSE.
- Международная стандартная отраслевая классификация (МСОК), система Организации Объединенных Наций для классификации экономических данных.
- Североамериканская система отраслевой классификации (NAICS), используемая в Канаде, Мексике и Соединенных Штатах Америки.
- Таксономия Пэвитта , классификация фирм по их основным источникам инноваций.
- Стандартная отраслевая классификация — система классификации отраслей по четырехзначному коду.
- Стандартная отраслевая классификация экономической деятельности Соединенного Королевства , Стандартная отраслевая классификация по видам экономической деятельности
- Таксономия ЕС для устойчивой деятельности — система классификации, созданная для уточнения того, какие инвестиции являются экологически устойчивыми, в контексте Европейского «Зеленого курса» .
- Таксономия управления записями — представление данных, на которых основана классификация неструктурированного контента внутри организации.
- Таксономия XBRL , расширяемый язык бизнес-отчетности
- Таксономия SRK в дизайне пользовательского интерфейса на рабочем месте
Вычисление [ править ]
Программная инженерия [ править ]
Вегас и др. [10] привести убедительные аргументы в пользу расширения знаний в области разработки программного обеспечения с помощью таксономии. Аналогичным образом, Оре и др. [11] предоставить систематическую методологию подхода к построению таксономии в темах, связанных с разработкой программного обеспечения.
В исследованиях по тестированию программного обеспечения было предложено несколько таксономий для классификации методов, инструментов, концепций и артефактов. Ниже приведены некоторые примеры таксономий:
- Таксономия методов тестирования на основе моделей [12]
- Таксономия инструментов статического анализа кода [13]
Энгстрем и др. [14] предложить и оценить использование таксономии для налаживания связей между исследователями и практиками, работающими в области тестирования программного обеспечения. Они также разработали веб-инструмент [15] облегчать и поощрять использование таксономии. Инструмент и его исходный код доступны для публичного использования. [16]
таксономии в использования Другие варианты вычислениях
- Таксономия Флинна , классификация методов параллелизма на уровне инструкций.
- Фолксономия , классификация по тегам пользователей
- Таксономия для поисковых систем как инструмент повышения релевантности поиска в вертикальной области.
- Система классификации вычислений ACM — предметная система классификации вычислений, разработанная Ассоциацией вычислительной техники.
и научные круги Образование
Использование таксономии в образовании включает:
- Таксономия Блума , стандартизированная категоризация целей обучения в образовательном контексте.
- Классификация учебных программ , таксономия академических дисциплин в высших учебных заведениях США.
- Классификация предметов по математике — буквенно-цифровая схема классификации, основанная на материалах Mathematical Reviews и Zentralblatt MATH.
- Таксономия SOLO , Структура наблюдаемых результатов обучения, предложенная Биггсом и Коллисом Таксоном.
Безопасность [ править ]
Использование таксономии в целях безопасности включает:
- Таксономия безопасности — стандартизированный набор терминов, используемых в области безопасности и здравоохранения.
- Система анализа и классификации человеческого фактора - система для выявления человеческих причин несчастного случая.
- Модель швейцарского сыра — модель, используемая в анализе рисков и управлении рисками, предложенная Данте Орланделлой и Джеймсом Т. Ризоном.
- Классификация железнодорожных происшествий в системе отчетности и анализа конфиденциальных происшествий (CIRAS)
Другие таксономии [ править ]
- Военная таксономия — набор терминов, описывающих различные типы военных операций и техники.
- Схема классификации Мойса — предметная классификация права, разработанная Элизабет Мойс.
Публикация исследований [ править ]
Ссылаясь на неадекватность существующей практики перечисления авторов статей в медицинских исследовательских журналах, Драммонд Ренни и соавторы обратились к статье 1997 года в JAMA , журнале Американской медицинской ассоциации для
радикальные концептуальные и систематические изменения, призванные отразить реалии множественного авторства и усилить подотчетность. Мы предлагаем отказаться от устаревшего понятия «автор» в пользу более полезного и реалистичного понятия «соавтор». [17] : 152
С 2012 года несколько крупных академических и научных издательств внедрили проект CRediT для разработки контролируемого словаря ролей участников. [18] Известная как CRediT (Таксономия ролей участников) , это пример плоской, неиерархической таксономии; однако он включает необязательную широкую классификацию степени вклада: ведущий , равный или поддерживающий . Эми Брэнд и соавторы резюмируют предполагаемый результат следующим образом:
Выявление конкретного вклада в опубликованные исследования приведет к соответствующему признанию, меньшему количеству споров между авторами и меньшему количеству препятствий для сотрудничества и обмена данными и кодом. [17] : 151
По состоянию на середину 2018 года эта таксономия, очевидно, ограничивает свою сферу применения результатами исследований , в частности журнальными статьями; однако он весьма необычно «надеется… поддержать идентификацию рецензентов». [18] (По существу, в нем еще не определены термины для таких ролей, как редактор или автор главы в сборнике результатов исследований.) Версия 1, созданная первой рабочей группой (северной) осенью 2014 года, определяет 14 конкретных участников. роли, используя следующие определенные термины:
- Концептуализация
- Методология
- Программное обеспечение
- Валидация
- Формальный анализ
- Расследование
- Ресурсы
- Курирование данных
- Написание — оригинальный черновик
- Написание – обзор и редактирование
- Визуализация
- Надзор
- Администрация проекта
- Приобретение финансирования
Восприятие было неоднозначным: несколько крупных издателей и журналов планируют внедрить CRediT к концу 2018 года, хотя почти столько же не убеждены в необходимости или ценности его использования. Например,
Национальная академия наук создала веб-страницу TACS (Прозрачность вклада авторов в науку) , на которой перечислены журналы, которые обязуются устанавливать стандарты авторства, определять обязанности соответствующих авторов, требовать идентификаторы ORCID и принимать таксономию CRediT. [19]
На той же веб-странице есть таблица со списком 21 журнала (или семейств журналов), из которых:
- 5 внедрили или к концу 2018 года внедрят CRediT,
- 6 требуют заявления о вкладе автора и предлагают использовать CRediT,
- 8 не используют CRediT, из них 3 приводят причины не делать этого, и
- 2 неинформативны.
Таксономия представляет собой открытый стандарт, соответствующий принципам OpenStand . [20] и публикуется под лицензией Creative Commons . [18]
Таксономия для Интернета [ править ]
Веб-сайты с хорошо продуманной таксономией или иерархией легко понятны пользователям благодаря возможности разработки мысленной модели структуры сайта. [21]
Рекомендации по написанию таксономии для Интернета включают:
- Взаимоисключающие категории могут быть полезными. Если категории появляются в нескольких местах, это называется перекрестным списком или полииерархическим. Иерархия потеряет свою ценность, если перекрестный список будет появляться слишком часто. Перекрестный список часто появляется при работе с неоднозначными категориями, которые подходят более чем одному месту. [21]
- Наличие баланса между широтой и глубиной таксономии полезно. Слишком много вариантов (широта) перегрузят пользователей, предоставив им слишком большой выбор. В то же время слишком узкая структура с более чем двумя или тремя уровнями для перехода разочарует пользователей и может сдаться. [21]
Отношения «есть» и «имеет гипонимия и »
Двумя преобладающими типами отношений в системах представления знаний являются предикация и универсально квантифицированный кондиционал . Отношения предикации выражают представление о том, что отдельная сущность является примером определенного типа (например, Джон — холостяк ), в то время как универсально квантифицированные кондиционалы выражают представление о том, что тип является подтипом другого типа (например, « Собака — это млекопитающее» , что означает то же самое, что « Все собаки — млекопитающие» ). [22]
Отношения «имеет» совершенно иные: у слона есть хобот; хобот - это часть, а не подвид слона. Изучением отношений части и целого называется мереология .
Таксономии часто представляют как is- иерархии , где каждый уровень более конкретен, чем уровень выше него (на математическом языке это «подмножество» уровня выше). Например, базовая биологическая таксономия будет включать такие понятия, как «млекопитающее» , которое является подмножеством животных , и «собаки и кошки» , которые являются подмножествами млекопитающих . Таксономия такого типа называется моделью есть, поскольку конкретные объекты рассматриваются как экземпляры концепции. Например, Фидо — это экземпляр понятия « собака» , а Пушистик — это кот . [23]
В лингвистике отношения есть-а называются гипонимией . Когда одно слово описывает категорию, а другое — некоторое подмножество этой категории, больший термин называется гиперонимом по отношению к меньшему, а меньший — «гипонимом» по отношению к большему. Такой гипоним, в свою очередь, может иметь дополнительные подкатегории, для которых он является гиперонимом. В простом примере из биологии собака является гипернимом по отношению к своей подкатегории колли , которая, в свою очередь, является гипернимом по отношению к Фидо , который является одним из ее гипонимов. Однако обычно гиперним используется для обозначения подкатегорий, а не отдельных лиц.
Исследования [ править ]

Исследователи сообщили, что большие группы населения постоянно разрабатывают очень похожие системы категорий. Это может иметь отношение к лексическим аспектам крупных коммуникационных сетей и культур, таким как фольксономия и язык или человеческое общение, а также к смыслообразованию в целом. [24] [25]
См. также [ править ]
- Все страницы с заголовками, содержащими таксономию
Словарное определение таксономии в Викисловаре
Словарное определение схемы классификации в Викисловаре
- Категоризация , процесс разделения вещей на группы.
- Классификация (общая теория)
- Небесный магазин доброжелательного признания — вымышленная китайская энциклопедия с «невозможной» таксономической схемой.
- Слияние
- Фасетная классификация
- Фольксономия
- Словарь геллишского английского языка — таксономия, в которой понятия организованы в виде иерархии подтипов-супертипов.
- Гипероним
- Представление знаний
- Лексикон
- Онтология (информатика) — формальное представление знаний как набора понятий внутри предметной области.
- Философский язык
- Защищено (программное обеспечение)
- Семантическая сеть
- Сеть семантического сходства
- Структурализм
- Систематика
- Таксон — популяция организмов, которую систематик считает единицей.
- Таксономия для поисковых систем
- Тезаурус (поиск информации)
- Типология (значения)
Примечания [ править ]
- ^ Оксфордский словарь английского языка . Издательство Оксфордского университета. 1910 г. (частично обновлено декабрь 2021 г.), св.
- ^ обзор Обзора общей таксономии в природе 60 : 489–490. Архивировано 26 января 2023 г. в Wayback Machine (1899).
- ^ Цирн, Сесилия, Виви Нэстасе и Майкл Штрубе. 2008. «Различие экземпляров и классов в таксономии Википедии» (видеолекция). Архивировано 20 декабря 2019 г. на Wayback Machine 5-й ежегодной европейской конференции по семантической сети (ESWC 2008).
- ^ С. Понцетто и М. Штрубе. 2007. «Получение крупномасштабной таксономии из Википедии». Архивировано 14 августа 2017 г. в Wayback Machine . Учеб. 22-й конференции по развитию искусственного интеллекта, Ванкувер, Британская Колумбия, Канада, стр. 1440–1445.
- ^ С. Понцетто, Р. Навильи. 2009. «Крупномасштабное таксономическое картирование для реструктуризации и интеграции Википедии» . Учеб. 21-й Международной совместной конференции по искусственному интеллекту (IJCAI 2009), Пасадена, Калифорния, стр. 2083–2088.
- ^ Джексон, Иоав. «Таксономия — это не просто дизайн, это искусство», Архивировано 5 февраля 2020 г. в Wayback Machine Government Computer News (Вашингтон, округ Колумбия). 2 сентября 2004 г.
- ^ Сурианто, Хендра и Пол Комптон. «Изучение классификационной таксономии с помощью системы, основанной на классификационных знаниях». Архивировано 9 августа 2017 г. в Университете Wayback Machine в Карлсруэ ; «Определение таксономии», архивировано 9 августа 2017 г. на веб-сайте Wayback Machine Straights Knowledge.
- ^ Гросси, Давиде, Фрэнк Дигнум и Джон-Жюль Чарльз Мейер. (2005). «Контекстные таксономии» в вычислительной логике в многоагентных системах, стр. 33–51. [ мертвая ссылка ] .
- ^ Кеннет Боулдинг; Элиас Халил (2002). Эволюция, порядок и сложность . Рутледж. ISBN 9780203013151 . п. 9
- ^ Вегас, С. (2009). «Зрелость знаний в области разработки программного обеспечения с помощью классификаций: тематическое исследование методов модульного тестирования». Транзакции IEEE по разработке программного обеспечения . 35 (4): 551–565. CiteSeerX 10.1.1.221.7589 . дои : 10.1109/TSE.2009.13 . S2CID 574495 .
- ^ Оре, С. (2014). «Таксономия критических факторов успеха для развертывания процессов программного обеспечения». Журнал качества программного обеспечения . 22 (1): 21–48. дои : 10.1007/s11219-012-9190-y . S2CID 18047921 .
- ^ Уттинг, Марк (2012). «Таксономия подходов к тестированию на основе моделей» . Тестирование, проверка и надежность программного обеспечения . 22 (5): 297–312. дои : 10.1002/stvr.456 . S2CID 6782211 . Архивировано из оригинала 20 декабря 2019 г. Проверено 23 апреля 2017 г.
- ^ Новак, Джерней (май 2010 г.). «Таксономия инструментов статического анализа кода» . Материалы 33-й Международной конвенции MIPRO : 418–422. Архивировано из оригинала 27 июня 2022 г. Проверено 3 марта 2020 г.
- ^ Энгстрём, Эмели (2016). «SERP-тест: таксономия для поддержки коммуникации между промышленностью и научными кругами». Журнал качества программного обеспечения . 25 (4): 1269–1305. дои : 10.1007/s11219-016-9322-x . S2CID 34795073 .
- ^ «SERP-коннект» . Архивировано из оригинала 28 августа 2021 г. Проверено 28 августа 2021 г.
- ^ Энгстрем, Эмели (4 декабря 2019 г.). «SERP-connect backend» . Гитхаб . Архивировано из оригинала 10 декабря 2019 года . Проверено 25 октября 2016 г.
- ^ Jump up to: Перейти обратно: а б Брэнд, Эми ; Аллен, Лиз; Альтман, Мика ; Глава, Марджори; Скотт, Джо (1 апреля 2015 г.). «Помимо авторства: атрибуция, вклад, сотрудничество и заслуга» . Изучал издательское дело . 28 (2): 151–155. дои : 10.1087/20150211 . S2CID 45167271 .
- ^ Jump up to: Перейти обратно: а б с «КРедиТ» . КАСРАИ . КАСРАИ . 2 мая 2018 г. Архивировано из оригинала (онлайн) 12 июня 2018 г. . Проверено 13 июня 2018 г.
- ^ «Прозрачность вклада авторов в науку (TACS)» (онлайн) . Национальная академия наук . 2018. Архивировано из оригинала 19 мая 2019 года . Проверено 13 июня 2018 г.
- ^ «Открытый стенд» . Открытый стенд . Архивировано из оригинала 18 сентября 2019 года . Проверено 13 июня 2018 г.
- ^ Jump up to: Перейти обратно: а б с Питер., Морвилл (2007). Информационная архитектура Всемирной паутины . Розенфельд, Луис. Розенфельд, Луис. (3-е изд.). Севастополь, Калифорния: О'Рейли. ISBN 9780596527341 . ОСЛК 86110226 .
- ^ Рональд Дж. Брахман ; Чем IS-A является и чем не является. Анализ таксономических связей в семантических сетях. Архивировано 30 июня 2020 г. в Wayback Machine . Компьютер IEEE, 16 (10); Октябрь 1983 года.
- ^ Брахман, Рональд (октябрь 1983 г.). «Что есть и чем не является IS-A. Анализ таксономических связей в семантических сетях». IEEE-компьютер . 16 (10): 30–36. дои : 10.1109/MC.1983.1654194 . S2CID 16650410 .
- ^ «Почему независимые культуры думают одинаково, когда дело касается категорий: это не в мозгу» . физ.орг . Архивировано из оригинала 25 января 2021 года . Проверено 13 февраля 2021 г.
- ^ Гильбо, Дуглас; Барончелли, Андреа; Сентола, Дэймон (12 января 2021 г.). «Экспериментальные доказательства конвергенции категорий среди населения, вызванной масштабом» . Природные коммуникации . 12 (1): 327. Бибкод : 2021NatCo..12..327G . дои : 10.1038/s41467-020-20037-y . ISSN 2041-1723 . ПМК 7804416 . ПМИД 33436581 .
Доступно под лицензией CC BY 4.0. Архивировано 16 октября 2017 г. на Wayback Machine .
Ссылки [ править ]
- Атран, С. (1993) Когнитивные основы естествознания: на пути к антропологии науки. Кембридж: Издательство Кембриджского университета . ISBN 978-0-521-43871-1
- Карбонелл, Дж. Г. и Дж. Зикманн, ред. (2005). Вычислительная логика в многоагентных системах, Vol. 3487. Берлин: Springer-Verlag . ISBN 978-3-540-28060-6
- Мэлоун, Джозеф Л. (1988). Наука лингвистики в переводческом искусстве: некоторые инструменты лингвистики для анализа и практики перевода. Олбани, Нью-Йорк: Издательство Государственного университета Нью-Йорка . ISBN 978-0-887-06653-5 ; ОСЛК 15856738
- *Марчелло Сорс Келлер, «Проблема классификации в исследовании народных песен: краткая история», Folklore , XCV (1984), вып. 1, 100–104.
- Честер Д. Роу и Стивен М. Дэвис, «Набор инструментов Excellence Engine»; ISBN 978-0-615-24850-9
- Херлин, М.; Сундберг, П. (1998). «Таксономия и философия имен». Биология и философия . 13 (2): 233–244. дои : 10.1023/а:1006583910214 . S2CID 82878147 .
- Ламбертс, К.; Шанкс, ДР (1997). Знания, понятия и категории . Психология Пресс. ISBN 9780863774911 .
Внешние ссылки [ править ]
СМИ, связанные с таксономией, на Викискладе?
Словарное определение таксономии в Викисловаре
- Таксономия 101: основы и начало работы с таксономиями