Автоматическое построение таксономии
Автоматическое построение таксономии (ATC) — это использование программного обеспечения для создания таксономических классификаций на основе набора текстов, называемого корпусом . ATC — это отрасль обработки естественного языка , которая, в свою очередь, является отраслью искусственного интеллекта .
Таксономия , особенно (или таксономическая классификация) — это схема классификации иерархическая классификация, в которой вещи организованы в группы или типы. [1] [2] [3] [4] [5] [6] Помимо прочего, таксономию можно использовать для организации и индексирования знаний (хранящихся в виде документов, статей, видео и т. д.), например, в форме библиотечной системы классификации или таксономии поисковых систем , чтобы пользователям было легче найти информацию, которую они ищут. Многие таксономии представляют собой иерархии (и, следовательно, имеют внутреннюю древовидную структуру ), но не все таксономии.
Разработка и поддержка таксономии вручную — это трудоемкая задача, требующая значительного времени и ресурсов, включая знание или опыт в области таксономии (объем, предмет или область), что увеличивает затраты и ограничивает объем таких проектов. Кроме того, у разработчиков моделей предметной области есть свои собственные точки зрения, которые неизбежно, даже если и непреднамеренно, проникают в таксономию. ATC использует методы искусственного интеллекта для быстрого автоматического создания таксономии домена, чтобы избежать этих проблем и устранить ограничения.
Подходы
[ редактировать ]Существует несколько подходов к УВД. Один из подходов заключается в использовании правил для обнаружения шаблонов в корпусе и использования этих шаблонов для вывода таких отношений, как гипонимия . Другие подходы используют методы машинного обучения , такие как байесовский вывод и искусственные нейронные сети . [7]
Извлечение ключевых слов
[ редактировать ]Один из подходов к построению таксономии состоит в том, чтобы автоматически собрать ключевые слова из домена с помощью извлечения ключевых слов , затем проанализировать отношения между ними (см. Гипонимия ниже), а затем организовать их в таксономию на основе этих отношений.
Гипонимия и отношения «есть-а»
[ редактировать ]В программах АТС одной из важнейших задач является обнаружение гиперонимных и гипонимических отношений между словами. Один из способов сделать это в тексте — найти определенные фразы, такие как «является» и «такой как».
В лингвистике отношения есть-а называются гипонимией . Слова, описывающие категории, называются гиперонимами, а слова, являющиеся примерами категорий, — гипонимами. Например, собака — это гиперним, а Фидо — один из его гипонимов. Слово может быть как гипонимом, так и гиперонимом. Итак, собака — это гипоним млекопитающего , а также гиперним Фидо .
Таксономии часто представляются в виде is-a иерархий , где каждый уровень более специфичен, чем (на математическом языке «подмножество») уровня над ним. Например, базовая биологическая таксономия будет включать такие понятия, как «млекопитающее» , которое является подмножеством животных , и «собаки и кошки» , которые являются подмножествами млекопитающих . Этот вид таксономии называется моделью, поскольку конкретные объекты считаются экземплярами концепции. Например, Фидо — это экземпляр концепта «собака» , а Пушистик — это кот . [8]
Приложения
[ редактировать ]ATC можно использовать для построения таксономий для поисковых систем , для улучшения результатов поиска.
Системы ATC являются ключевым компонентом обучения онтологий (также известного как автоматическое построение онтологий) и используются для автоматического создания больших онтологий для таких областей, как страхование и финансы. Они также использовались для улучшения существующих крупных сетей, таких как Wordnet, чтобы сделать их более полными и согласованными. [9] [10] [11]
программное обеспечение УВД
[ редактировать ]Этот раздел пуст. Вы можете помочь, добавив к нему . ( август 2023 г. ) |
Другие имена
[ редактировать ]Другие названия автоматического построения таксономии включают:
- Автоматизированное построение контуров
- Автоматизированное построение контуров
- Автоматическое создание контуров
- Автоматическое извлечение контуров
- Автоматическое создание контуров
- Автоматизированная индукция контуров
- Автоматизированное структурное обучение
- Автоматизированное составление
- Автоматизированное построение таксономии
- Автоматизированное построение таксономии
- Автоматизированное создание таксономии
- Автоматическое извлечение таксономии
- Автоматизированное создание таксономии
- Автоматизированное введение таксономии
- Автоматизированное обучение таксономии
- Автоматическое построение контуров
- Автоматическое построение контуров
- Автоматическое создание контуров
- Автоматическое извлечение контуров
- Автоматическое создание контуров
- Автоматическая индукция контура
- Автоматическое обучение контурам
- Автоматическое построение таксономии
- Автоматическое создание таксономии
- Автоматическое извлечение таксономии
- Автоматическое создание таксономии
- Автоматическое введение таксономии
- Автоматическое изучение таксономии
- Схема автоматизации
- Контур здания
- Эскизная конструкция
- Создание контура
- Извлечение контуров
- Создание контура
- Контурная индукция
- Краткое обучение
- Построение семантической таксономии
- Построение семантической таксономии
- Создание семантической таксономии
- Извлечение семантической таксономии
- Генерация семантической таксономии
- Индукция семантической таксономии
- Обучение семантической таксономии
- Автоматизация таксономии
- Построение таксономии
- Построение таксономии
- Создание таксономии
- Извлечение таксономии
- Генерация таксономии
- Индукция таксономии
- Изучение таксономии
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Таксономия» . 10 октября 2021 г.
- ^ «Определение и значение таксономии» . Словарь.com . Проверено 13 мая 2022 г.
- ^ «Что такое таксономия?» . 14 августа 2017 г.
- ^ «ТАКСОНОМИЯ | Значение и определение британского английского языка» . Лексико.com. Архивировано из оригинала 2 марта 2021 года . Проверено 13 мая 2022 г.
- ^ «Что такое таксономия?» . 20 августа 2003 г.
- ^ «ТАКСОНОМИЯ (существительное) определение и синонимы | Словарь Macmillan» .
- ^ Нешати, Махмуд; Алиджамаат, Али; Аболхассани, Хасан; Рахими, Афшин; Хосейни, Мехди (2007). «Обучение таксономии с использованием сложной меры сходства». Международная конференция IEEE/WIC/ACM по веб-аналитике (WI'07) . стр. 487–490. дои : 10.1109/WI.2007.135 . ISBN 978-0-7695-3026-0 . S2CID 14206314 .
- ^ Брахман, Рональд (октябрь 1983 г.). «Что есть и чем не является IS-A. Анализ таксономических связей в семантических сетях». IEEE-компьютер . 16 (10): 30–36. дои : 10.1109/MC.1983.1654194 . ОСТИ 5363562 . S2CID 16650410 .
- ^ Веларди, Паола; Фаралли, Стефано; Навильи, Роберто (10 октября 2012 г.). «Перезагрузка OntoLearn: графический алгоритм для индукции таксономии». Компьютерная лингвистика . Ассоциация компьютерной лингвистики. CiteSeerX 10.1.1.278.5674 .
- ^ Лю, Сюэцин; Сун, Янцю; Лю, Шися ; Ван, Хайсюнь (12–16 августа 2012 г.). «Автоматическое построение таксономии по ключевым словам». Материалы 18-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (PDF) . АКМ. п. 1433. дои : 10.1145/2339530.2339754 . ISBN 9781450314626 . S2CID 9100603 . Проверено 7 марта 2017 г.
- ^ Сноу, Рион; Юрафский, Дэниел; Нг, Эндрю. «Индукция семантической таксономии на основе гетерогенных данных» (PDF) . Стэнфордский университет . Проверено 8 марта 2017 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь )
Дальнейшее чтение
[ редактировать ]- Автоматическое построение таксономии на основе ключевых слов (2012 г.)
- Изучение таксономии предметной области из текста: метод включения в сравнении с иерархической кластеризацией из Data & Knowledge Engineering , том 83, январь 2013 г., страницы 54–69
- Изучение таксономических отношений по набору текстовых документов
- Изучение таксономических отношений на основе гетерогенных источников данных
- Основанная на метрике структура для автоматического введения таксономии
- Новый метод оценки автоматически изученных терминологических таксономий
- Проблематизация и рассмотрение предположения о статье как концепции в Википедии
- Структурированное обучение для индукции таксономии с распространением убеждений
- Обучение таксономии с использованием индукции смысла слов
Внешние ссылки
[ редактировать ]- Таксономия 101: Основы и начало работы с таксономиями – показывает, как ATC вписывается в общую деятельность по управлению таксономиями для коммерческого предприятия, нуждающегося в управлении знаниями.