Jump to content

Автоматическое построение таксономии

Автоматическое построение таксономии (ATC) — это использование программного обеспечения для создания таксономических классификаций на основе набора текстов, называемого корпусом . ATC — это отрасль обработки естественного языка , которая, в свою очередь, является отраслью искусственного интеллекта .

Таксономия , особенно (или таксономическая классификация) — это схема классификации иерархическая классификация, в которой вещи организованы в группы или типы. [1] [2] [3] [4] [5] [6] Помимо прочего, таксономию можно использовать для организации и индексирования знаний (хранящихся в виде документов, статей, видео и т. д.), например, в форме библиотечной системы классификации или таксономии поисковых систем , чтобы пользователям было легче найти информацию, которую они ищут. Многие таксономии представляют собой иерархии (и, следовательно, имеют внутреннюю древовидную структуру ), но не все таксономии.

Разработка и поддержка таксономии вручную — это трудоемкая задача, требующая значительного времени и ресурсов, включая знание или опыт в области таксономии (объем, предмет или область), что увеличивает затраты и ограничивает объем таких проектов. Кроме того, у разработчиков моделей предметной области есть свои собственные точки зрения, которые неизбежно, даже если и непреднамеренно, проникают в таксономию. ATC использует методы искусственного интеллекта для быстрого автоматического создания таксономии домена, чтобы избежать этих проблем и устранить ограничения.

Существует несколько подходов к УВД. Один из подходов заключается в использовании правил для обнаружения шаблонов в корпусе и использования этих шаблонов для вывода таких отношений, как гипонимия . Другие подходы используют методы машинного обучения , такие как байесовский вывод и искусственные нейронные сети . [7]

Извлечение ключевых слов

[ редактировать ]

Один из подходов к построению таксономии состоит в том, чтобы автоматически собрать ключевые слова из домена с помощью извлечения ключевых слов , затем проанализировать отношения между ними (см. Гипонимия ниже), а затем организовать их в таксономию на основе этих отношений.

Гипонимия и отношения «есть-а»

[ редактировать ]

В программах АТС одной из важнейших задач является обнаружение гиперонимных и гипонимических отношений между словами. Один из способов сделать это в тексте — найти определенные фразы, такие как «является» и «такой как».

В лингвистике отношения есть-а называются гипонимией . Слова, описывающие категории, называются гиперонимами, а слова, являющиеся примерами категорий, — гипонимами. Например, собака — это гиперним, а Фидо — один из его гипонимов. Слово может быть как гипонимом, так и гиперонимом. Итак, собака — это гипоним млекопитающего , а также гиперним Фидо .

Таксономии часто представляются в виде is-a иерархий , где каждый уровень более специфичен, чем (на математическом языке «подмножество») уровня над ним. Например, базовая биологическая таксономия будет включать такие понятия, как «млекопитающее» , которое является подмножеством животных , и «собаки и кошки» , которые являются подмножествами млекопитающих . Этот вид таксономии называется моделью, поскольку конкретные объекты считаются экземплярами концепции. Например, Фидо — это экземпляр концепта «собака» , а Пушистик — это кот . [8]

Приложения

[ редактировать ]

ATC можно использовать для построения таксономий для поисковых систем , для улучшения результатов поиска.

Системы ATC являются ключевым компонентом обучения онтологий (также известного как автоматическое построение онтологий) и используются для автоматического создания больших онтологий для таких областей, как страхование и финансы. Они также использовались для улучшения существующих крупных сетей, таких как Wordnet, чтобы сделать их более полными и согласованными. [9] [10] [11]

программное обеспечение УВД

[ редактировать ]

Другие имена

[ редактировать ]

Другие названия автоматического построения таксономии включают:

  • Автоматизированное построение контуров
  • Автоматизированное построение контуров
  • Автоматическое создание контуров
  • Автоматическое извлечение контуров
  • Автоматическое создание контуров
  • Автоматизированная индукция контуров
  • Автоматизированное структурное обучение
  • Автоматизированное составление
  • Автоматизированное построение таксономии
  • Автоматизированное построение таксономии
  • Автоматизированное создание таксономии
  • Автоматическое извлечение таксономии
  • Автоматизированное создание таксономии
  • Автоматизированное введение таксономии
  • Автоматизированное обучение таксономии
  • Автоматическое построение контуров
  • Автоматическое построение контуров
  • Автоматическое создание контуров
  • Автоматическое извлечение контуров
  • Автоматическое создание контуров
  • Автоматическая индукция контура
  • Автоматическое обучение контурам
  • Автоматическое построение таксономии
  • Автоматическое создание таксономии
  • Автоматическое извлечение таксономии
  • Автоматическое создание таксономии
  • Автоматическое введение таксономии
  • Автоматическое изучение таксономии
  • Схема автоматизации
  • Контур здания
  • Эскизная конструкция
  • Создание контура
  • Извлечение контуров
  • Создание контура
  • Контурная индукция
  • Краткое обучение
  • Построение семантической таксономии
  • Построение семантической таксономии
  • Создание семантической таксономии
  • Извлечение семантической таксономии
  • Генерация семантической таксономии
  • Индукция семантической таксономии
  • Обучение семантической таксономии
  • Автоматизация таксономии
  • Построение таксономии
  • Построение таксономии
  • Создание таксономии
  • Извлечение таксономии
  • Генерация таксономии
  • Индукция таксономии
  • Изучение таксономии

См. также

[ редактировать ]
  1. ^ «Таксономия» . 10 октября 2021 г.
  2. ^ «Определение и значение таксономии» . Словарь.com . Проверено 13 мая 2022 г.
  3. ^ «Что такое таксономия?» . 14 августа 2017 г.
  4. ^ «ТАКСОНОМИЯ | Значение и определение британского английского языка» . Лексико.com. Архивировано из оригинала 2 марта 2021 года . Проверено 13 мая 2022 г.
  5. ^ «Что такое таксономия?» . 20 августа 2003 г.
  6. ^ «ТАКСОНОМИЯ (существительное) определение и синонимы | Словарь Macmillan» .
  7. ^ Нешати, Махмуд; Алиджамаат, Али; Аболхассани, Хасан; Рахими, Афшин; Хосейни, Мехди (2007). «Обучение таксономии с использованием сложной меры сходства». Международная конференция IEEE/WIC/ACM по веб-аналитике (WI'07) . стр. 487–490. дои : 10.1109/WI.2007.135 . ISBN  978-0-7695-3026-0 . S2CID   14206314 .
  8. ^ Брахман, Рональд (октябрь 1983 г.). «Что есть и чем не является IS-A. Анализ таксономических связей в семантических сетях». IEEE-компьютер . 16 (10): 30–36. дои : 10.1109/MC.1983.1654194 . ОСТИ   5363562 . S2CID   16650410 .
  9. ^ Веларди, Паола; Фаралли, Стефано; Навильи, Роберто (10 октября 2012 г.). «Перезагрузка OntoLearn: графический алгоритм для индукции таксономии». Компьютерная лингвистика . Ассоциация компьютерной лингвистики. CiteSeerX   10.1.1.278.5674 .
  10. ^ Лю, Сюэцин; Сун, Янцю; Лю, Шися ; Ван, Хайсюнь (12–16 августа 2012 г.). «Автоматическое построение таксономии по ключевым словам». Материалы 18-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (PDF) . АКМ. п. 1433. дои : 10.1145/2339530.2339754 . ISBN  9781450314626 . S2CID   9100603 . Проверено 7 марта 2017 г.
  11. ^ Сноу, Рион; Юрафский, Дэниел; Нг, Эндрю. «Индукция семантической таксономии на основе гетерогенных данных» (PDF) . Стэнфордский университет . Проверено 8 марта 2017 г. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5f25478f1890e80910aadfe69344aab8__1701805800
URL1:https://arc.ask3.ru/arc/aa/5f/b8/5f25478f1890e80910aadfe69344aab8.html
Заголовок, (Title) документа по адресу, URL1:
Automatic taxonomy construction - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)