~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ BFAF0218E310C3E8A59A85A32ABC1880__1703555520 ✰
Заголовок документа оригинал.:
✰ Ontology learning - Wikipedia ✰
Заголовок документа перевод.:
✰ Обучение онтологии — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Ontology_learning ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/bf/80/bfaf0218e310c3e8a59a85a32abc1880.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/bf/80/bfaf0218e310c3e8a59a85a32abc1880__translat.html ✰
Дата и время сохранения документа:
✰ 22.06.2024 01:14:56 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 26 December 2023, at 04:52 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Обучение онтологии — Википедия Jump to content

Обучение онтологии

Из Википедии, бесплатной энциклопедии

Изучение онтологий ( извлечение онтологий , генерация онтологий или приобретение онтологий ) — это автоматическое или полуавтоматическое создание онтологий , включая извлечение соответствующих терминов предметной области и отношений между понятиями , которые эти термины представляют, из корпуса текста на естественном языке, а также кодирование. их с языком онтологий для облегчения поиска. Поскольку построение онтологий вручную чрезвычайно трудоемко и занимает много времени, существует большая мотивация автоматизировать этот процесс.

Обычно процесс начинается с извлечения терминов и концепций или именной фразы из простого текста с использованием лингвистических процессоров, таких как разметка частей речи и фрагментирование фраз . Затем статистические [1] или символический [2] [3] методы используются для извлечения подписей отношений , часто на основе шаблонов. [4] или на основе определений [5] Методы извлечения гиперонимов.

Процедура [ править ]

Обучение онтологий (OL) используется для (полу)автоматического извлечения целых онтологий из текста на естественном языке. [6] [7] Процесс обычно разбивается на следующие восемь задач, которые не обязательно применяются в каждой системе обучения онтологии.

Извлечение терминологии предметной области [ править ]

На этапе извлечения терминологии предметной области извлекаются термины, специфичные для предметной области, которые используются на следующем этапе (обнаружение понятий) для получения понятий. Соответствующие условия могут быть определены, например, путем расчета значений TF/IDF или путем применения метода C-значения/NC-значения. Полученный список терминов должен быть отфильтрован экспертом в предметной области. На последующем этапе, аналогично разрешению кореференций при извлечении информации , система OL определяет синонимы, поскольку они имеют одно и то же значение и, следовательно, соответствуют одной и той же концепции. Поэтому наиболее распространенными методами являются кластеризация и применение статистических мер сходства.

Открытие концепции [ править ]

На этапе открытия понятий термины группируются в смысловые единицы, которые соответствуют абстракции мира и, следовательно, понятиям . Сгруппированные термины — это термины, специфичные для предметной области, и их синонимы, которые были идентифицированы на этапе извлечения терминологии предметной области.

иерархии Вывод понятий

На этапе построения иерархии понятий система OL пытается упорядочить извлеченные понятия в таксономической структуре. В основном это достигается с помощью неконтролируемых методов иерархической кластеризации . Поскольку результат таких методов часто бывает зашумлен, добавляется этап контроля, например, оценка пользователем. Существует еще один метод вывода иерархии понятий, заключающийся в использовании нескольких шаблонов, которые должны указывать на отношения суб- или суперсуммации . Такие шаблоны, как «X, то есть Y» или «X — это Y», указывают на то, что X является подклассом Y. Такие шаблоны можно эффективно анализировать, но они часто встречаются слишком редко, чтобы можно было извлечь достаточное количество отношений под- или суперсуммации. Вместо этого разрабатываются методы начальной загрузки, которые автоматически изучают эти шаблоны и, следовательно, обеспечивают более широкий охват.

нетаксономических отношений Изучение

На этапе изучения нетаксономических отношений извлекаются отношения, которые не выражают каких-либо суб- или суперсумпций. К таким отношениям относятся, например, отношения «работа для» или «место нахождения». Существует два распространенных подхода к решению этой подзадачи. Первый основан на извлечении анонимных ассоциаций, которым на втором этапе присваиваются соответствующие имена. Второй подход извлекает глаголы, которые указывают на отношения между сущностями, представленными окружающими словами. Результат обоих подходов должен быть оценен онтологом для обеспечения точности.

Обнаружение правил [ править ]

Во время правила обнаружения [8] Для извлеченных понятий генерируются аксиомы (формальное описание понятий). Этого можно достичь, например, путем анализа синтаксической структуры определения естественного языка и применения правил преобразования к полученному дереву зависимостей. Результатом этого процесса является список аксиом, который впоследствии доводится до описания понятия. Затем этот результат оценивается онтологом.

Популяция онтологии [ править ]

На этом этапе онтология дополняется экземплярами концепций и свойств. Для пополнения экземплярами понятий используются методы, основанные на сопоставлении лексико-синтаксических закономерностей. Экземпляры свойств добавляются посредством применения методов начальной загрузки , которые собирают кортежи отношений.

Расширение иерархии понятий [ править ]

На этом этапе система OL пытается расширить таксономическую структуру существующей онтологии дополнительными концепциями. Это может быть выполнено контролируемым образом с помощью обученного классификатора или неконтролируемым образом с применением мер сходства .

Обнаружение кадров и событий [ править ]

Во время обнаружения кадра/события система OL пытается извлечь из текста сложные взаимосвязи, например, кто откуда, в какое место и когда отправился. Подходы варьируются от применения SVM с методами ядра до маркировки семантических ролей (SRL). [9] к методам глубокого семантического анализа . [10]

Инструменты [ править ]

Dog4Dag (Дрезденский генератор онтологий для направленных ациклических графов) — это плагин для создания онтологий для Protégé 4.1 и OBOEdit 2.1. Это позволяет генерировать термины, генерировать одноуровневые элементы, генерировать определения и устанавливать отношения. DOG4DAG, интегрированный в Protégé 4.1 и OBO-Edit 2.1, позволяет расширять онтологии для всех распространенных форматов онтологий (например, OWL и OBO). В основном ограничивается расширениями служб поиска EBI и Bio Portal. [11]

См. также [ править ]

Библиография [ править ]

  • П. Буителаар, П. Чимиано (ред.). Обучение онтологии и популяция: преодоление разрыва между текстом и знаниями , информация о серии «Границы в искусственном интеллекте и приложениях» , IOS Press, 2008.
  • П. Буителаар, П. Чимиано и Б. Маньини (ред.). Обучение онтологии из текста: методы, оценка и приложения , информация о серии «Границы в области искусственного интеллекта и приложений» , IOS Press, 2005.
  • Вонг, В. (2009), « Изучение облегченных онтологий из текста в разных областях с использованием Интернета в качестве базовых знаний». [ постоянная мертвая ссылка ] Диссертация доктора философии, Университет Западной Австралии.
  • Вонг В., Лю В. и Беннамун М. (2012), « Обучение онтологии из текста: взгляд назад и в будущее ». Обзоры ACM Computing, том 44, выпуск 4, страницы 20:1–20:36.
  • Томас Вехтер, Гетц Фабиан, Михаэль Шредер: DOG4DAG: полуавтоматическое создание онтологий в OBO-Edit и Protégé. SWAT4LS Лондон, 2011 г. дои : 10.1145/2166896.2166926

Ссылки [ править ]

  1. ^ А. Маедче и С.Стааб. Изучение онтологий для семантической сети . В Semantic Web Worskhop 2001.
  2. ^ Роберто Навильи и Паола Веларди . Изучение онтологий предметной области из хранилищ документов и специализированных веб-сайтов , Компьютерная лингвистика, 30 (2), MIT Press, 2004, стр. 151–179.
  3. ^ П.Веларди, С.Фаралли, Р.Навильи. OntoLearn Reloaded: графовый алгоритм для индукции таксономии . Компьютерная лингвистика, 39(3), MIT Press, 2013, стр.665–707.
  4. ^ Марти А. Херст. Автоматическое получение гипонимов из больших текстовых корпусов . В материалах четырнадцатой Международной конференции по компьютерной лингвистике, страницы 539–545, Нант, Франция, июль 1992 г.
  5. ^ Р.Навильи, П. Веларди. Изучение решеток словесных классов для определения и извлечения гипернимов . Протокол 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2010), Уппсала, Швеция, 11–16 июля 2010 г., стр. 1318-1327.
  6. ^ Чимиано, Филипп; Фёлькер, Йоханна; Студер, Руди (2006). «Онтологии по требованию? - Описание современного состояния, приложений, проблем и тенденций обучения онтологии на основе текста», Information, Wissenschaft und Praxis , 57, стр. 315–320, http://people.aifb.kit.edu/pci/Publications/iwp06.pdf%5B%5D (дата обращения: 18.06.2012).
  7. ^ Вонг, В., Лю, В. и Беннамун, М. (2012), « Обучение онтологии из текста: взгляд назад и в будущее ». Обзоры ACM Computing, том 44, выпуск 4, страницы 20:1–20:36.
  8. ^ Йоханна Фёлькер; Паскаль Хитцлер ; Чимиано, Филипп (2007). «Получение аксиом OWL DL из лексических ресурсов», Материалы 4-й европейской конференции по семантической сети , с. 670–685, http://smartweb.dfki.de/Vortraege/lexo_2007.pdf (дата обращения: 18.06.2012).
  9. ^ Коппола Б.; Гангеми А.; Глиоццо А.; Пикка Д.; Пресутти В. (2009). « Обнаружение кадров в семантической сети », Труды Европейской конференции по семантической сети (ESWC2009), Springer, 2009.
  10. ^ Пресутти В.; Драйккио Ф.; Гангеми А. (2009). « Извлечение знаний на основе теории репрезентации дискурса и лингвистических фреймов », Материалы конференции по инженерии знаний и управлению знаниями (EKAW2012), LNCS, Springer, 2012.
  11. ^ Томасвахтер, Гетц Фабиан, Михаэль Шредер: DOG4DAG: полуавтоматическое создание онтологий в OBO-Edit и Protégé. SWAT4LS Лондон, 2011 г. doi : 10.1145/2166896.2166926 http://www.biotec.tu-dresden.de/research/schroeder/dog4dag/


Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: BFAF0218E310C3E8A59A85A32ABC1880__1703555520
URL1:https://en.wikipedia.org/wiki/Ontology_learning
Заголовок, (Title) документа по адресу, URL1:
Ontology learning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)