Разрешение имен (семантика и извлечение текста)
В семантике и извлечении текста разрешение имен относится к способности программного обеспечения для интеллектуального анализа текста определять, к какому реальному человеку, актеру или объекту относится конкретное использование имени. Это также можно назвать разрешением сущности .
Разрешение имени в простом тексте
[ редактировать ]Например, в области анализа текста программному обеспечению часто необходимо интерпретировать следующий текст:
Джон дал Эдварду книгу. Затем он встал и крикнул Джону, чтобы тот вернулся в комнату.
В этих предложениях программа должна определить, относится ли местоимение «он» к «Джону» или к «Эдварду» из первого предложения. Программное обеспечение также должно определить, является ли «Джон», упомянутый во втором предложении, тем же, что и «Джон» в первом предложении, или третьим лицом, имя которого также является «Джоном». Подобные примеры применимы практически ко всем языкам, а не только к английскому.
Разрешение имен в документах
[ редактировать ]Часто этот тип разрешения имени также используется в документах, например, чтобы определить, является ли « Джордж Буш », упомянутый в старой газетной статье как президент Соединенных Штатов ( Джордж Буш-старший ), тем же человеком, что и «Джордж Буш». Годы спустя в отдельной новостной статье упоминается о человеке, баллотирующемся на пост президента ( Джордж Буш ). идентичные ссылки («Джордж Буш») на самом деле относятся к одному и тому же конкретному лицу или лицу.
Разрешение имени/сущности при извлечении текста и семантике является общеизвестно сложной проблемой, отчасти потому, что во многих случаях для точного определения недостаточно информации. Существует множество частичных решений, основанных на конкретных контекстных подсказках, обнаруженных в данных, но общего решения в настоящее время не известно.
Эту проблему иногда называют устранением неоднозначности имени, а в случае цифровых библиотек — устранением неоднозначности автора.
Примеры программного обеспечения, которое может обеспечить преимущества разрешения имен, см. также:
- Аэротекст
- АлхимияAPI
- Внимательность
- Автономия
- Базовая технология
- API Dandelion , обеспечивающий настраиваемый подход к разрешению имен с использованием внутреннего графа знаний (построенного на основе Википедии, DBpedia и других источников).
- DBpedia Spotlight , предоставляющий простой подход к разрешению имен с использованием DBpedia и Wikipedia.
- NetOwl