Маркировка семантических ролей
При естественного языка обработке маркировка семантических ролей (также называемая поверхностным семантическим анализом или заполнением слотов ) — это процесс, который присваивает метки словам или фразам в предложении, указывая их семантическую роль в предложении, например роль агента , цели, или результат.
Он служит для определения смысла предложения. Для этого он определяет аргументы, связанные с , и то , предикатом или глаголом предложения как они классифицируются по своим конкретным ролям . Типичным примером является предложение «Мэри продала книгу Джону». Агент — «Мэри», предикат — «продан» (или, скорее, «продать»), тема — «книга», а получатель — «Джон». Другой пример: для фразы «книга принадлежит мне» потребуются два ярлыка, такие как «обладает» и «владелец», а для «книга была продана Джону» потребуются два других ярлыка, такие как тема и получатель, несмотря на то, что эти два предложения похожи. функциям «субъект» и «объект». [1]
История
[ редактировать ]В 1968 году первая идея разметки семантических ролей была предложена Чарльзом Дж. Филлмором . [2] Его предложение привело к созданию проекта FrameNet , который создал первый крупный вычислительный словарь, систематически описывающий множество предикатов и соответствующие им роли. Дэниел Гилдеа (в настоящее время в Университете Рочестера , ранее в Калифорнийском университете в Беркли / Международном институте компьютерных наук ) и Дэниел Джурафски (в настоящее время преподает в Стэнфордском университете , но ранее работал в Университете Колорадо и Калифорнийском университете в Беркли ) разработали первую автоматическую систему разметки семантических ролей. на основе FrameNet. Корпус PropBank добавил созданные вручную аннотации семантических ролей в Penn Treebank корпус текстов Wall Street Journal . Многие системы автоматической разметки семантических ролей использовали PropBank в качестве набора обучающих данных, чтобы научиться автоматически аннотировать новые предложения. [3]
Использование
[ редактировать ]Маркировка семантических ролей в основном используется машинами для понимания роли слов в предложениях. [4] Это приносит пользу приложениям, подобным программам обработки естественного языка , которым необходимо понимать не только слова языка, но и то, как их можно использовать в различных предложениях. [5] Лучшее понимание семантической ролевой маркировки может привести к прогрессу в вопросах ответов на вопросы , извлечения информации , автоматического суммирования текста , интеллектуального анализа текстовых данных и распознавания речи . [6]
См. также
[ редактировать ]- Распознавание названного объекта
- Лексическая семантика
- Семантический анализ
- Синтаксическое дерево
- Аннотация
Ссылки
[ редактировать ]- ^ Ло, Майкл (13 января 2019 г.). «Если вы еще не знали» . Блог SunJackson (на упрощенном китайском языке) . Проверено 8 декабря 2020 г.
- ^ Боас, Ганс; Дакс, Райан. «Из прошлого в настоящее: от кейс-фреймов к смысловым фреймам» (PDF) .
- ^ Гильдеа, Дэниел; Юрафский, Дэниел (2000). «Автоматическая разметка смысловых ролей» . Материалы 38-го ежегодного собрания Ассоциации компьютерной лингвистики - ACL '00 . Гонконг: Ассоциация компьютерной лингвистики: 512–520. дои : 10.3115/1075218.1075283 .
- ^ Низамани, Сарват; Мемон, Насрулла; Низамани, Саад; Низамани, Сериш (август 2017 г.). «TDC: Модель фрагментации на основе типизированных зависимостей» . Арабский журнал науки и техники . 42 (8): 3585–3595. дои : 10.1007/s13369-017-2587-y . ISSN 2193-567X . S2CID 67233431 .
- ^ Пак, Джехуэй (2019). «Выборочно связанное внимание к себе для разметки семантических ролей». Прикладные науки . 9 (8) – через ProQuest.
- ^ Гильдеа, Дэниел; Юрафский, Дэниел. «Автоматическая маркировка семантических ролей» (PDF) . Ассоциация компьютерной лингвистики . 28 (3).
Внешние ссылки
[ редактировать ]- Общая задача CoNLL-2005: Маркировка семантических ролей
- Illinois Semantic Role Labeler современная система маркировки семантических ролей Демо
- Предлог SRL : определяет семантические отношения, выраженные предлогами.
- Салманасар — еще одна современная система назначения семантических предикатов и ролей.