ПропБанк
PropBank — это корпус словесными , аннотированный предложениями и их аргументами, — «банк предложений». Хотя «ПропБанк» относится к конкретному корпусу, созданному Мартой Палмер и др. , [1] термин «пропбанк» также стал использоваться как нарицательное существительное, относящееся к любому корпусу, который был снабжен предложениями и их аргументами.
Проект ПропБанка сыграл свою роль в недавних [ когда? ] исследования в области обработки естественного языка и использовались в маркировке семантических ролей . [2]
Сравнение [ править ]
PropBank отличается от FrameNet , ресурса, с которым его чаще всего сравнивают, по нескольким причинам.
PropBank — это ресурс, ориентированный на глаголы, тогда как FrameNet основан на более абстрактном понятии фреймов, которое обобщает описания для похожих глаголов (например, «описать» и «охарактеризовать»), а также существительных и других слов (например, «описание»). [2] PropBank не комментирует события или положения дел, описанные с помощью существительных. PropBank обязуется аннотировать все глаголы в корпусе, тогда как проект FrameNet выбирает наборы примеров предложений из большого корпуса и лишь в нескольких случаях аннотирует более длинные непрерывные фрагменты текста.
Аннотации в стиле PropBank часто остаются близкими к синтаксическому уровню, тогда как аннотации в стиле FrameNet иногда более семантически мотивированы. С самого начала PropBank был разработан с целью использования в качестве обучающих данных для машинного обучения на основе систем семантической ролевой маркировки . Он требует, чтобы все аргументы глагола были синтаксическими составляющими , а разные значения слова различались только в том случае, если различия касаются аргументов. [3] Из-за таких различий разметка семантических ролей в отношении PropBank часто оказывается несколько более простой задачей, чем создание аннотаций в стиле FrameNet.
См. также [ править ]
Ссылки [ править ]
- ^ Палмер М., Кингсбери П., Гилдеа Д. (2005). «Банк предложений: аннотированный корпус семантических ролей». Компьютерная лингвистика . 31 (1): 71–106. CiteSeerX 10.1.1.136.8985 . дои : 10.1162/0891201053630264 . S2CID 2486369 .
- ↑ Перейти обратно: Перейти обратно: а б Палмер, Марта; Кингсбери, Пол; Гильдеа, Дэниел. «Банк предложений: аннотированный корпус семантических ролей» (PDF) . Университет Рочестера. Архивировано из оригинала (PDF) 28 ноября 2022 года . Проверено 19 марта 2023 г.
- ^ Эдвард Лопер; Сы-тин И и Марта Палмер (2007). «Объединение лексических ресурсов: сопоставление между PropBank и VerbNet» (PDF) . Материалы 7-го Международного семинара по компьютерной лингвистике .