ФреймНет
Эта статья нуждается в дополнительных цитатах для проверки . ( март 2012 г. ) |
ФреймНет | |
---|---|
Заявление о миссии | Построение лексической базы данных на основе теории значения, называемой семантикой фреймов . |
Коммерческий? | Нет (доступен для скачивания бесплатно) |
Тип проекта | Лексическая база данных (содержащая: фреймы, элементы фреймов (FE), лексические единицы (LU), примеры предложений и отношения фреймов) |
Расположение | Международный институт компьютерных наук в Беркли, Калифорния |
Владелец | Коллин Бейкер (нынешний руководитель проекта) |
Основатель | Чарльз Дж. Филлмор |
Учредил | 1997 год |
Веб-сайт | фреймнет |
FrameNet — это группа онлайн- лексических баз данных, основанная на теории значения, известной как семантика фреймов , разработанной лингвистом Чарльзом Дж. Филлмором . Основная идея проекта проста: значения большинства слов лучше всего можно понять с точки зрения семантической рамки, которая представляет собой описание определенного рода события, связи или предмета и его действующих лиц.
Например, для приготовления пищи обычно требуется следующее: повар, готовящаяся пища, контейнер для хранения пищи во время ее приготовления и нагревательный прибор. [1] В FrameNet это действие представлено фреймом с именем Apply_heat и его компоненты ( Готовить , Еда , Контейнер и Heating_instrument ), называются каркасными элементами (FE). Фрейм Apply_heat также перечисляет ряд слов, которые его представляют, известных как лексические единицы (LU), например Fry , Bake , Boil и Broil .
Другие рамки проще. Например, Размещение имеет только действующую силу или причину, тему (то, что размещается) и место, где оно размещается. Некоторые кадры более сложны, например Месть , которая содержит больше FE (преступник, травма, потерпевшая сторона, мститель и наказание). [ нужна ссылка ] Как и в примерах Apply_heat и Как показано ниже, роль FrameNet заключается в определении фреймов и аннотировании предложений, чтобы продемонстрировать, как FE синтаксически соответствуют слову, которое вызывает фрейм. [1]
Концепции [ править ]
Рамки [ править ]
Фрейм — это схематическое изображение ситуации с участием различных участников, реквизита и других концептуальных ролей. Примеры имен кадров: Быть_рожденным и Локативное_отношение . Фрейм в FrameNet содержит текстовое описание того, что он представляет (определение фрейма), связанные элементы фрейма, лексические единицы, примеры предложений и отношения между кадрами.
Элементы рамы [ править ]
Элементы фрейма (FE) предоставляют дополнительную информацию о семантической структуре предложения. Каждый кадр имеет ряд основных и неосновных FE, которые можно рассматривать как семантические роли. Основные FE важны для значения кадра, тогда как неосновные FE обычно носят описательный характер (например, время, место, способ и т. д.). [2] Например:
- Единственный основной FE из Фрейм «Бытие_рождения» называется Ребенок ; непрофильные ИП Время , Место , Средства и т. д. [3]
- Основные ИП передачи Commerce_goods включает в себя Фрейм Продавец , Покупатель и Товары , в то время как непрофильные ИП включают в себя Место , Цель и т. д. [4]
FrameNet включает поверхностные данные о синтаксических ролях, которые элементы фрейма играют в примерах предложений. Например, для такого предложения, как «Она родилась около 460 г. н. э.», FrameNet пометит « Она » как именное словосочетание , относящееся к Дочерний элемент кадра и «около 460 г. н.э.» как существительная группа, соответствующая Элемент временных рамок. Подробности о том, как элементы фрейма могут быть реализованы в предложении, важны, поскольку это раскрывает важную информацию о фреймах подкатегоризации , а также о возможных чередованиях диатезов (например, «Джон разбил окно» и «Окно разбилось») глагола.
Лексические единицы [ править ]
Лексические единицы (ЛЕ) — это леммы со своей частью речи, которые вызывают определенный фрейм. Другими словами, когда LU идентифицируется в предложении, этот конкретный LU может быть связан с его конкретным кадром(ами). Для каждого кадра может быть много LU, связанных с этим кадром, а также может быть много кадров, которые совместно используют определенный LU; обычно это происходит с LU, которые имеют несколько значений слов. [2] Помимо фрейма каждая лексическая единица связана с конкретными элементами фрейма посредством аннотированных примеров предложений.
Например, лексические единицы, вызывающие Фрейм жалобы (или, если точнее, его более конкретные перспективные версии) включает глаголы жаловаться , тетерева , жалобы и другие. [5]
Примеры предложений [ править ]
Фреймы связаны с примерами предложений, а элементы фреймов отмечены внутри предложений. Таким образом, приговор
- Она родилась около 460 года нашей эры.
связан с рамкой «Быть_рожденным» , а «Она» отмечена как элемент фрейма. Ребенок и «около 460 г. н. э.» помечены как Время . [3]
С самого начала проект FrameNet был направлен на изучение фактов фактического использования языка, обнаруженных в таких коллекциях текстов, как Британский национальный корпус . На основе таких примеров предложений инструменты автоматической разметки семантических ролей способны определять фреймы и отмечать элементы фреймов в новых предложениях.
Валентности [ править ]
FrameNet также предоставляет статистику валентности каждого кадра; то есть количество и положение элементов фрейма в примерах предложений. Предложение
- Она родилась около 460 года нашей эры.
попадает в валентный паттерн
- NP Ext, INI --, NP Dep
что встречается дважды в отчете об аннотациях FrameNet для лексическая единицаborn.v , [3] а именно:
- Она родилась и была около 460 года нашей эры дочерью и внучкой римских и византийских императоров, чья семья занимала видное место в римской политике на протяжении более 700 лет.
- Вскоре его отправили в Северную Африку, и он так и не встретил своего единственного ребенка, дочери, родившейся 8 июня 1941 года .
Отношения фреймов [ править ]
FrameNet дополнительно фиксирует отношения между различными кадрами, используя отношения. К ним относятся следующие:
- Наследование : когда один кадр является более конкретной версией другого, более абстрактного родительского кадра. Все, что верно в отношении родительского фрейма, должно быть истинным и в отношении дочернего фрейма, и между элементами родительского фрейма и элементами дочернего фрейма определяется соответствие.
- Перспективизация : нейтральный кадр связан с кадром с определенной перспективой того же сценария. Например, Коммерция_передача-товаров рассматривается с точки зрения покупателя в Commerce_buy и от продавца в Коммерция_продажа .
- Подкадр : некоторые кадры относятся к сложным сценариям, состоящим из нескольких отдельных состояний или событий, которые могут быть описаны отдельными кадрами. Например, Криминальный_процесс состоит из Арест , Суд и так далее.
- Приоритет: это отношение фиксирует временной порядок, который сохраняется между подкадрами сложного кадра. Например, в рамках Кадр цикла_жизни_и_смерти , подкадр Смерти предшествует подрамник Быть_рожденным .
- Каузативный и инхоативный : эти два отношения отмечают для фреймов причинного и инхоативного аспектов отдельный стативный фрейм, к которому они относятся. Например, статив Position_on_a_scale (например, «У нее была высокая зарплата») описывается причинным падежом Cause_change_of_scalar_position (например, «Она повысила ему зарплату») и начальный вариант Измените_позицию_на_шкале (например, «Ее зарплата увеличилась »).
- Использование : это отношение отмечает кадр, который каким-то образом включает в себя другой кадр. Например, Judgment_communication использует оба Суждение и Statement , но не наследуется ни от одного из них, поскольку нет четкого соответствия элементов фрейма.
- См. также : Соединяет кадры, которые имеют некоторое сходство, но требуют тщательного различения.
Приложения [ править ]
FrameNet оказался полезным в ряде вычислительных приложений, поскольку компьютерам нужны дополнительные знания, чтобы распознать, что «Джон продал машину Мэри» и «Мэри купила машину у Джона» описывают по существу одну и ту же ситуацию, несмотря на использование двух совершенно одинаковых ситуаций. разные глаголы, разные предлоги и другой порядок слов. FrameNet использовался в таких приложениях, как ответы на вопросы , перефразирование , распознавание текстовых следствий и извлечение информации , либо напрямую, либо с помощью инструментов разметки семантических ролей . Первая автоматическая система разметки семантических ролей (SRL, иногда также называемая «поверхностным семантическим анализом») была разработана Дэниелом Гилдеа и Дэниелом Джурафски на основе FrameNet в 2002 году. [6] Маркировка семантических ролей с тех пор стала одной из стандартных задач обработки естественного языка, а последняя версия (1.7) FrameNet теперь полностью поддерживается в Natural Language Toolkit . [7]
Поскольку фреймы по сути представляют собой семантические описания, они одинаковы на разных языках, и за прошедшие годы возникло несколько проектов, в которых исходная FrameNet использовалась в качестве основы для дополнительных неанглоязычных сетей FrameNet, среди прочего для испанского, японского, немецкого и польского языков. .
См. также [ править ]
- BabelNet : многоязычная семантическая сеть, объединяющая FrameNet.
- ПропБанк
- ВордНет
- Нулевое создание экземпляра
- Язык фреймов
- UBY : база данных из 10 ресурсов, включая FrameNet.
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б «Что такое FrameNet?» . ФреймНет . Архивировано из оригинала 03 августа 2023 г. Проверено 9 сентября 2023 г.
- ^ Jump up to: Перейти обратно: а б «Глоссарий» . ФреймНет . Архивировано из оригинала 03 августа 2023 г. Проверено 9 сентября 2023 г.
- ^ Jump up to: Перейти обратно: а б с "Being_born.born.v (Аннотация)" . ФреймНет . Архивировано из оригинала 9 сентября 2023 г. Проверено 9 сентября 2023 г.
- ^ «Коммерция_товар-перевод» . ФреймНет . Архивировано из оригинала 9 сентября 2023 г. Проверено 9 сентября 2023 г.
- ^ «Жалоба» . ФреймНет . Архивировано из оригинала 9 сентября 2023 г. Проверено 9 сентября 2023 г.
- ^ Гильдеа, Дэниел; Юрафский, Дэниел (2002). «Автоматическая маркировка семантических ролей» (PDF) . Компьютерная лингвистика . 28 (3): 245–288. дои : 10.1162/089120102760275983 . S2CID 207747200 .
- ^ Шнайдер, Натан; Вутерс, Чак (2017). «API NLTK FrameNet: создание возможностей обнаружения с использованием богатого лингвистического ресурса». EMNLP 2017: Конференция по эмпирическим методам обработки естественного языка . arXiv : 1703.07438 . Бибкод : 2017arXiv170307438S .
Дальнейшее чтение [ править ]
- Руппенхофер, Йозеф; Эллсворт, Майкл; Петрук, Мириам Р.Л.; Джонсон, Кристофер Р.; Бейкер, Коллин Ф.; Шеффчик, Ян (1 ноября 2016 г.). FrameNet II: Расширенная теория и практика (PDF) (переработанная редакция). Беркли, Калифорния: Международный институт компьютерных наук. Архивировано из оригинала (PDF) 26 октября 2022 г.