Jump to content

ФреймНет

ФреймНет
Заявление о миссии Построение лексической базы данных на основе теории значения, называемой семантикой фреймов .
Коммерческий? Нет (доступен для скачивания бесплатно)
Тип проекта Лексическая база данных (содержащая: фреймы, элементы фреймов (FE), лексические единицы (LU), примеры предложений и отношения фреймов)
Расположение Международный институт компьютерных наук в Беркли, Калифорния
Владелец Коллин Бейкер (нынешний руководитель проекта)
Основатель Чарльз Дж. Филлмор
Учредил 1997 год ; 27 лет назад ( 1997 )
Веб-сайт фреймнет .icsi .Беркли .edu

FrameNet — это группа онлайн- лексических баз данных, основанная на теории значения, известной как семантика фреймов , разработанной лингвистом Чарльзом Дж. Филлмором . Основная идея проекта проста: значения большинства слов лучше всего можно понять с точки зрения семантической рамки, которая представляет собой описание определенного рода события, связи или предмета и его действующих лиц.

Например, для приготовления пищи обычно требуется следующее: повар, готовящаяся пища, контейнер для хранения пищи во время ее приготовления и нагревательный прибор. [1] В FrameNet это действие представлено фреймом с именем Apply_heat и его компоненты ( Готовить , Еда , Контейнер и Heating_instrument ), называются каркасными элементами (FE). Фрейм Apply_heat также перечисляет ряд слов, которые его представляют, известных как лексические единицы (LU), например Fry , Bake , Boil и Broil .

Другие рамки проще. Например, Размещение имеет только действующую силу или причину, тему (то, что размещается) и место, где оно размещается. Некоторые кадры более сложны, например Месть , которая содержит больше FE (преступник, травма, потерпевшая сторона, мститель и наказание). [ нужна ссылка ] Как и в примерах Apply_heat и Как показано ниже, роль FrameNet заключается в определении фреймов и аннотировании предложений, чтобы продемонстрировать, как FE синтаксически соответствуют слову, которое вызывает фрейм. [1]

Концепции [ править ]

Рамки [ править ]

Фрейм — это схематическое изображение ситуации с участием различных участников, реквизита и других концептуальных ролей. Примеры имен кадров: Быть_рожденным и Локативное_отношение . Фрейм в FrameNet содержит текстовое описание того, что он представляет (определение фрейма), связанные элементы фрейма, лексические единицы, примеры предложений и отношения между кадрами.

Элементы рамы [ править ]

Элементы фрейма (FE) предоставляют дополнительную информацию о семантической структуре предложения. Каждый кадр имеет ряд основных и неосновных FE, которые можно рассматривать как семантические роли. Основные FE важны для значения кадра, тогда как неосновные FE обычно носят описательный характер (например, время, место, способ и т. д.). [2] Например:

  • Единственный основной FE из Фрейм «Бытие_рождения» называется Ребенок ; непрофильные ИП Время , Место , Средства и т. д. [3]
  • Основные ИП передачи Commerce_goods включает в себя Фрейм Продавец , Покупатель и Товары , в то время как непрофильные ИП включают в себя Место , Цель и т. д. [4]

FrameNet включает поверхностные данные о синтаксических ролях, которые элементы фрейма играют в примерах предложений. Например, для такого предложения, как «Она родилась около 460 г. н. э.», FrameNet пометит « Она » как именное словосочетание , относящееся к Дочерний элемент кадра и «около 460 г. н.э.» как существительная группа, соответствующая Элемент временных рамок. Подробности о том, как элементы фрейма могут быть реализованы в предложении, важны, поскольку это раскрывает важную информацию о фреймах подкатегоризации , а также о возможных чередованиях диатезов (например, «Джон разбил окно» и «Окно разбилось») глагола.

Лексические единицы [ править ]

Лексические единицы (ЛЕ) — это леммы со своей частью речи, которые вызывают определенный фрейм. Другими словами, когда LU идентифицируется в предложении, этот конкретный LU может быть связан с его конкретным кадром(ами). Для каждого кадра может быть много LU, связанных с этим кадром, а также может быть много кадров, которые совместно используют определенный LU; обычно это происходит с LU, которые имеют несколько значений слов. [2] Помимо фрейма каждая лексическая единица связана с конкретными элементами фрейма посредством аннотированных примеров предложений.

Например, лексические единицы, вызывающие Фрейм жалобы (или, если точнее, его более конкретные перспективные версии) включает глаголы жаловаться , тетерева , жалобы и другие. [5]

Примеры предложений [ править ]

Фреймы связаны с примерами предложений, а элементы фреймов отмечены внутри предложений. Таким образом, приговор

Она родилась около 460 года нашей эры.

связан с рамкой «Быть_рожденным» , а «Она» отмечена как элемент фрейма. Ребенок и «около 460 г. н. э.» помечены как Время . [3]

С самого начала проект FrameNet был направлен на изучение фактов фактического использования языка, обнаруженных в таких коллекциях текстов, как Британский национальный корпус . На основе таких примеров предложений инструменты автоматической разметки семантических ролей способны определять фреймы и отмечать элементы фреймов в новых предложениях.

Валентности [ править ]

FrameNet также предоставляет статистику валентности каждого кадра; то есть количество и положение элементов фрейма в примерах предложений. Предложение

Она родилась около 460 года нашей эры.

попадает в валентный паттерн

NP Ext, INI --, NP Dep

что встречается дважды в отчете об аннотациях FrameNet для лексическая единицаborn.v , [3] а именно:

Она родилась и была около 460 года нашей эры дочерью и внучкой римских и византийских императоров, чья семья занимала видное место в римской политике на протяжении более 700 лет.
Вскоре его отправили в Северную Африку, и он так и не встретил своего единственного ребенка, дочери, родившейся 8 июня 1941 года .

Отношения фреймов [ править ]

FrameNet дополнительно фиксирует отношения между различными кадрами, используя отношения. К ним относятся следующие:

  • Наследование : когда один кадр является более конкретной версией другого, более абстрактного родительского кадра. Все, что верно в отношении родительского фрейма, должно быть истинным и в отношении дочернего фрейма, и между элементами родительского фрейма и элементами дочернего фрейма определяется соответствие.
  • Перспективизация : нейтральный кадр связан с кадром с определенной перспективой того же сценария. Например, Коммерция_передача-товаров рассматривается с точки зрения покупателя в Commerce_buy и от продавца в Коммерция_продажа .
  • Подкадр : некоторые кадры относятся к сложным сценариям, состоящим из нескольких отдельных состояний или событий, которые могут быть описаны отдельными кадрами. Например, Криминальный_процесс состоит из Арест , Суд и так далее.
  • Приоритет: это отношение фиксирует временной порядок, который сохраняется между подкадрами сложного кадра. Например, в рамках Кадр цикла_жизни_и_смерти , подкадр Смерти предшествует подрамник Быть_рожденным .
  • Каузативный и инхоативный : эти два отношения отмечают для фреймов причинного и инхоативного аспектов отдельный стативный фрейм, к которому они относятся. Например, статив Position_on_a_scale (например, «У нее была высокая зарплата») описывается причинным падежом Cause_change_of_scalar_position (например, «Она повысила ему зарплату») и начальный вариант Измените_позицию_на_шкале (например, «Ее зарплата увеличилась »).
  • Использование : это отношение отмечает кадр, который каким-то образом включает в себя другой кадр. Например, Judgment_communication использует оба Суждение и Statement , но не наследуется ни от одного из них, поскольку нет четкого соответствия элементов фрейма.
  • См. также : Соединяет кадры, которые имеют некоторое сходство, но требуют тщательного различения.

Приложения [ править ]

FrameNet оказался полезным в ряде вычислительных приложений, поскольку компьютерам нужны дополнительные знания, чтобы распознать, что «Джон продал машину Мэри» и «Мэри купила машину у Джона» описывают по существу одну и ту же ситуацию, несмотря на использование двух совершенно одинаковых ситуаций. разные глаголы, разные предлоги и другой порядок слов. FrameNet использовался в таких приложениях, как ответы на вопросы , перефразирование , распознавание текстовых следствий и извлечение информации , либо напрямую, либо с помощью инструментов разметки семантических ролей . Первая автоматическая система разметки семантических ролей (SRL, иногда также называемая «поверхностным семантическим анализом») была разработана Дэниелом Гилдеа и Дэниелом Джурафски на основе FrameNet в 2002 году. [6] Маркировка семантических ролей с тех пор стала одной из стандартных задач обработки естественного языка, а последняя версия (1.7) FrameNet теперь полностью поддерживается в Natural Language Toolkit . [7]

Поскольку фреймы по сути представляют собой семантические описания, они одинаковы на разных языках, и за прошедшие годы возникло несколько проектов, в которых исходная FrameNet использовалась в качестве основы для дополнительных неанглоязычных сетей FrameNet, среди прочего для испанского, японского, немецкого и польского языков. .

См. также [ править ]

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б «Что такое FrameNet?» . ФреймНет . Архивировано из оригинала 03 августа 2023 г. Проверено 9 сентября 2023 г.
  2. ^ Jump up to: Перейти обратно: а б «Глоссарий» . ФреймНет . Архивировано из оригинала 03 августа 2023 г. Проверено 9 сентября 2023 г.
  3. ^ Jump up to: Перейти обратно: а б с "Being_born.born.v (Аннотация)" . ФреймНет . Архивировано из оригинала 9 сентября 2023 г. Проверено 9 сентября 2023 г.
  4. ^ «Коммерция_товар-перевод» . ФреймНет . Архивировано из оригинала 9 сентября 2023 г. Проверено 9 сентября 2023 г.
  5. ^ «Жалоба» . ФреймНет . Архивировано из оригинала 9 сентября 2023 г. Проверено 9 сентября 2023 г.
  6. ^ Гильдеа, Дэниел; Юрафский, Дэниел (2002). «Автоматическая маркировка семантических ролей» (PDF) . Компьютерная лингвистика . 28 (3): 245–288. дои : 10.1162/089120102760275983 . S2CID   207747200 .
  7. ^ Шнайдер, Натан; Вутерс, Чак (2017). «API NLTK FrameNet: создание возможностей обнаружения с использованием богатого лингвистического ресурса». EMNLP 2017: Конференция по эмпирическим методам обработки естественного языка . arXiv : 1703.07438 . Бибкод : 2017arXiv170307438S .

Дальнейшее чтение [ править ]

  • Руппенхофер, Йозеф; Эллсворт, Майкл; Петрук, Мириам Р.Л.; Джонсон, Кристофер Р.; Бейкер, Коллин Ф.; Шеффчик, Ян (1 ноября 2016 г.). FrameNet II: Расширенная теория и практика (PDF) (переработанная редакция). Беркли, Калифорния: Международный институт компьютерных наук. Архивировано из оригинала (PDF) 26 октября 2022 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: df68cbc970f3f64d5b49e900a81eafd3__1694290920
URL1:https://arc.ask3.ru/arc/aa/df/d3/df68cbc970f3f64d5b49e900a81eafd3.html
Заголовок, (Title) документа по адресу, URL1:
FrameNet - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)