Jump to content

Кореферентность

(Перенаправлено с Co-reference )

В лингвистике , кореференция иногда письменная кореференция , возникает, когда два или более выражений относятся к одному и тому же человеку или предмету; у них один и тот же референт . Например, в Билле сказано, что Алиса скоро приедет, и она это сделала , слова Алиса и она относятся к одному и тому же человеку. [1]

Соссылка часто нетривиальна для определения. Например, в слове «Билл сказал, что придет» это слово может относиться, а может и не относиться к Биллу. Определение того, какие выражения являются кореференциями, является важной частью анализа или понимания значения и часто требует информации из контекста.знания реального мира, такие как тенденция некоторых имен ассоциироваться с определенными видами («Ровер»), видами артефактов («Титаник»), грамматическими родами или другими свойствами.

Лингвисты обычно используют индексы для обозначения кореференции, как в «Билл, я сказал, что приду » . Такие выражения называются коиндексированными , что указывает на то, что их следует интерпретировать как кореферентные.

Когда выражения являются кореференциальными, первое, что встречается, часто представляет собой полную или описательную форму (например, полное личное имя, возможно, с титулом и ролью), тогда как в последующих случаях используются более короткие формы (например, просто имя, фамилия, или местоимение). Более раннее появление известно как антецедент , а другое называется проформой , анафорой или ссылкой. Однако местоимения иногда могут относиться и вперед, например: «Когда она пришла домой, Алиса пошла спать». В таких случаях кореференцию называют катафорической, а не анафорической.

Кореференция важна для связывания явлений в области синтаксиса. Теория связывания исследует синтаксические отношения, существующие между кореференциальными выражениями в предложениях и текстах.

При исследовании кореференции можно провести многочисленные различия, например, анафору , катафору , разделенные антецеденты, кореферентные именные группы и т. д. [2] Некоторые из этих более конкретных явлений проиллюстрированы здесь:

Анафора
а. Музыка звучала так громко, что ею я не мог наслаждаться . – Анафора следует за выражением, к которому она относится (его предшественником).
б. Наши соседи. Мне не нравится музыка. Если они разозлятся , скоро появятся полицейские. – Анафора они следует за выражением, к которому она относится (его предшественником).
Катафора
а. Если они рассердятся на музыку, соседи вызовут полицию. – Катафора предшествует выражению, к которому она относится (его постцедент).
б. Несмотря на трудности , Вильма поняла суть. – Катафора «her» предшествует выражению, к которому она относится (его постцедент).
Разделить предшественников
а. Кэрол, я посоветовал Бобу прийти на вечеринку. Они приехали вместе. – Анафора «они» имеет раздвоенный антецедент, относящийся как к Кэрол , так и к Бобу .
б. Когда Кэрол помогает , Бобу помогает а Боб Кэрол , . они могут выполнить любую задачу – У анафоры «они» есть раздвоенный антецедент, относящийся как к Кэрол , так и к Бобу .
Соотносящиеся к существительным фразы
а. Руководитель проекта отказывается помочь. Придурок, думаю только о себе я . – Корреферентные именное словосочетания, при этом второе именное словосочетание является предикативным по отношению к первому.
б. Некоторые из наших коллег 1 поддержат нас. Такие люди 1 заслуживают нашей благодарности. – Корреферентные именное словосочетания, при этом второе именное словосочетание является предикативным по отношению к первому.

Связь со связанными переменными

[ редактировать ]

Семантики и логики иногда проводят различие между кореференцией и так называемой связанной переменной . [3] Связанные переменные возникают, когда антецедентом проформы является неопределенное количественное выражение, например [4] [ нужны разъяснения ]

  1. Каждый получил оценку ученик I . – Местоимение his является примером связанной переменной.
  2. Ни один ученик меня не расстроил из-за его первой оценки. – Местоимение his является примером связанной переменной.

Количественные выражения , такие как «каждый студент» и «ни один студент», не считаются ссылочными. Эти выражения грамматически единичны, но не выделяют отдельных референтов в дискурсе или реальном мире. Таким образом, антецеденты his в этих примерах не являются собственно референтными, как и его . Вместо этого она считается переменной , связанной своим предшественником. Его ссылка варьируется в зависимости от того, о каком из студентов в мире дискурса идет речь. Существование связанных переменных, возможно, более очевидно на следующем примере:

  1. Только Джеку мне нравится его I класс. – Местоимение his может быть связанной переменной.

Это предложение двусмысленно. Это может означать, что Джеку нравится его оценка, но всем остальным не нравится оценка Джека; или что никому, кроме Джека, не нравится их собственная оценка. В первом значении он кореференциален; во втором случае это связанная переменная, поскольку ее ссылка варьируется по множеству всех учащихся.

Обозначение Coindex обычно используется в обоих случаях. То есть, когда два или более выражений коиндексированы, это не сигнализирует о том, имеете ли вы дело с кореференцией или со связанной переменной (или, как в последнем примере, зависит ли это от интерпретации).

Разрешение кореферента

[ редактировать ]

В компьютерной лингвистике разрешение кореферентности является хорошо изученной проблемой в дискурсе . Чтобы получить правильную интерпретацию текста или даже оценить относительную важность различных упомянутых предметов, местоимения и другие референтные выражения должны быть связаны с нужными людьми. Алгоритмы, предназначенные для разрешения кореференций, обычно сначала ищут ближайшего предшествующего индивидуума, совместимого с ссылающимся выражением. Например, она может привязываться к предыдущему выражению, такому как женщина или Энн , но не так вероятно, как к Биллу . Такие местоимения, как он, имеют гораздо более строгие ограничения. Как и во многих лингвистических задачах, существует компромисс между точностью и запоминаемостью . Метрики качества кластера , обычно используемые для оценки алгоритмов разрешения кореференции, включают индекс Рэнда , скорректированный индекс Рэнда и различные взаимной информации методы, основанные на .

Особую проблему при разрешении кореференций в английском языке представляет местоимение it , которое имеет множество применений. Оно может относиться так же, как он и она , за исключением того, что обычно оно относится к неодушевленным объектам (правила на самом деле более сложны: животные могут быть любыми из них , он или она ; корабли традиционно являются ею ; ураганы обычно являются им, несмотря на гендерные имена). ). Это также может относиться к абстракциям, а не к существам, например, Ему платили минимальную зарплату, но он, похоже, не возражал против этого. Наконец, у него также есть плеонастическое использование, не относящееся ни к чему конкретному:

  1. Идет дождь.
  2. Это действительно позор.
  3. Чтобы добиться успеха, нужно много работать.
  4. Иногда . наибольшее влияние имеют самые громкие люди

Плеонастическое использование не считается референциальным и поэтому не является частью кореференции. [5]

Подходы к разрешению кореференций можно в общих чертах разделить на алгоритмы пары упоминаний, алгоритмы ранжирования упоминаний или алгоритмы на основе сущностей. Алгоритмы пар упоминаний включают бинарные решения, если пара из двух упоминаний принадлежит одному и тому же объекту. Ограничения на уровне сущности, такие как пол, не учитываются, что приводит к распространению ошибок . Например, местоимения он или она оба могут иметь высокую вероятность кореферентности с учителем , но не могут быть кореферентны друг с другом. Алгоритмы ранжирования упоминаний развивают эту идею, но вместо этого предусматривают, что одно упоминание может быть корреферентным только с одним (предыдущим) упоминанием. В результате каждому предыдущему упоминанию должна быть присвоена оценка, и привязывается упоминание с наивысшим баллом (или отсутствие упоминания). Наконец, в методах, основанных на сущностях, упоминания связываются на основе информации всей цепочки ссылок, а не отдельных упоминаний. Представление цепочки переменной ширины является более сложным и затратным в вычислительном отношении, чем методы, основанные на упоминаниях, что приводит к тому, что эти алгоритмы в основном основаны на нейронных сетей архитектуры .

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Определения кореференции см., например, Crystal (1997:94) и Radford (2004:332).
  2. ^ Эти различия (анафора, катафора, разделенные антецеденты, коррелирующие именные фразы и т. д.) обсуждаются у Юрафски и Мартина (2000:669ff).
  3. ^ Обсуждение связанных переменных см., например, в Portner (2005:102ff.).
  4. ^ См. Джурафски и Мартин (2000:701) для примера связанной переменной, подобной приведенной здесь.
  5. ^ Ли и др. (2009) продемонстрировали высокую точность в сортировке плеонастических изображений , и этот успех обещает улучшить точность определения кореферентности в целом.
  • Кристалл, Д. 1997. Словарь лингвистики и фонетики. 4-е издание. Кембридж, Массачусетс: Blackwell Publishing.
  • Джурафски Д. и Х. Мартин 2000. Речь и языковая обработка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи. Нью-Дели, Индия: Pearson Education.
  • Портнер, П. 2005. Что такое семантика?: Основы формальной семантики. Молден, Массачусетс: Blackwell Publishing.
  • Рэдфорд, А. 2004. Английский синтаксис: введение . Кембридж, Великобритания: Издательство Кембриджского университета.
  • Ли, Ю., П. Мусилек, М. Реформат и Л. Уайард-Скотт, 2009. Идентификация плеонастического заболевания с помощью Интернета. Архивировано 26 октября 2022 г. на Wayback Machine . Журнал исследований искусственного интеллекта 34, 339–389.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4be21623c6a6dbd40755b05a9cd9d5e0__1703335200
URL1:https://arc.ask3.ru/arc/aa/4b/e0/4be21623c6a6dbd40755b05a9cd9d5e0.html
Заголовок, (Title) документа по адресу, URL1:
Coreference - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)