Кореферентность
Эта статья может сбивать с толку или быть непонятной читателям . ( Март 2016 г. ) |
В лингвистике , кореференция иногда письменная кореференция , возникает, когда два или более выражений относятся к одному и тому же человеку или предмету; у них один и тот же референт . Например, в Билле сказано, что Алиса скоро приедет, и она это сделала , слова Алиса и она относятся к одному и тому же человеку. [1]
Соссылка часто нетривиальна для определения. Например, в слове «Билл сказал, что придет» это слово может относиться, а может и не относиться к Биллу. Определение того, какие выражения являются кореференциями, является важной частью анализа или понимания значения и часто требует информации из контекста.знания реального мира, такие как тенденция некоторых имен ассоциироваться с определенными видами («Ровер»), видами артефактов («Титаник»), грамматическими родами или другими свойствами.
Лингвисты обычно используют индексы для обозначения кореференции, как в «Билл, я сказал, что приду » . Такие выражения называются коиндексированными , что указывает на то, что их следует интерпретировать как кореферентные.
Когда выражения являются кореференциальными, первое, что встречается, часто представляет собой полную или описательную форму (например, полное личное имя, возможно, с титулом и ролью), тогда как в последующих случаях используются более короткие формы (например, просто имя, фамилия, или местоимение). Более раннее появление известно как антецедент , а другое называется проформой , анафорой или ссылкой. Однако местоимения иногда могут относиться и вперед, например: «Когда она пришла домой, Алиса пошла спать». В таких случаях кореференцию называют катафорической, а не анафорической.
Кореференция важна для связывания явлений в области синтаксиса. Теория связывания исследует синтаксические отношения, существующие между кореференциальными выражениями в предложениях и текстах.
Типы
[ редактировать ]При исследовании кореференции можно провести многочисленные различия, например, анафору , катафору , разделенные антецеденты, кореферентные именные группы и т. д. [2] Некоторые из этих более конкретных явлений проиллюстрированы здесь:
- Анафора
- а. Музыка звучала так громко, что ею я не мог наслаждаться . – Анафора следует за выражением, к которому она относится (его предшественником).
- б. Наши соседи. Мне не нравится музыка. Если они разозлятся , скоро появятся полицейские. – Анафора они следует за выражением, к которому она относится (его предшественником).
- Катафора
- а. Если они рассердятся на музыку, соседи вызовут полицию. – Катафора предшествует выражению, к которому она относится (его постцедент).
- б. Несмотря на трудности , Вильма поняла суть. – Катафора «her» предшествует выражению, к которому она относится (его постцедент).
- Разделить предшественников
- а. Кэрол, я посоветовал Бобу прийти на вечеринку. Они приехали вместе. – Анафора «они» имеет раздвоенный антецедент, относящийся как к Кэрол , так и к Бобу .
- б. Когда Кэрол помогает , Бобу помогает а Боб Кэрол , . они могут выполнить любую задачу – У анафоры «они» есть раздвоенный антецедент, относящийся как к Кэрол , так и к Бобу .
- Соотносящиеся к существительным фразы
- а. Руководитель проекта отказывается помочь. Придурок, думаю только о себе я . – Корреферентные именное словосочетания, при этом второе именное словосочетание является предикативным по отношению к первому.
- б. Некоторые из наших коллег 1 поддержат нас. Такие люди 1 заслуживают нашей благодарности. – Корреферентные именное словосочетания, при этом второе именное словосочетание является предикативным по отношению к первому.
Связь со связанными переменными
[ редактировать ]Семантики и логики иногда проводят различие между кореференцией и так называемой связанной переменной . [3] Связанные переменные возникают, когда антецедентом проформы является неопределенное количественное выражение, например [4] [ нужны разъяснения ]
- Каждый получил оценку ученик I . – Местоимение his является примером связанной переменной.
- Ни один ученик меня не расстроил из-за его первой оценки. – Местоимение his является примером связанной переменной.
Количественные выражения , такие как «каждый студент» и «ни один студент», не считаются ссылочными. Эти выражения грамматически единичны, но не выделяют отдельных референтов в дискурсе или реальном мире. Таким образом, антецеденты his в этих примерах не являются собственно референтными, как и его . Вместо этого она считается переменной , связанной своим предшественником. Его ссылка варьируется в зависимости от того, о каком из студентов в мире дискурса идет речь. Существование связанных переменных, возможно, более очевидно на следующем примере:
- Только Джеку мне нравится его I класс. – Местоимение his может быть связанной переменной.
Это предложение двусмысленно. Это может означать, что Джеку нравится его оценка, но всем остальным не нравится оценка Джека; или что никому, кроме Джека, не нравится их собственная оценка. В первом значении он кореференциален; во втором случае это связанная переменная, поскольку ее ссылка варьируется по множеству всех учащихся.
Обозначение Coindex обычно используется в обоих случаях. То есть, когда два или более выражений коиндексированы, это не сигнализирует о том, имеете ли вы дело с кореференцией или со связанной переменной (или, как в последнем примере, зависит ли это от интерпретации).
Разрешение кореферента
[ редактировать ]В компьютерной лингвистике разрешение кореферентности является хорошо изученной проблемой в дискурсе . Чтобы получить правильную интерпретацию текста или даже оценить относительную важность различных упомянутых предметов, местоимения и другие референтные выражения должны быть связаны с нужными людьми. Алгоритмы, предназначенные для разрешения кореференций, обычно сначала ищут ближайшего предшествующего индивидуума, совместимого с ссылающимся выражением. Например, она может привязываться к предыдущему выражению, такому как женщина или Энн , но не так вероятно, как к Биллу . Такие местоимения, как он, имеют гораздо более строгие ограничения. Как и во многих лингвистических задачах, существует компромисс между точностью и запоминаемостью . Метрики качества кластера , обычно используемые для оценки алгоритмов разрешения кореференции, включают индекс Рэнда , скорректированный индекс Рэнда и различные взаимной информации методы, основанные на .
Особую проблему при разрешении кореференций в английском языке представляет местоимение it , которое имеет множество применений. Оно может относиться так же, как он и она , за исключением того, что обычно оно относится к неодушевленным объектам (правила на самом деле более сложны: животные могут быть любыми из них , он или она ; корабли традиционно являются ею ; ураганы обычно являются им, несмотря на гендерные имена). ). Это также может относиться к абстракциям, а не к существам, например, Ему платили минимальную зарплату, но он, похоже, не возражал против этого. Наконец, у него также есть плеонастическое использование, не относящееся ни к чему конкретному:
- Идет дождь.
- Это действительно позор.
- Чтобы добиться успеха, нужно много работать.
- Иногда . наибольшее влияние имеют самые громкие люди
Плеонастическое использование не считается референциальным и поэтому не является частью кореференции. [5]
Подходы к разрешению кореференций можно в общих чертах разделить на алгоритмы пары упоминаний, алгоритмы ранжирования упоминаний или алгоритмы на основе сущностей. Алгоритмы пар упоминаний включают бинарные решения, если пара из двух упоминаний принадлежит одному и тому же объекту. Ограничения на уровне сущности, такие как пол, не учитываются, что приводит к распространению ошибок . Например, местоимения он или она оба могут иметь высокую вероятность кореферентности с учителем , но не могут быть кореферентны друг с другом. Алгоритмы ранжирования упоминаний развивают эту идею, но вместо этого предусматривают, что одно упоминание может быть корреферентным только с одним (предыдущим) упоминанием. В результате каждому предыдущему упоминанию должна быть присвоена оценка, и привязывается упоминание с наивысшим баллом (или отсутствие упоминания). Наконец, в методах, основанных на сущностях, упоминания связываются на основе информации всей цепочки ссылок, а не отдельных упоминаний. Представление цепочки переменной ширины является более сложным и затратным в вычислительном отношении, чем методы, основанные на упоминаниях, что приводит к тому, что эти алгоритмы в основном основаны на нейронных сетей архитектуры .
См. также
[ редактировать ]- Анафора (лингвистика) - использование выражения, интерпретация которого зависит от контекста.
- Антецедент - выражение, которое придает значение проформе в грамматике.
- Связывание – Распределение анафорических элементов
- Катафора – использование выражения или слова, которое относится к более позднему, более конкретному выражению.
- Ближайший референт
- Переключатель-ссылка - Понятие в лингвистике
- Разрешение смысловой неоднозначности - определение того, какой смысл слова используется.
Примечания
[ редактировать ]- ^ Определения кореференции см., например, Crystal (1997:94) и Radford (2004:332).
- ^ Эти различия (анафора, катафора, разделенные антецеденты, коррелирующие именные фразы и т. д.) обсуждаются у Юрафски и Мартина (2000:669ff).
- ^ Обсуждение связанных переменных см., например, в Portner (2005:102ff.).
- ^ См. Джурафски и Мартин (2000:701) для примера связанной переменной, подобной приведенной здесь.
- ^ Ли и др. (2009) продемонстрировали высокую точность в сортировке плеонастических изображений , и этот успех обещает улучшить точность определения кореферентности в целом.
Ссылки
[ редактировать ]- Кристалл, Д. 1997. Словарь лингвистики и фонетики. 4-е издание. Кембридж, Массачусетс: Blackwell Publishing.
- Джурафски Д. и Х. Мартин 2000. Речь и языковая обработка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи. Нью-Дели, Индия: Pearson Education.
- Портнер, П. 2005. Что такое семантика?: Основы формальной семантики. Молден, Массачусетс: Blackwell Publishing.
- Рэдфорд, А. 2004. Английский синтаксис: введение . Кембридж, Великобритания: Издательство Кембриджского университета.
- Ли, Ю., П. Мусилек, М. Реформат и Л. Уайард-Скотт, 2009. Идентификация плеонастического заболевания с помощью Интернета. Архивировано 26 октября 2022 г. на Wayback Machine . Журнал исследований искусственного интеллекта 34, 339–389.