Создание ссылающегося выражения

Генерация ссылающихся выражений ( REG ) — это подзадача генерации естественного языка (NLG), которая привлекла наибольшее внимание ученых. В то время как NLG занимается преобразованием нелингвистической информации в естественный язык, REG фокусируется только на создании ссылающихся выражений (именных фраз), которые идентифицируют конкретные объекты, называемые целями .

Эту задачу можно разделить на два раздела. Часть выбора контента определяет, какой набор свойств отличает намеченную цель, а часть лингвистической реализации определяет, как эти свойства переводятся на естественный язык. В сообществе NLG было разработано множество алгоритмов для генерации различных типов ссылающихся выражений.

Типы ссылающихся выражений

( Референтное выражение RE) в лингвистике — это любое именное словосочетание или его суррогат, функция которого в дискурсе заключается в идентификации некоторого отдельного объекта (вещи, существа, события...). Техническая терминология идентификации . сильно различается переходить из одной лингвистической школы в другую. Самый распространенный термин, вероятно, — это референт , а идентифицируемая вещь — это референт , как, например, в работе Джона Лайонса . В лингвистике изучение референтных отношений относится к прагматике , изучению использования языка, хотя оно также представляет большой интерес для философов, особенно тех, кто желает понять природу знания , восприятия и познания в более общем плане.

Для референции могут использоваться различные средства: определители , местоимения , имена собственные ... Референтные отношения могут быть различного рода; референты могут находиться в «реальном» или воображаемом мире, в самом дискурсе, и они могут быть единичными, множественными или собирательными.

Местоимения

Простейшим типом референтных выражений являются такие местоимения , как он и оно . Сообщества лингвистов и специалистов по обработке естественного языка разработали различные модели для прогнозирования референтов анафоры, такие как теория центрирования, ^[1] и в идеале генерация ссылающихся выражений должна основываться на таких моделях. Однако большинство систем NLG используют гораздо более простые алгоритмы, например, используют местоимение, если референт был упомянут в предыдущем предложении (или предложении), и в этом предложении не было упомянуто никакое другое существо того же пола.

Определенные существительные

Было проведено значительное количество исследований по созданию определенных именных групп, таких как большая красная книга . Во многом это основано на модели, предложенной Дейлом и Рейтером. ^[2] Это расширялось различными способами, например, Krahmer et al. ^[3] представить теоретико-графовую модель определенного поколения NP со многими приятными свойствами. В последние годы на мероприятии с совместными задачами сравнивались различные алгоритмы генерации определенных NP с использованием TUNA. ^[4] корпус.

Пространственная и временная привязка

Недавно было проведено больше исследований по созданию референтных выражений для времени и пространства. Такие ссылки, как правило, неточны (каково точное значение слова «сегодня вечером» ?), а также разные люди интерпретируют их по-разному. ^[5] Следовательно, может возникнуть необходимость явно рассуждать о компромиссах между ложноположительным и ложноотрицательным и даже рассчитать полезность различных возможных ссылающихся выражений в конкретном контексте задачи. ^[6]

Критерии хороших выражений

В идеале хорошее ссылающееся выражение должно удовлетворять ряду критериев:

Референтный успех : он должен однозначно идентифицировать референт для читателя.
Легкость понимания : читатель должен иметь возможность быстро прочитать и понять текст.
Вычислительная сложность : алгоритм генерации должен быть быстрым.
Никаких ложных выводов : выражение не должно смущать или вводить читателя в заблуждение, предлагая ложные подразумеваемые выводы или другие прагматические выводы. Например, читатель может смутиться, если ему скажут «Сядьте у коричневого деревянного стола» в контексте, где есть только один стол. ^[2]

История

Эпоха до 2000 года

REG восходит к первым дням существования NLG. Один из первых подходов был сделан Виноградом. ^[7] в 1972 году он разработал « инкрементальный » алгоритм REG для своей программы SHRDLU . Впоследствии в 1980-х годах исследователи начали моделировать человеческие способности создавать референтные выражения. На этот новый подход к теме повлияли исследователи Аппельт и Кронфельд, создавшие программы KAMP и BERTRAND. ^[8]^[9]^[10] и рассматривал речевые выражения как части более крупных речевых актов.

Некоторые из их наиболее интересных открытий заключались в том, что референтные выражения могут использоваться для добавления информации помимо идентификации референта. ^[9] а также влияние коммуникативного контекста и максим Грайса на референтные выражения. ^[8] Более того, его скептицизм относительно естественности минимальных описаний сделал исследование Аппельта и Кронфельда основой более поздних работ по REG.

Поиск простых, четко определенных задач изменил направление исследований в начале 1990-х годов. Этот новый подход был предложен Дейлом и Рейтером, которые подчеркнули, что идентификация референта является главной целью. ^[11]^[12]^[13]^[14] Нравится ^[8] они обсуждают связь между максимами Грайса и относящимися к ним выражениями в своей кульминационной статье. ^[2] в котором они также предлагают формальное определение проблемы . Кроме того, Рейтер и Дейл обсуждают алгоритмы полной краткости и жадной эвристики , а также их инкрементный алгоритм (IA), который стал одним из наиболее важных алгоритмов в REG. ^{[примечание 1]}

Более поздние события

После 2000 года исследования начали снимать некоторые упрощающие предположения, которые были сделаны в ранних исследованиях REG, чтобы создать более простые алгоритмы. Различные исследовательские группы сосредоточились на разных ограничениях, создав несколько расширенных алгоритмов. Часто они расширяют ВА в одной перспективе, например, в отношении:

Отсылка к таким наборам , как «носители футболок» или «зеленые яблоки и банан слева». ^[15]^[16]^[17]^[18]
Реляционные описания , такие как «чашка на столе» или «женщина, у которой трое детей». ^[19]^[20]^[21]^[22]^[23]
Зависимость от контекста , неясность и возможность уклона включают такие утверждения, как «пожилой мужчина» или «машина слева», которые часто неясны без контекста. ^[6]^[24]^[25]
Выраженность и генерация местоимений во многом зависят от дискурса, например, «она» относится к «(наиболее заметному) человеку женского пола». ^[26]^[27]^[28]^[29]^[30]^[31]^[32]

Многие упрощающие предположения все еще действуют или над ними только начали работать. Кроме того, еще предстоит осуществить комбинацию различных расширений, которую Крамер и ван Деемтер называют «нетривиальным предприятием». ^[33]

Еще одним важным изменением после 2000 года стало более широкое использование эмпирических исследований для оценки алгоритмов. Такое развитие произошло благодаря появлению прозрачных корпусов . Хотя до сих пор ведутся дискуссии о том, какие метрики оценки являются лучшими, использование экспериментальной оценки уже привело к лучшей сопоставимости алгоритмов, обсуждению целей REG и более целенаправленным исследованиям.

Кроме того, исследования расширили свой диапазон до смежных тем, таких как выбор структур представления знаний (KR) . В этой области основной вопрос, какая структура КР наиболее подходит для использования в РЭГ, остается открытым. Ответ на этот вопрос зависит от того, насколько хорошо можно выразить или найти описания. Большая часть потенциала КР до сих пор остается неиспользованной.

Некоторые из различных подходов заключаются в использовании:

Поиск по графу , который рассматривает отношения между целями так же, как и свойства. ^[3]^[21]^[23]^[34]^[35]
Удовлетворение ограничений , которое позволяет разделить спецификацию проблемы и реализацию. ^[19]^[36]
Современное представление знаний , которое предлагает логический вывод , например, в виде логики описания или концептуальных графиков . ^[37]^[38]^[39]

^{[примечание 1]}

Определение проблемы

Дейл и Рейтер (1995) рассматривают референтные выражения как отличительные описания.

Они определяют:

Референт описать как сущность, которую следует
Контекст , заданный как набор существенных сущностей
Контрастный набор или потенциальные отвлекающие факторы как все элементы контекстного набора, кроме референта.
Свойство . как ссылка на одну пару атрибут-значение

как набор пар атрибут-значение. Каждую сущность в домене можно охарактеризовать , например, $\langle$ тип, собака $\rangle$ , $\langle$ пол, женский $\rangle$ или $\langle$ возраст, 10 лет $\rangle$ .

Тогда проблема определяется следующим образом:

Позволять $r$ быть предполагаемым референтом, и $C$ быть контрастным набором. Затем набор $L$ пар атрибут-значение будет представлять собой отличительное описание, если выполняются следующие два условия:

Каждая пара атрибут-значение в $L$ относится к $r$ : то есть каждый элемент $L$ указывает значение атрибута, которое $r$ обладает.
Для каждого члена $c$ из $C$ , существует хотя бы один элемент $l$ из $L$ это не относится к $c$ : то есть есть $l$ в $L$ который определяет значение атрибута, которое $c$ не обладает. $l$ говорят, что исключает $c$ .

Другими словами, чтобы сгенерировать референтное выражение, нужно найти набор свойств, которые применимы к референту, но не к дистракторам. ^[2]

Проблему можно легко решить, объединив все свойства референта, что часто приводит к длинным описаниям, нарушающим вторую максиму количества Грайса . Другой подход — найти кратчайшее отличительное описание, как это делает алгоритм полной краткости . Однако на практике чаще всего вместо этого включают условие, согласно которому ссылающиеся выражения, созданные алгоритмом, должны быть как можно более похожими на выражения, созданные человеком, хотя это часто не упоминается явно. ^{[примечание 1]}

Основные алгоритмы

Полная краткость

Алгоритм полной краткости всегда находит минимальное отличительное описание, что означает, что более короткого отличительного описания в отношении используемых свойств не существует.

Поэтому он повторяет $n=1,2,3,4,...$ и проверяет каждое описание длины $n$ свойства до тех пор, пока не будет найдено отличительное описание.

При таком способе создания ссылающихся выражений возникают две проблемы. Во-первых, алгоритм имеет высокую сложность, то есть он NP-сложный , что делает его непрактичным в использовании. ^[40] Во-вторых, говорящие люди во многих ситуациях производят описания, которые не являются минимальными. ^[41]^[42]^[43]^[44]^{[примечание 1]}

Жадная эвристика

Алгоритм жадной эвристики ^[11]^[12] аппроксимирует алгоритм полной краткости, итеративно добавляя к описанию наиболее отличительное свойство. Наиболее отличительное свойство означает свойство, исключающее большинство остальных отвлекающих факторов. Алгоритм жадной эвристики более эффективен, чем алгоритм полной краткости. ^{[примечание 1]}

Дейл и Райтер (1995) ^[2] представьте следующий алгоритм жадной эвристики:

Позволять $L$ быть набором свойств, которые должны быть реализованы в нашем описании; позволять $P$ быть набором свойств, которые, как известно, являются истинными для нашего предполагаемого референта $r$ (мы предполагаем, что $P$ непусто); и пусть $C$ быть набором дистракторов (контрастным набором). Таким образом, начальные условия таковы:

 $C=\{\langle$ all distractors $\rangle \}$ ;
 $P=\{\langle$ all properties true of  $r\rangle \}$ ;
 $L=\{\}$

Чтобы описать предполагаемый референт $r$ относительно контрастного набора $C$ , мы делаем следующий:

1. Check Success:
   if  $|C|=0$  then return  $L$  as a distinguishing description
   elseif  $P=\emptyset$  then fail
   else goto Step 2.
2. Choose Property:
   for each  $p_{i}\in P$  do:  $C_{i}\leftarrow C\cap \{x|p_{i}(x)\}$ 
   Chosen property is  $p_{j}$  , where  $C_{j}$  is the smallest set.
   goto Step 3.
3. Extend Description (wrt the chosen  $p_{j}$ ):
    $L\leftarrow L\cup \{p_{j}\}$ 
    $C\leftarrow C_{j}$ 
    $P\leftarrow P-\{p_{j}\}$ 
   goto Step 1.

Инкрементный алгоритм

Инкрементный алгоритм (IA) Дейла и Райтера ^[2] был самым влиятельным алгоритмом до 2000 года. Он основан на идее предпочтительного порядка атрибутов или свойств, которыми руководствуются говорящие. Таким образом, чтобы запустить инкрементальный алгоритм, сначала необходимо задать порядок предпочтения атрибутов. Теперь алгоритм следует этому порядку и добавляет в описание те свойства, которые исключают оставшиеся отвлекающие факторы. Кроме того, Дейл и Райтер ^[2] подчеркните тип атрибута, который всегда включается в их описания, даже если это не исключает каких-либо отвлекающих факторов.

Кроме того, значения типов являются частью иерархии подразделов, включающей некоторые значения базового уровня . Например, в домашних животных категории чихуахуа относится к собаке , а собака к животному . Поскольку собака определяется как базовый уровень, собаке алгоритмы отдают предпочтение , если чихуахуа не исключает каких-либо отвлекающих факторов.

Инкрементальный алгоритм прост в реализации, а также эффективен в вычислительном отношении и работает за полиномиальное время . Описание, созданное IA, может содержать избыточные свойства, которые являются излишними из-за добавленных позже свойств. Создатели считают это не слабостью, а скорее стремлением сделать выражения менее «психолингвистически неправдоподобными». ^[2]

Следующий алгоритм представляет собой упрощенную версию пошагового алгоритма Дейла и Рейтера. ^[2] Крамер и ван Деемтер ^[33] который принимает в качестве входных данных референт r , D содержащий коллекцию объектов предметной области и упорядоченный список Pref предпочтительных атрибутов, специфичный для предметной области. В обозначении L — это описание, C — контекстный набор дистракторов, а функция RulesOut( ⟨A _i , V⟩ ) возвращает набор объектов, которые имеют значение, отличное от V для атрибута A _i .

IncrementalAlgorithm ({r}, D, Pref)
    L ← ∅
    C ← D - {r}
    for each A_i in list Pref do
        V = Value(r, A_i)
        if C ∩ RulesOut(⟨A_i, V⟩) ≠ ∅
        then L ← L ∪ {⟨A_i, V⟩}
            C ← C - RulesOut(⟨A_i, V⟩)
        endif
        if C = ∅
        then return L
        endif
    return failure^{[note 1]}

Оценка систем REG

До 2000 года оценка систем РЭГ носила теоретический характер, как и та, что была проведена Дейлом и Райтером. ^[2] В последнее время стали популярными эмпирические исследования, которые в основном основаны на предположении, что сгенерированные выражения должны быть похожи на выражения, созданные человеком. Корпусная оценка в REG началась довольно поздно из-за отсутствия подходящих наборов данных. По-прежнему наиболее доминирующим методом на данный момент является корпусная оценка, хотя существует также оценка, основанная на человеческом суждении. ^{[примечание 1]}

Корпусная оценка

различие между текстовыми корпусами Прежде всего необходимо провести и экспериментальными корпусами. Текстовые корпуса, такие как корпус GNOME ^[1] может содержать тексты из всех типов доменов. В REG они используются для оценки реализации алгоритмов. REG С другой стороны, для части выбора контента требуется корпус, содержащий свойства всех объектов предметной области, а также свойства, используемые в ссылках. Обычно это полностью «семантически прозрачные» ^[45] создан в экспериментах с использованием простых и контролируемых настроек.

Эти экспериментальные корпуса снова можно разделить на корпуса общего назначения , которые были собраны для другой цели, но были проанализированы на предмет ссылающихся выражений, и выделенные корпуса , которые сосредоточены конкретно на ссылающихся выражениях. Примерами корпораций общего назначения являются «Грушевые истории», ^[46] корпус задач карты ^[47] или корпус кокоса ^[48] в то время как корпус епископа, ^[49] корпус ящика ^[50] и корпус ТУНА ^[51] засчитывайтесь в Выделенную Корпору. Корпус TUNA, содержащий собранные в Интернете данные о двух областях: мебели и людях, уже использовался в трех общих задачах REG. ^{[примечание 1]}

Метрики оценки

Для измерения соответствия между корпусами и результатами алгоритмов REG было разработано несколько метрик.

Для измерения выбора контента части используется коэффициент Дайса. ^[52] или MASI (Соглашение об измерениях объектов с фиксированной стоимостью) ^[53] используются метрики. Они измеряют перекрытие свойств в двух описаниях. При оценке оценки обычно усредняются по ссылкам, сделанным разными участниками корпуса. Также иногда используется показатель, называемый процентом идеального запоминания (PRP). ^[51] или Точность ^[54] используется, который вычисляет процент идеальных совпадений между ссылкой, созданной алгоритмом, и ссылкой, созданной человеком.

Для части лингвистической реализации REG перекрытие между строками измерялось с использованием таких показателей, как BLEU. ^[55] или НИСТ . ^[56] Проблема, возникающая при использовании строковых показателей, заключается в том, что, например, «Маленькая обезьянка» измеряется ближе к «Маленькому ослу», чем к «Маленькой обезьянке».

Более трудоемкий способ оценки алгоритмов REG — предоставить людям возможность оценить адекватность ( насколько ясно описание?) и беглость (данно ли описание на хорошем и понятном английском языке?) сгенерированного выражения. Также Белз и Гатт ^[57] оценивали ссылающиеся выражения, используя экспериментальную установку. Участники получают сгенерированное описание, а затем должны нажать на цель. Здесь можно оценить время чтения внешних метрик, время идентификации и частоту ошибок. ^{[примечание 1]}

Примечания

^ Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я Этот раздел представляет собой отрывок из следующей статьи. Подробнее см.: Э. Крамер, К. ван Деемтер (2012). Вычислительная генерация ссылающихся выражений: обзор. Компьютерная лингвистика 38: 173-218 [1]

Ссылки

^ Перейти обратно: ^а ^б М. Поэзио, Р. Стивенсон, Б. ди Эухенио, Дж. Хитземан (2004). Центрирование: параметрическая теория и ее реализации. Компьютерная лингвистика 30:309-363 [2]
^ Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж Р. Дейл, Э. Рейтер (1995). Вычислительные интерпретации максим Грайса при генерации референтных выражений. Когнитивная наука , 18:233–263.
^ Перейти обратно: ^а ^б Э. Крамер, С. ван Эрк, А. Верлег (2003). Генерация ссылающихся выражений на основе графов. Компьютерная лингвистика 23:53-72 [3]
^ «Корпус TUNA | Школа естественных и вычислительных наук | Абердинский университет» .
^ Э. Рейтер, С. Шрипада, Дж. Хантер, Дж. Ю и И. Дэви (2005). Выбор слов в компьютерных прогнозах погоды. Искусственный интеллект 167:137-169.
^ Перейти обратно: ^а ^б Р. Тернер, Ю. Шрипада, Э. Рейтер (2009) Создание приблизительных географических описаний. Материалы 12-го Европейского семинара по генерации естественного языка (ENLG) , страницы 42–49, Афины. [4]
^ Т Виноград (1972). Понимание естественного языка. Академическое издательство , Нью-Йорк. Раздел 8.3.3, Именование объектов и событий
^ Перейти обратно: ^а ^б ^с Д. Аппельт (1985). Планирование английских обращенных выражений. Искусственный интеллект , 26:1–33.
^ Перейти обратно: ^а ^б Д. Аппельт, А. Кронфельд (1987). Вычислительная модель обращения. В материалах 10-й Международной совместной конференции по искусственному интеллекту (IJCAI) , страницы 640–647, Милан.
^ Кронфельд (1990). Ссылка и вычисления: очерк прикладной философии языка. Издательство Кембриджского университета , Кембридж.
^ Перейти обратно: ^а ^б Р. Дейл (1989). Приготовление референтных выражений. В материалах 27-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 68–75.
^ Перейти обратно: ^а ^б Р. Дейл (1992). Генерация ссылающихся выражений: построение описаний в области объектов и процессов. TheMIT Press , Кембридж, Массачусетс.
^ Э. Рейтер (1990). Вычислительная сложность предотвращения разговорных импликатур. В материалах 28-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 97–104, Питтсбург, Пенсильвания.
^ Э. Рейтер, Р. Дейл (1992). Быстрый алгоритм генерации ссылающихся выражений. В материалах 14-й Международной конференции по компьютерной лингвистике (COLING) , страницы 232–238, Нант.
^ Х Горачек (2004). Об обращении к множествам объектов естественно. Материалы 3-й Международной конференции по генерации естественного языка (INLG) , страницы 70–79, Брокенхерст.
^ А. Гатт, К. ван Деемтер (2007). Лексический выбор и концептуальная перспектива в создании референтных выражений во множественном числе. Журнал логики, языка и информации , 16:423–443.
^ И.Х. Хан, К. ван Димтер, Дж. Ричи (2008). Генерация ссылающихся выражений: управление структурной двусмысленностью. Материалы 22-й Международной конференции по компьютерной лингвистике (COLING) , страницы 433–440, Манчестер.
^ М. Стоун (2000). Об определении множеств. Материалы 1-й Международной конференции по генерации естественного языка (INLG) , страницы 116–123, Мицпе Рамон.
^ Перейти обратно: ^а ^б Р. Дейл, Н. Хэддок (1991). Создание ссылающихся выражений, включающих отношения. Материалы 5-й конференции Европейского отделения Ассоциации компьютерных лингвистов (EACL) , страницы 161–166, Берлин.
^ Э. Крамер, М. Теун (2002). Эффективное контекстно-зависимое создание описаний в контексте. В К. ван Димтер, Р. Киббл, редакторы, «Обмен информацией: данность и новизна в языковой обработке» . Публикации CSLI, Стэнфорд, Калифорния, страницы 223–264.
^ Перейти обратно: ^а ^б Дж. Витен, Р. Дейл (2008). Использование пространственных отношений в относящихся к выражениям. Материалы 5-й Международной конференции по созданию естественного языка (INLG) , страницы 59–67, Солт-Форк, Огайо.
^ И Рен, К ван Деемтер, Дж. Пан (2010). Диаграмма потенциала логики описания для создания ссылающихся выражений. Материалы 6-й Международной конференции по созданию естественного языка (INLG) , страницы 115–124, Дублин.
^ Перейти обратно: ^а ^б Э. Крамер, М. Гудбек, М. Теун (2014). Обращение к генерации выражений во взаимодействии: взгляд на графы. Стент, С. Бангалор (ред.), Генерация естественного языка в интерактивных системах . Издательство Кембриджского университета.
^ К ван Деемтер (2006). Создание ссылающихся выражений, включающих градуируемые свойства. Компьютерная лингвистика , 32(2):195–222.
^ Х Горачек (2005). Формирование референтных описаний в условиях неопределенности. Материалы 10-го Европейского семинара по генерации естественного языка (ENLG) , страницы 58–67, Абердин.
^ Р. Пассонно (1996). Использование центрирования для ослабления информационных ограничений Грайса на анафорических именных группах дискурса. Язык и речь , 39:229–264.
^ PW Джордан (2000). Преднамеренное влияние на переописания объектов в диалоге: данные эмпирического исследования. доктор философии диссертация, Питтсбургский университет.
^ Э Гаичова (1993). Проблемы структуры предложений и моделей дискурса - теоретическая и компьютерная лингвистика, Vol. 2 . Карлов университет, Прага.
^ Б. Дж. Гросс, А. К. Джоши, С. Вайнштейн (1995). Центрирование: основа для моделирования локальной связности дискурса. Компьютерная лингвистика , 21:203–225.
^ D ДеВо, С. Рич, К. Л. Сиднер (2004). Генерация естественного языка и контекст дискурса: вычисление наборов отвлекающих факторов из фокус-стека. Материалы 17-го международного собрания Флоридского общества исследований искусственного интеллекта (FLAIRS) , Майами-Бич, Флорида.
^ Сиддхартхан, Копестейк (2004). Генерация ссылающихся выражений в открытых доменах. Протоколы 42-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 407–414, Барселона.
^ И. Парабони, К. ван Деемтер, Дж. Мастхофф (2007). Создание ссылающихся выражений: упрощение идентификации референтов. Компьютерная лингвистика , 33:229–254.
^ Перейти обратно: ^а ^б Э. Крамер, К. ван Деемтер (2012). Вычислительная генерация ссылающихся выражений: обзор. Компьютерная лингвистика 38:173-218 [5]
^ Э. Крамер, М. Теун, Дж. Витен, И. Хендрикс (2008). График: Стоимость избыточности в ссылающихся выражениях. Материалы Международной конференции по генерации естественного языка (INLG) , страницы 227–229, Солт-Форк, Огайо.
^ К. ван Деемтер, Э. Крамер (2007). Графы и логические значения: о генерации ссылающихся выражений. В Х. Бунте, Р. Маскенсе, редакторах, «Вычисление значения», том 3. Исследования по лингвистике и философии . Издательство Springer, Берлин, страницы 397–422.
^ С. Гардент (2002). Генерирование минимально определенных описаний. Протоколы 40-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 96–103, Филадельфия, Пенсильвания.
^ М. Кроитору, К. ван Деемтер (2007). Концептуальный графовый подход к созданию ссылающихся выражений. Материалы 20-й Международной совместной конференции по искусственному интеллекту (IJCAI) , страницы 2456–2461, Хайдарабад.
^ К. Гардент , К. Стригниц (2007). Создание связующих определенных описаний. В H Bunt, Рейнхард Маскенс, редакторы, «Вычисление значения», том 3. Исследования по лингвистике и философии. Springer Publishers, страницы 369–396, Берлин, DB.
^ C Areces, A Koller, K Striegnitz (2008). Ссылаясь на выражения как на формулы логики описания. Материалы 5-й Международной конференции по созданию естественного языка (INLG) , страницы 42–49, Солт-Форк, Огайо.
^ Г-н Гэри, Д. С. Джонсон (1979). Компьютеры и трудноразрешимые проблемы: Руководство по теории NP-полноты . WH Фриман, Нью-Йорк.
^ Д. Р. Олсон (1970). Язык и мышление: аспекты когнитивной теории семантики. Психологический обзор , 77:257–273.
^ С. Зонненшайн (1984). Влияние избыточного общения на слушателей: почему разные типы могут иметь разные последствия. Журнал психолингвистических исследований , 13:147–166.
^ Т. Пехманн (1989). Инкрементальное производство речи и ссылочная гиперспецификация. Лингвистика , 27:98–110.
^ PE Энгельхардт, К. Г. Д. Бейли, Ф. Феррейра (2006). Соблюдают ли говорящие и слушатели принцип количества Грайса? Журнал памяти и языка , 54:554–573.
^ К. ван Деемтер, И ван дер Слейс, А. Гатт (2006). Создание семантически прозрачного корпуса для генерации ссылающихся выражений. В материалах 4-й Международной конференции по генерации естественного языка (INLG) , страницы 130–132, Сидней.
^ WW Чейф (1980). Грушевые истории: когнитивные, культурные и лингвистические аспекты повествовательного производства. Алекс, Норвуд, Нью-Джерси.
^ А.А. Андерсон, М. Бадер, Э. Гурман Бард, Э. Бойл, Дж. Доэрти, С. Гаррод, С. Айсард, Дж. Ковтко, Дж. Макаллистер, Дж. Миллер, К. Сотилло, Х. Томпсон, Р. Вайнерт (1991). Корпус картографических задач HCRC. Язык и речь , 34:351–366.
^ Б. Ди Эухенио, П.В. Джордан, Р.Х. Томасон, Дж. Д. Мур (2000). Процесс соглашения: эмпирическое исследование совместных диалогов человека и человека, опосредованных компьютером. Международный журнал человеко-компьютерных исследований , 53:1017–1076.
^ П. Горняк, Д. Рой (2004). Обоснованная смысловая композиция визуальных сцен. Журнал исследований искусственного интеллекта , 21: 429–470.
^ Дж. Витен, Р. Дейл (2006). Алгоритмы генерации референтных выражений: делают ли они то, что делают люди?. Материалы 4-й Международной конференции по генерации естественного языка (INLG) , страницы 63–70, Сидней.
^ Перейти обратно: ^а ^б А. Гатт, И ван дер Слейс, К. ван Деемтер (2007). Оценка алгоритмов генерации ссылающихся выражений с использованием сбалансированного корпуса. Материалы 11-го Европейского семинара по генерации естественного языка (ENLG) , страницы 49–56, Schloss Dagstuhl.
^ Л. Р. Дайс (1945). Меры степени экологической связи между видами. Экология , 26:297–302.
^ Р. Пассонно (2006). Соглашение об измерении многозначных элементов (MASI) для семантической и прагматической аннотации. Материалы 5-й Международной конференции по языковым ресурсам и оценке (LREC) , страницы 831–836, Генуя.
^ Гатт, Белз, Э. Коу (2008). Задача ТУНА 2008: обзор и результаты оценки. Материалы 5-й Международной конференции по генерации естественного языка (INLG) , страницы 198–206, Солт-Форк, Огайо.
^ К. Папинени, С. Роукос, Т. Уорд, В. Чжу (2002). BLEU: метод автоматической оценки машинного перевода. Протоколы 40-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 311–318, Филадельфия, Пенсильвания.
^ Дж. Доддингтон (2002). Автоматическая оценка качества машинного перевода с использованием n-граммной статистики совпадений. Материалы 2-й Международной конференции по исследованию технологий человеческого языка (HLT) , страницы 138–145, Сан-Диего, Калифорния.
^ Белз, Гатт (2008). Внутренние и внешние меры оценки для генерации референтного выражения. Материалы 46-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , Колумбус, Огайо.

[Krahmer&van_Deemter-15] Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я Этот раздел представляет собой отрывок из следующей статьи. Подробнее см.: Э. Крамер, К. ван Деемтер (2012). Вычислительная генерация ссылающихся выражений: обзор. Компьютерная лингвистика 38: 173-218 [1]

[Poesio_et_al.-1] Перейти обратно: ^а ^б М. Поэзио, Р. Стивенсон, Б. ди Эухенио, Дж. Хитземан (2004). Центрирование: параметрическая теория и ее реализации. Компьютерная лингвистика 30:309-363 [2]

[Dale&Reiter-2] Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж Р. Дейл, Э. Рейтер (1995). Вычислительные интерпретации максим Грайса при генерации референтных выражений. Когнитивная наука , 18:233–263.

[Krahmer,_Erk,_Verleg-3] Перейти обратно: ^а ^б Э. Крамер, С. ван Эрк, А. Верлег (2003). Генерация ссылающихся выражений на основе графов. Компьютерная лингвистика 23:53-72 [3]

[4] «Корпус TUNA | Школа естественных и вычислительных наук | Абердинский университет» .

[5] Э. Рейтер, С. Шрипада, Дж. Хантер, Дж. Ю и И. Дэви (2005). Выбор слов в компьютерных прогнозах погоды. Искусственный интеллект 167:137-169.

[Turner_et_al.-6] Перейти обратно: ^а ^б Р. Тернер, Ю. Шрипада, Э. Рейтер (2009) Создание приблизительных географических описаний. Материалы 12-го Европейского семинара по генерации естественного языка (ENLG) , страницы 42–49, Афины. [4]

[7] Т Виноград (1972). Понимание естественного языка. Академическое издательство , Нью-Йорк. Раздел 8.3.3, Именование объектов и событий

[Appelt-8] Перейти обратно: ^а ^б ^с Д. Аппельт (1985). Планирование английских обращенных выражений. Искусственный интеллект , 26:1–33.

[Appelt&Kronfeld-9] Перейти обратно: ^а ^б Д. Аппельт, А. Кронфельд (1987). Вычислительная модель обращения. В материалах 10-й Международной совместной конференции по искусственному интеллекту (IJCAI) , страницы 640–647, Милан.

[10] Кронфельд (1990). Ссылка и вычисления: очерк прикладной философии языка. Издательство Кембриджского университета , Кембридж.

[Dale1989-11] Перейти обратно: ^а ^б Р. Дейл (1989). Приготовление референтных выражений. В материалах 27-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 68–75.

[Dale1992-12] Перейти обратно: ^а ^б Р. Дейл (1992). Генерация ссылающихся выражений: построение описаний в области объектов и процессов. TheMIT Press , Кембридж, Массачусетс.

[13] Э. Рейтер (1990). Вычислительная сложность предотвращения разговорных импликатур. В материалах 28-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 97–104, Питтсбург, Пенсильвания.

[14] Э. Рейтер, Р. Дейл (1992). Быстрый алгоритм генерации ссылающихся выражений. В материалах 14-й Международной конференции по компьютерной лингвистике (COLING) , страницы 232–238, Нант.

[16] Х Горачек (2004). Об обращении к множествам объектов естественно. Материалы 3-й Международной конференции по генерации естественного языка (INLG) , страницы 70–79, Брокенхерст.

[17] А. Гатт, К. ван Деемтер (2007). Лексический выбор и концептуальная перспектива в создании референтных выражений во множественном числе. Журнал логики, языка и информации , 16:423–443.

[18] И.Х. Хан, К. ван Димтер, Дж. Ричи (2008). Генерация ссылающихся выражений: управление структурной двусмысленностью. Материалы 22-й Международной конференции по компьютерной лингвистике (COLING) , страницы 433–440, Манчестер.

[19] М. Стоун (2000). Об определении множеств. Материалы 1-й Международной конференции по генерации естественного языка (INLG) , страницы 116–123, Мицпе Рамон.

[Dale&Haddock-20] Перейти обратно: ^а ^б Р. Дейл, Н. Хэддок (1991). Создание ссылающихся выражений, включающих отношения. Материалы 5-й конференции Европейского отделения Ассоциации компьютерных лингвистов (EACL) , страницы 161–166, Берлин.

[21] Э. Крамер, М. Теун (2002). Эффективное контекстно-зависимое создание описаний в контексте. В К. ван Димтер, Р. Киббл, редакторы, «Обмен информацией: данность и новизна в языковой обработке» . Публикации CSLI, Стэнфорд, Калифорния, страницы 223–264.

[Viethen&Dale-22] Перейти обратно: ^а ^б Дж. Витен, Р. Дейл (2008). Использование пространственных отношений в относящихся к выражениям. Материалы 5-й Международной конференции по созданию естественного языка (INLG) , страницы 59–67, Солт-Форк, Огайо.

[23] И Рен, К ван Деемтер, Дж. Пан (2010). Диаграмма потенциала логики описания для создания ссылающихся выражений. Материалы 6-й Международной конференции по созданию естественного языка (INLG) , страницы 115–124, Дублин.

[Krahmer,_Goudbeek,_Theune-24] Перейти обратно: ^а ^б Э. Крамер, М. Гудбек, М. Теун (2014). Обращение к генерации выражений во взаимодействии: взгляд на графы. Стент, С. Бангалор (ред.), Генерация естественного языка в интерактивных системах . Издательство Кембриджского университета.

[25] К ван Деемтер (2006). Создание ссылающихся выражений, включающих градуируемые свойства. Компьютерная лингвистика , 32(2):195–222.

[26] Х Горачек (2005). Формирование референтных описаний в условиях неопределенности. Материалы 10-го Европейского семинара по генерации естественного языка (ENLG) , страницы 58–67, Абердин.

[27] Р. Пассонно (1996). Использование центрирования для ослабления информационных ограничений Грайса на анафорических именных группах дискурса. Язык и речь , 39:229–264.

[28] PW Джордан (2000). Преднамеренное влияние на переописания объектов в диалоге: данные эмпирического исследования. доктор философии диссертация, Питтсбургский университет.

[29] Э Гаичова (1993). Проблемы структуры предложений и моделей дискурса - теоретическая и компьютерная лингвистика, Vol. 2 . Карлов университет, Прага.

[30] Б. Дж. Гросс, А. К. Джоши, С. Вайнштейн (1995). Центрирование: основа для моделирования локальной связности дискурса. Компьютерная лингвистика , 21:203–225.

[31] D ДеВо, С. Рич, К. Л. Сиднер (2004). Генерация естественного языка и контекст дискурса: вычисление наборов отвлекающих факторов из фокус-стека. Материалы 17-го международного собрания Флоридского общества исследований искусственного интеллекта (FLAIRS) , Майами-Бич, Флорида.

[32] Сиддхартхан, Копестейк (2004). Генерация ссылающихся выражений в открытых доменах. Протоколы 42-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 407–414, Барселона.

[33] И. Парабони, К. ван Деемтер, Дж. Мастхофф (2007). Создание ссылающихся выражений: упрощение идентификации референтов. Компьютерная лингвистика , 33:229–254.

[Krahmer&van_Deemter-34] Перейти обратно: ^а ^б Э. Крамер, К. ван Деемтер (2012). Вычислительная генерация ссылающихся выражений: обзор. Компьютерная лингвистика 38:173-218 [5]

[35] Э. Крамер, М. Теун, Дж. Витен, И. Хендрикс (2008). График: Стоимость избыточности в ссылающихся выражениях. Материалы Международной конференции по генерации естественного языка (INLG) , страницы 227–229, Солт-Форк, Огайо.

[36] К. ван Деемтер, Э. Крамер (2007). Графы и логические значения: о генерации ссылающихся выражений. В Х. Бунте, Р. Маскенсе, редакторах, «Вычисление значения», том 3. Исследования по лингвистике и философии . Издательство Springer, Берлин, страницы 397–422.

[37] С. Гардент (2002). Генерирование минимально определенных описаний. Протоколы 40-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 96–103, Филадельфия, Пенсильвания.

[38] М. Кроитору, К. ван Деемтер (2007). Концептуальный графовый подход к созданию ссылающихся выражений. Материалы 20-й Международной совместной конференции по искусственному интеллекту (IJCAI) , страницы 2456–2461, Хайдарабад.

[39] К. Гардент , К. Стригниц (2007). Создание связующих определенных описаний. В H Bunt, Рейнхард Маскенс, редакторы, «Вычисление значения», том 3. Исследования по лингвистике и философии. Springer Publishers, страницы 369–396, Берлин, DB.

[40] C Areces, A Koller, K Striegnitz (2008). Ссылаясь на выражения как на формулы логики описания. Материалы 5-й Международной конференции по созданию естественного языка (INLG) , страницы 42–49, Солт-Форк, Огайо.

[41] Г-н Гэри, Д. С. Джонсон (1979). Компьютеры и трудноразрешимые проблемы: Руководство по теории NP-полноты . WH Фриман, Нью-Йорк.

[42] Д. Р. Олсон (1970). Язык и мышление: аспекты когнитивной теории семантики. Психологический обзор , 77:257–273.

[43] С. Зонненшайн (1984). Влияние избыточного общения на слушателей: почему разные типы могут иметь разные последствия. Журнал психолингвистических исследований , 13:147–166.

[44] Т. Пехманн (1989). Инкрементальное производство речи и ссылочная гиперспецификация. Лингвистика , 27:98–110.

[45] PE Энгельхардт, К. Г. Д. Бейли, Ф. Феррейра (2006). Соблюдают ли говорящие и слушатели принцип количества Грайса? Журнал памяти и языка , 54:554–573.

[46] К. ван Деемтер, И ван дер Слейс, А. Гатт (2006). Создание семантически прозрачного корпуса для генерации ссылающихся выражений. В материалах 4-й Международной конференции по генерации естественного языка (INLG) , страницы 130–132, Сидней.

[47] WW Чейф (1980). Грушевые истории: когнитивные, культурные и лингвистические аспекты повествовательного производства. Алекс, Норвуд, Нью-Джерси.

[48] А.А. Андерсон, М. Бадер, Э. Гурман Бард, Э. Бойл, Дж. Доэрти, С. Гаррод, С. Айсард, Дж. Ковтко, Дж. Макаллистер, Дж. Миллер, К. Сотилло, Х. Томпсон, Р. Вайнерт (1991). Корпус картографических задач HCRC. Язык и речь , 34:351–366.

[49] Б. Ди Эухенио, П.В. Джордан, Р.Х. Томасон, Дж. Д. Мур (2000). Процесс соглашения: эмпирическое исследование совместных диалогов человека и человека, опосредованных компьютером. Международный журнал человеко-компьютерных исследований , 53:1017–1076.

[50] П. Горняк, Д. Рой (2004). Обоснованная смысловая композиция визуальных сцен. Журнал исследований искусственного интеллекта , 21: 429–470.

[51] Дж. Витен, Р. Дейл (2006). Алгоритмы генерации референтных выражений: делают ли они то, что делают люди?. Материалы 4-й Международной конференции по генерации естественного языка (INLG) , страницы 63–70, Сидней.

[Gatt_Sluis_Deemter-52] Перейти обратно: ^а ^б А. Гатт, И ван дер Слейс, К. ван Деемтер (2007). Оценка алгоритмов генерации ссылающихся выражений с использованием сбалансированного корпуса. Материалы 11-го Европейского семинара по генерации естественного языка (ENLG) , страницы 49–56, Schloss Dagstuhl.

[53] Л. Р. Дайс (1945). Меры степени экологической связи между видами. Экология , 26:297–302.

[54] Р. Пассонно (2006). Соглашение об измерении многозначных элементов (MASI) для семантической и прагматической аннотации. Материалы 5-й Международной конференции по языковым ресурсам и оценке (LREC) , страницы 831–836, Генуя.

[55] Гатт, Белз, Э. Коу (2008). Задача ТУНА 2008: обзор и результаты оценки. Материалы 5-й Международной конференции по генерации естественного языка (INLG) , страницы 198–206, Солт-Форк, Огайо.

[56] К. Папинени, С. Роукос, Т. Уорд, В. Чжу (2002). BLEU: метод автоматической оценки машинного перевода. Протоколы 40-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , страницы 311–318, Филадельфия, Пенсильвания.

[57] Дж. Доддингтон (2002). Автоматическая оценка качества машинного перевода с использованием n-граммной статистики совпадений. Материалы 2-й Международной конференции по исследованию технологий человеческого языка (HLT) , страницы 138–145, Сан-Диего, Калифорния.

[58] Белз, Гатт (2008). Внутренние и внешние меры оценки для генерации референтного выражения. Материалы 46-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL) , Колумбус, Огайо.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[примечание 1]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]