Jump to content

Агрегация (лингвистика)

В лингвистике синтаксических агрегирование — это подзадача генерации естественного языка , которая включает в себя слияние составляющих (таких как предложения и фразы ) вместе. Иногда агрегацию можно выполнить на концептуальном уровне.

Простым примером синтаксической агрегации является объединение двух предложений «Джон пошел в магазин» и «Джон купил яблоко» в одно предложение «Джон пошел в магазин и купил яблоко» .

Синтаксическая агрегация может быть гораздо более сложной. Например, агрегирование может включать один из компонентов в другой; например, мы можем объединить Джон пошел в магазин и Магазин был закрыт в предложение Джон пошел в магазин, который был закрыт .

С прагматической точки зрения объединение предложений часто предполагает читателю, что эти предложения связаны друг с другом. Если это не так, читатель может запутаться. Например, тот, кто читает Иоанна, пошел в магазин и купил яблоко, может сделать вывод, что яблоко было куплено в магазине; если это не так, то эти предложения не следует объединять.

Алгоритмы и проблемы

[ редактировать ]

Алгоритмы агрегации должны делать две вещи:

  • Решите, когда следует объединить два компонента.
  • Решите, как следует агрегировать два компонента, и создайте агрегированную структуру.

Первый вопрос – решение о том, когда агрегировать, – плохо изучен. Решения об агрегировании, безусловно, зависят от семантических отношений между составляющими, как упоминалось выше; они также зависят от жанра (например, бюрократические тексты имеют тенденцию быть более агрегированными, чем инструкции). Вероятно, они должны зависеть от риторики и структуры дискурса. [1] Вероятно, важен и уровень грамотности читателя (плохим читателям нужны более короткие предложения). [2] Но у нас нет интегрированной модели, которая бы объединяла все эти факторы в единый алгоритм .

Что касается второго вопроса, то были проведены некоторые исследования различных типов агрегирования и способов их проведения. Харбуш и Кемпен описывают несколько стратегий синтаксической агрегации. В их терминологии Джон пошел в магазин и купил яблоко — это пример приведения союза . прямого [3] Гораздо меньше известно о концептуальной агрегации. Ди Эухенио и др. покажите, как концептуальная агрегация может быть выполнена в интеллектуальной системе обучения, и продемонстрируйте, что выполнение такой агрегации делает систему более эффективной (и что концептуальная агрегация оказывает большее влияние, чем синтаксическая агрегация). [4]

Программное обеспечение

[ редактировать ]

К сожалению, программного обеспечения для выполнения агрегации не так много. [ нужна ссылка ] Однако система SimpleNLG [5] включает ограниченную поддержку базовой агрегации. Например, следующий код заставляет SimpleNLG выводить сообщение « Мужчина голоден и покупает яблоко» .

SPhraseSpec s1 = nlgFactory.createClause("the man", "be", "hungry");
SPhraseSpec s2 = nlgFactory.createClause("the man", "buy", "an apple");
NLGElement result = new ClauseCoordinationRule().apply(s1, s2);
System.out.println(realiser.realiseSentence(result));
  1. ^ Д. Скотт и К. де Соуза (1990). Передача сообщения при генерации текста на основе RST. В Дейле и др. (ред.) « Текущие исследования в области генерации естественного языка» . Академическая пресса
  2. ^ С. Уильямс и Э. Рейтер (2008). Создание отчетов об основных навыках для читателей с низкой квалификацией. Инженерия естественного языка 14: 495-535
  3. ^ К. Харбуш и Дж. Кемпен (2009). Генерация многоязычного многоязычного координатного эллипса: единый подход, основанный на постредактировании. В материалах ЭНЛГ-2009 28:105-144. [1]
  4. ^ Б Ди Эухенио, Д Фоссати, Д Ю (2005). Агрегация улучшает обучение: эксперименты по созданию естественного языка для интеллектуальных систем обучения. В протоколе ACL-2005, стр. 50–57. [2]
  5. ^ Гатт и Э. Рейтер (2009). SimpleNLG: Механизм реализации для практических приложений. Материалы ENLG09 [3]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 917c048f38e81212d9ab57cdcbcd088a__1700838420
URL1:https://arc.ask3.ru/arc/aa/91/8a/917c048f38e81212d9ab57cdcbcd088a.html
Заголовок, (Title) документа по адресу, URL1:
Aggregation (linguistics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)