Агрегация (лингвистика)
![]() | Эта статья написана как личное размышление, личное эссе или аргументативное эссе , в котором излагаются личные чувства редактора Википедии или представлен оригинальный аргумент по определенной теме. ( Май 2011 г. ) |
В лингвистике синтаксических агрегирование — это подзадача генерации естественного языка , которая включает в себя слияние составляющих (таких как предложения и фразы ) вместе. Иногда агрегацию можно выполнить на концептуальном уровне.
Примеры
[ редактировать ]Простым примером синтаксической агрегации является объединение двух предложений «Джон пошел в магазин» и «Джон купил яблоко» в одно предложение «Джон пошел в магазин и купил яблоко» .
Синтаксическая агрегация может быть гораздо более сложной. Например, агрегирование может включать один из компонентов в другой; например, мы можем объединить Джон пошел в магазин и Магазин был закрыт в предложение Джон пошел в магазин, который был закрыт .
С прагматической точки зрения объединение предложений часто предполагает читателю, что эти предложения связаны друг с другом. Если это не так, читатель может запутаться. Например, тот, кто читает Иоанна, пошел в магазин и купил яблоко, может сделать вывод, что яблоко было куплено в магазине; если это не так, то эти предложения не следует объединять.
Алгоритмы и проблемы
[ редактировать ]Алгоритмы агрегации должны делать две вещи:
- Решите, когда следует объединить два компонента.
- Решите, как следует агрегировать два компонента, и создайте агрегированную структуру.
Первый вопрос – решение о том, когда агрегировать, – плохо изучен. Решения об агрегировании, безусловно, зависят от семантических отношений между составляющими, как упоминалось выше; они также зависят от жанра (например, бюрократические тексты имеют тенденцию быть более агрегированными, чем инструкции). Вероятно, они должны зависеть от риторики и структуры дискурса. [1] Вероятно, важен и уровень грамотности читателя (плохим читателям нужны более короткие предложения). [2] Но у нас нет интегрированной модели, которая бы объединяла все эти факторы в единый алгоритм .
Что касается второго вопроса, то были проведены некоторые исследования различных типов агрегирования и способов их проведения. Харбуш и Кемпен описывают несколько стратегий синтаксической агрегации. В их терминологии Джон пошел в магазин и купил яблоко — это пример приведения союза . прямого [3] Гораздо меньше известно о концептуальной агрегации. Ди Эухенио и др. покажите, как концептуальная агрегация может быть выполнена в интеллектуальной системе обучения, и продемонстрируйте, что выполнение такой агрегации делает систему более эффективной (и что концептуальная агрегация оказывает большее влияние, чем синтаксическая агрегация). [4]
Программное обеспечение
[ редактировать ]К сожалению, программного обеспечения для выполнения агрегации не так много. [ нужна ссылка ] Однако система SimpleNLG [5] включает ограниченную поддержку базовой агрегации. Например, следующий код заставляет SimpleNLG выводить сообщение « Мужчина голоден и покупает яблоко» .
SPhraseSpec s1 = nlgFactory.createClause("the man", "be", "hungry");
SPhraseSpec s2 = nlgFactory.createClause("the man", "buy", "an apple");
NLGElement result = new ClauseCoordinationRule().apply(s1, s2);
System.out.println(realiser.realiseSentence(result));
Ссылки
[ редактировать ]- ^ Д. Скотт и К. де Соуза (1990). Передача сообщения при генерации текста на основе RST. В Дейле и др. (ред.) « Текущие исследования в области генерации естественного языка» . Академическая пресса
- ^ С. Уильямс и Э. Рейтер (2008). Создание отчетов об основных навыках для читателей с низкой квалификацией. Инженерия естественного языка 14: 495-535
- ^ К. Харбуш и Дж. Кемпен (2009). Генерация многоязычного многоязычного координатного эллипса: единый подход, основанный на постредактировании. В материалах ЭНЛГ-2009 28:105-144. [1]
- ^ Б Ди Эухенио, Д Фоссати, Д Ю (2005). Агрегация улучшает обучение: эксперименты по созданию естественного языка для интеллектуальных систем обучения. В протоколе ACL-2005, стр. 50–57. [2]
- ^ Гатт и Э. Рейтер (2009). SimpleNLG: Механизм реализации для практических приложений. Материалы ENLG09 [3]