Теория риторической структуры
Теория риторической структуры ( RST ) — это теория организации текста, которая описывает отношения, существующие между частями текста. Первоначально он был разработан Уильямом Манном , Сандрой Томпсон , Кристианом МИМ Маттиссеном и другими в Южной Калифорнии Университета Институте информационных наук (ISI) и определен в статье 1988 года. [1] [2] [3] Теория была разработана в рамках исследований компьютерной генерации текста . Позже исследователи естественного языка начали использовать RST для суммирования текста и других приложений. Он объясняет связность , постулируя иерархическую, связанную структуру текстов. [3] В 2000 году Дэниел Марку, также из ISI, продемонстрировал, что практический анализ дискурса и обобщение текста также могут быть достигнуты с помощью RST. [4] [5] [6]
Риторические отношения
[ редактировать ]Риторические отношения, отношения связности или дискурсивные отношения — это паратактические (координатные) или гипотаксические (подчиненные) отношения, которые сохраняются в двух или более текстовых интервалах. [7] Широко распространено мнение, что понятие связности выражается в таких текстовых отношениях. RST с использованием риторических отношений предоставляет аналитику систематический способ анализа текста. Анализ обычно строится путем чтения текста и построения дерева с использованием отношений. Следующий пример представляет собой заголовок ирезюме, опубликованное в начале статьи в журнале Scientific American (Рамачандран и Анстис, 1986). Исходный текст, разбитый на пронумерованные части, выглядит следующим образом: [3]

- [Название:] Восприятие кажущегося движения
- [Аннотация:] Когда движение периодически видимого объекта неоднозначно.
- зрительная система устраняет путаницу
- применяя некоторые приемы, отражающие встроенные знания о свойствах физического мира
На рисунке числами 1,2,3,4 показаны соответствующие единицы, как описано выше.Четвертый блок и третий блок образуют отношение «Средства». Третья единица является существенной частью этого отношения, поэтому ее называют ядром отношения, а четвертую единицу называют спутником отношения. Аналогично второй блок к третьему и четвертому блоку формирует отношение «Состояние». Все блоки также являются пролетами, а пролеты могут состоять из более чем одного блока.
Ядерность в дискурсе
[ редактировать ]RST устанавливает два разных типа единиц. Ядра считаются наиболее важными частями текста, тогда как спутники вносят вклад в ядра и являются второстепенными. Ядро содержит основную информацию, а спутник содержит дополнительную информацию о ядре. Спутник без ядра зачастую непонятен, тогда как текст, в котором спутники удалены, в определенной степени можно понять.
Иерархия в анализе
[ редактировать ]Отношения RST применяются в тексте рекурсивно до тех пор, пока все единицы в этом тексте не станут составляющими отношения RST. Результатом такого анализа является то, что структуры RST обычно представляются в виде деревьев с одним отношением верхнего уровня, которое охватывает другие отношения на более низких уровнях.
Почему РСТ?
[ редактировать ]- С лингвистической точки зрения RST предлагает иной взгляд на организацию текста, чем большинство лингвистических теорий .
- RST указывает на тесную связь между отношениями и связностью в тексте.
- С вычислительной точки зрения он обеспечивает характеристику текстовых отношений, которые были реализованы в различных системах и для таких приложений, как генерация текста. [8] и обобщение . [9]
В обосновании дизайна
[ редактировать ]Ученые-компьютерщики Ана Кристина Бичарра Гарсиа и Кларисса Зиккениус де Соуз использовали RST в качестве основы системы обоснования проекта под названием ADD+. [10] [11] В ADD+ RST используется в качестве основы для риторической организации базы знаний , аналогично другим системам представления знаний , таким как проблемно-ориентированная информационная система (IBIS). [11] Точно так же RST использовался в схемах представления аргументации . [12] [13] [14]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Манн, Уильям С .; Томпсон, Сандра А. (1988). «Теория риторической структуры: к функциональной теории организации текста» (PDF) . Текст: Междисциплинарный журнал по изучению дискурса . 8 (3): 243–281. дои : 10.1515/текст.1.1988.8.3.243 . S2CID 60514661 . Проверено 1 ноября 2017 г.
- ^ Маттиссен, Кристиан МИМ (июнь 2005 г.). «Вспоминая Билла Манна» . Компьютерная лингвистика . 31 (2): 161–171. дои : 10.1162/0891201054224002 . S2CID 19688915 . Проверено 1 ноября 2017 г.
- ^ Перейти обратно: а б с Табоада, Майте; Манн, Уильям К. (июнь 2006 г.). «Теория риторической структуры: взгляд назад и движение вперед» (PDF) . Дискурсивные исследования . 8 (3): 423–459. CiteSeerX 10.1.1.216.381 . дои : 10.1177/1461445606061881 . S2CID 2386531 .
- ^ Марку, Дэниел (2000). Теория и практика разбора и реферирования дискурса . Кембридж, Массачусетс: MIT Press . ISBN 978-0262133722 . OCLC 43811223 .
- ^ Карлсон, Линн; Марку, Дэниел; Окуровски, Мэри Эллен (2003) [2001]. «Создание корпуса с тегами дискурса в рамках теории риторической структуры» (PDF) . Ин Куппевельт, Ян ван; Смит, Ронни В. (ред.). Современные и новые направления в дискурсе и диалоге . Текстовые, речевые и языковые технологии. Том. 22. Дордрехт; Бостон: Kluwer Academic Publishers . стр. 85–112. дои : 10.1007/978-94-010-0019-2_5 . ISBN 978-1402016141 . OCLC 53097055 .
- ^ «Хронология» . isi.edu . Институт информационных наук . Проверено 1 ноября 2017 г.
- ^ Табоада, Майте (2009). «Неявные и явные отношения когерентности» (PDF) . Ин Ренкема, Ян (ред.). Дискурс, конечно: обзор исследований в области дискурсоведения . Амстердам; Филадельфия: Издательство Джона Бенджамина . стр. 127–140. дои : 10.1075/z.148.13таб . ISBN 9789027232588 . OCLC 276996573 .
- ^ «RST и генерация текста» . ccl.pku.edu.cn. Проверено 1 ноября 2017 г.
- ^ Узеда, Винисиус Родригес; Пардо, Тьяго Александр Салгейру; Нуньес, Мария дас Грасас Вольпе (ноябрь 2008 г.). «Оценка методов автоматического резюмирования текста на основе теории риторической структуры» (PDF) . Восьмая международная конференция по проектированию и применению интеллектуальных систем: Гаосюн, Тайвань, 26–28 ноября 2008 г. ISDA'08. Том. 2. Пискатауэй, Нью-Джерси: IEEE . стр. 389–394. дои : 10.1109/ISDA.2008.289 . ISBN 978-0-7695-3382-7 . S2CID 16331006 . Проверено 1 ноября 2017 г.
- ^ Гарсия, Ана Кристина Бичарра; Союз, Кларисса Зиккениус де (апрель 1997 г.). «ADD+: включение риторических структур в активные документы» (PDF) . AI EDAM: искусственный интеллект для инженерного проектирования, анализа и производства . 11 (2): 109–124. дои : 10.1017/S0890060400001906 .
- ^ Перейти обратно: а б Регли, Уильям К.; Ху, Сяочунь; Этвуд, Майкл; Сунь, Вэй (декабрь 2000 г.). «Обзор систем обоснования дизайна: подходы, представление, сбор и извлечение» (PDF) . Инженерное дело с компьютерами . 16 (3–4): 209–235. дои : 10.1007/PL00013715 . S2CID 6394458 .
- ^ Грин, Нэнси Л. (август 2009 г.). «Представление аргументации в тексте с помощью теории риторической структуры». Аргументация . 24 (2): 181–196. дои : 10.1007/s10503-009-9169-4 . S2CID 145388742 .
- ^ Грин, Нэнси Л. (ноябрь 2015 г.). «Аннотирование доказательной аргументации в биомедицинском тексте». Международная конференция IEEE по биоинформатике и биомедицине (BIBM) 2015 г., Вашингтон, округ Колумбия, США, 9–12 ноября 2015 г. Пискатауэй, Нью-Джерси: IEEE . стр. 922–929. дои : 10.1109/BIBM.2015.7359807 . ISBN 978-1-4673-6799-8 . OCLC 972619754 . S2CID 7821394 .
- ^ Митрович, Елена; О'Рейли, Клифф; Младенович, Миляна; Хандшу, Зигфрид (январь 2017 г.). «Онтологические представления риторических фигур для добычи аргументов» . Аргумент и вычисление . 8 (3): 267–287. дои : 10.3233/AAC-170027 .