Смыслово-текстовая теория
Теория значения-текста ( MTT ) — теоретическая лингвистическая концепция, впервые предложенная в Москве Александром Жолковским и Игорем Мельчуком . [1] для построения моделей естественного языка. Теория обеспечивает обширную и сложную основу для лингвистического описания и, благодаря своему формальному характеру, особенно хорошо подходит для компьютерных приложений , включая машинный перевод , фразеологию и лексикографию . [ нужна ссылка ]
Уровни представительства
[ редактировать ]Лингвистические модели в теории значения и текста основаны на том принципе, что язык состоит в отображении содержания или значения (семантики) высказывания на его форму или текст (фонетика). Промежуточными между этими полюсами являются дополнительные уровни репрезентации на синтаксическом и морфологическом уровнях.

Представления на разных уровнях последовательно отображаются от неупорядоченной сети семантического представления (SemR) через древовидные структуры зависимостей синтаксического представления (SyntR) к линеаризованной цепочке морфем морфологического представления (MorphR) и, в конечном итоге, упорядоченная во времени строка телефонов фонетического представления (PhonR) (обычно не рассматриваемая в работах по этой теории). Отношения между представлениями на разных уровнях считаются переводами или отображениями, а не преобразованиями, и опосредуются наборами правил, называемых «компонентами», которые обеспечивают соответствующие, специфичные для языка переходы между уровнями.
Семантическое представление
[ редактировать ]Семантические представления (SemR) в теории смысла и текста состоят в основном из семантической структуры, напоминающей паутину (SemS), которая сочетается с другими структурами семантического уровня (в первую очередь с семантико-коммуникативной структурой [SemCommS], [2] которая представляет собой то, что в других структурах обычно называют « информационной структурой »). Сама SemS состоит из сети предикатов , представленных в виде узлов со стрелками, идущими от узлов предикатов к узлам аргументов . Аргументы могут быть общими для нескольких предикатов, а предикаты сами могут быть аргументами других предикатов. Узлы обычно соответствуют лексическим и грамматическим значениям, поскольку они непосредственно выражаются элементами лексикона или флективными средствами, но теория допускает возможность разложения значений на более детальное представление посредством процессов семантического перефразирования. [3] которые также являются ключом к решению проблем синонимии и переводческой эквивалентности между языками. SemR отображаются на следующий уровень представления, глубоко-синтаксическое представление, по правилам семантического компонента, которые допускают связь один ко многим между уровнями (то есть один SemR потенциально может быть выражен с помощью множества синтаксических структур). , в зависимости от лексического выбора, сложности SemR и т. д.).Структурное описание и (полу-)автоматическое создание SemR подлежат исследованию. [4] Здесь при декомпозиции используются семантические простые числа естественного семантического метаязыка для определения критерия завершения декомпозиции.
Синтаксическое представление
[ редактировать ]Синтаксические представления (SyntR) в теории смысла и текста реализуются с помощью деревьев зависимостей , которые составляют синтаксическую структуру (SyntS). SyntS сопровождается различными другими типами структур, в первую очередь синтаксической коммуникативной структурой и анафорической структурой. В теории значения и текста существует два уровня синтаксиса: глубокое синтаксическое представление (DSyntR) и поверхностное синтаксическое представление (SSyntR). Хороший обзор синтаксиса теории значения и текста, включая его описательное применение, можно найти у Мельчука (1988). [5] Комплексная модель поверхностного синтаксиса английского языка представлена в работе Мельчука и Перцова (1987). [6]
Глубокое синтаксическое представление (DSyntR) напрямую связано с SemS и стремится уловить «универсальные» аспекты синтаксической структуры. Деревья на этом уровне представляют отношения зависимости между лексемами (или между лексемами и ограниченным набором абстрактных сущностей, таких как лексические функции ). Глубокие синтаксические отношения между лексемами в DSyntR ограничены универсальным набором из дюжины синтаксических отношений, включая семь ранговых актантных (аргументных) отношений, модификационное отношение и координационное отношение. Лексемы с чисто грамматической функцией, такие как лексически управляемые предлоги, не включены на этот уровень представления; значения флективных категорий, которые получены из SemR, но реализованы морфологией, представлены в виде индексов на соответствующих лексических узлах, к которым они относятся. DSyntR отображается на следующий уровень представления по правилам глубинного синтаксического компонента.
Поверхностно-синтаксическое представление (SSyntR) представляет собой специфичную для языка синтаксическую структуру высказывания и включает узлы для всех лексических единиц (в том числе имеющих чисто грамматическую функцию) в предложении. Синтаксические отношения между лексическими единицами на этом уровне не ограничены и считаются полностью специфичными для языка, хотя считается, что многие из них схожи (или, по крайней мере, изоморфны) в разных языках. SSyntR отображается на следующий уровень представления по правилам поверхностно-синтаксического компонента.
Морфологическое представление
[ редактировать ]Морфологические представления (MorphR) в теории значения и текста реализуются в виде строк морфем, расположенных в фиксированном линейном порядке, отражающем порядок элементов в реальном высказывании. Это первый уровень репрезентации, на котором линейный приоритет считается лингвистически значимым, эффективно группируя порядок слов вместе с морфологическими процессами и просодией как одно из трех нелексических средств, с помощью которых языки могут кодировать синтаксическую структуру. Как и в случае с синтаксическим представлением, существует два уровня морфологического представления — глубокое и поверхностное морфологическое представление. Подробные описания морфологических представлений теории смысла и текста можно найти у Мельчука (1993–2000). [7] и Мельчук (2006). [8]
Глубокое морфологическое представление (DMorphR) состоит из строк лексем и морфем — например, THE SHOE + PL ON BILL + POSS FOOT + PL . Глубокий морфологический компонент правил отображает эту строку на поверхностное морфологическое представление (SMorphR), преобразуя морфемы в соответствующие морфы и выполняя морфологические операции, реализующие неконкатенативные морфологические процессы - в случае нашего примера выше, давая нам /the Shoes+s на ногах Билла/. Правила поверхностного морфологического компонента, подмножество которых включает морфонематические правила, отображают SMorphR на фонетическое представление [ðə ʃuz on bɪlz fi:t].
Лексикон
[ редактировать ]Важнейшим аспектом теории значения-текста является лексикон, который считается всеобъемлющим каталогом лексических единиц (ЛЕ) языка, причем этими единицами являются лексемы, словосочетания и другие фраземы , конструкции и другие конфигурации лингвистических элементов, которые являются усваивается и реализуется в речи пользователями языка. Лексика в теории смысла-текста представлена толковым комбинаторным словарем (ЭКС). [9] [10] который включает записи для всех LU языка, а также информацию, которую говорящие должны знать относительно их синтаксиса (правила и условия комбинаторики, специфичные для LU). РДРВ для русского языка подготовили Мельчук и др. (1984), [11] и ECD для французского языка были опубликованы как Mel'čuk et al. (1999) [12] и Мельчук и Польгер (2007). [13]
Лексические функции
[ редактировать ]Одним из важных открытий лингвистики значения и текста стало признание того, что LU в языке могут быть связаны друг с другом в абстрактном семантическом смысле и что это же отношение также сохраняется для многих лексически несвязанных пар или наборов LU. Эти отношения представлены в теории смысла-текста как лексические функции (ЛФ). [14] Примером простого LF является Magn(L), который представляет собой словосочетания, используемые для усиления, например, проливной дождь , сильный ветер или интенсивная бомбардировка . Носитель английского языка знает, что для данной лексемы L, такой как ДОЖДЬ, значение Magn(RAIN) = HEAVY, тогда как Magn(WIND) = STRONG и так далее. Теория значения и текста в настоящее время признает несколько десятков стандартных LF, которые, как известно, повторяются в разных языках.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Жолковский, Александр К.; Игорь Алексеевич Мельчук (1965). «О возможном методе и инструментах семантического синтеза». Научно-техническая информация . 5 : 23–28.
- ^ Мельчук, Игорь А. (2001). Коммуникативная организация в естественном языке: Семантико-коммуникативная структура предложений . Амстердам: Джон Бенджаминс.
- ^ Миличевич, Ясмина (2007). Перефразируя. Моделирование языкового парафраза . Берн: Питер Лэнг.
- ^ Фендрих, Дж. и др. 2014: «Разложение формального языка на семантические простые числа». ADCAIJ: Достижения в области распределенных вычислений и искусственного интеллекта, журнал 3.8 (2014): 56-73.
- ^ Мельчук, Игорь А. (1988). Синтаксис зависимостей: Теория и практика . Олбани, Нью-Йорк: SUNY Press.
- ^ Мельчук Игорь А.; Николай Владимирович Перцов (1987). Поверхностный синтаксис английского языка: формальная модель в рамках структуры «Смысл-текст» . Амстердам: Джон Бенджаминс.
- ^ Мельчук Игорь Александрович (1993–2000). Курс общей морфологии . Монреаль: Les Presses de l'Université de Montréal.
- ^ Мельчук, Игорь А. (2006). Аспекты теории морфологии . Берлин: Мутон де Грюйтер.
- ^ Мельчук Игорь А.; Андре Клас; Ален Польгер (1995). Введение в объяснительную и комбинаторную лексикологию . Париж: Дюкуло.
- ^ Мельчук, Игорь А. (2006). Сика, Дж. (ред.). «Толковый комбинаторный словарь». Открытые проблемы языкознания и лексикографии . Монца: Полиметрика: 222–355.
- ^ Mel’čuk, Igor A.; Aleksandr K. Žolkovsky; Juri Apresjan (1984). Толково-комбинаторный словарь современного русского языка: Опыты семантико-синтаксического описания русской лексики. [Explanatory Combinatorial Dictionary of Modern Russian: Semantico-Syntactic Studies of Russian Vocabulary] . Wiener Slawistischer Almanach: Vienna.
- ^ Мельчук Игорь А.; Н. Арбачевский-Жумари; Лида Иорданская; С.Манта; Ален Польгер (1999). Толковый и комбинационный словарь современного французского языка. Лексико-семантическое исследование IV . Монреаль: Les Presses de l'Université de Montréal.
- ^ Мельчук Игорь А.; Ален Польгер (2007). Активный французский лексикон: изучение словарного запаса на основе 20 000 семантических производных и словосочетаний французского языка . Париж: Дюкуло.
- ^ Мельчук, Игорь А. (1996). Ваннер, Лео (ред.). «Лексические функции: инструмент описания лексических отношений в лексиконе». Лексические функции в лексикографии и обработке естественного языка : 37–102.
Дальнейшее чтение
[ редактировать ]Обзоры
[ редактировать ]- Мельчук, Игорь А. (1981). «Модели смысла и текста: новейшая тенденция в советском языкознании». Ежегодный обзор антропологии . 10 : 27–62. doi : 10.1146/annurev.an.10.100181.000331 .
- Мельчук, Игорь А. (1988). Синтаксис зависимостей: Теория и практика . Олбани, Нью-Йорк: SUNY Press. ISBN 9780887064500 .
Общий
[ редактировать ]- Жолковский А.К. и Мельчук Игорь А. (1965). О возможном методе и инструментах семантического синтеза. Научно-техническая информация 5, 23–28.
- И. А. Мельчук . Опыт теории лингвистических моделей «Смысл ↔ Текст». М., 1974 (2nd ed., 1999).
- Я. А. Мельчук. Русский язык в модели «Смысл ↔ Текст». Москва-Вена, 1995.
- И. А. Мельчук. На пути к смыслотекстовой лингвистике. Вступительный урок. П.: Коллеж де Франс, Международная кафедра, 1997.
- Лео Ваннер (редактор), «Последние тенденции в теории смысла текста». Амстердам, Филадельфия: Паб J. Benjamins, 1997. ISBN 1-55619-925-2 , ISBN 90-272-3042-0
- И.А. Большаков, А.Ф. Гельбух. Модель значения-текста: тридцать лет спустя . Международный форум по информации и документации. J. FID 519, ISSN 0304-9701, № 1, 2000.
Синтаксис
[ редактировать ]- И. А. Мельчук. Поверхностный синтаксис русских числовых выражений. Wien: Wiener Slawistischer Almanach, 1985.
- И.А. Мельчук, Н.В. Перцов. Поверхностный синтаксис английского языка: формальная модель в рамках структуры «Смысл-текст». Амстердам, Филадельфия: Бенджаминс, 1987. ISBN 90-272-1515-4
- И. А. Мельчук. Синтаксис зависимостей: теория и практика. Олбани, Нью-Йорк: SUNY, 1988. ISBN 0-88706-450-7 , ISBN 0-88706-451-5
- И. А. Мельчук. Актанты в семантике и синтаксисе. I, II, Языкознание, 2004, 42:1, 1–66; 42:2, 247—291.
Морфология
[ редактировать ]- И. А. Мельчук. Курс общей морфологии, вып. 1–5. Монреаль: Les Presses de l'Université de Montréal / Париж: CNRS Editions, 1993–2000 гг.
- И. А. Мельчук. Аспекты теории морфологии. Берлин; Нью-Йорк: Мутон де Грюйтер, 2006. ISBN 3-11-017711-0
Лексикография
[ редактировать ]- I. A. Mel’čuk, A. K. Zholkovsky, Ju. D. Apresjan et al. Explanatory Combinatorial Dictionary of Modern Russian: Semantico-Syntactic Studies of Russian Vocabulary / Толково-комбинаторный словарь современного русского языка: Опыты семантико-синтаксического описания русской лексики. Wien: Wiener Slawistischer Almanach, 1984.
- И. А. Мельчук, А. Клас и А. Польгер. Введение в объяснительную и комбинаторную лексикологию. П.: Дюкуло, 1995. — ISBN 2-8011-1106-6
- И.А. Мельчук и др. Толковый и комбинационный словарь современного французского языка. Лексико-семантическое исследование IV, Монреаль: Les Presses de l’Université de Montréal, 1999. — ISBN 2-7606-1738-6
Внешние ссылки
[ редактировать ]- На веб-сайте Meaning-Text Theory размещаются материалы проводимой два раза в год конференции MTT.
- Обсерватория лингвистики Sens-Texte (OLST)
- Значение – Текст @ neuvel.net , отличное введение в теорию.
- Значение – текстовая онлайн-библиотека
Значение – текстовое программное обеспечение
[ редактировать ]- Лингвистическая виртуальная машина Carabao, предоставленная LinguaSys
- Система лингвистической обработки ETAP-3 , описываемая как «полноценная реализация НЛП теории смысла и текста» (официальный сайт)