Операторная грамматика
![]() | Эта статья включает список литературы , связанную литературу или внешние ссылки , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( Июль 2024 г. ) |
Операторная грамматика — это математическая теория человеческого языка, объясняющая, как язык передает информацию . Эта теория является кульминацией всей деятельности Зеллига Харриса , основные публикации которого были опубликованы в конце прошлого века. Операторная грамматика предполагает, что каждый человеческий язык представляет собой самоорганизующуюся систему, в которой как синтаксические , так и семантические свойства слова устанавливаются исключительно по отношению к другим словам. Таким образом, никакой внешней системы ( метаязыка для определения правил языка не требуется ). Вместо этого эти правила усваиваются посредством их использования и участия, как и в случае с большей частью социального поведения . Теория согласуется с идеей о том, что язык развивался постепенно, при этом каждое последующее поколение привносило новую сложность и разнообразие.
Грамматика операторов постулирует три универсальных ограничения: зависимость (определенные слова зависят от присутствия других слов для формирования высказывания), правдоподобие (некоторые комбинации слов и их зависимых слов более вероятны, чем другие) и редукция (слова в комбинациях с высокой вероятностью могут быть сокращены). к более коротким формам, а иногда и вовсе опускаются). Вместе они составляют теорию языковой информации : зависимость строит структуру предикат-аргумент ; вероятность создает различные значения; сокращение позволяет компактные формы для общения.
Зависимость
[ редактировать ]Фундаментальным механизмом грамматики операторов является ограничение зависимости: определенные слова ( операторы ) требуют, чтобы в высказывании присутствовало одно или несколько слов (аргументов). В предложении Джон носит ботинки оператор носит требует наличия двух аргументов, таких как Джон и ботинки . (Это определение зависимости отличается от других грамматик зависимостей , в которых говорят, что аргументы зависят от операторов.)
В каждом языке отношение зависимости между словами порождает синтаксические категории , в которых допустимые аргументы оператора определяются с точки зрения их требований зависимости. Класс N содержит слова, которые не требуют присутствия других слов (например, Джон ). Класс O N содержит слова, для которых требуется ровно одно слово типа N (например, stumble ). Класс O O содержит слова, для которых требуется ровно одно слово типа O (например, красивый ). Класс O NN содержит слова, для которых требуются два слова типа N (например, износ ). Класс O OO содержит слова, для которых требуются два слова типа O (например, потому что ), как в примере « Джон спотыкается, потому что Джон носит ботинки» . Другие классы включают O ON (например, с ), O NO (например , сказать ), O NNN (например, поставить ) и ON NNO (например, спросить ).
Категории в грамматике операторов универсальны и определяются исключительно с точки зрения того, как слова соотносятся с другими словами, и не зависят от внешнего набора категорий, таких как существительное, глагол, прилагательное, наречие, предлог, союз и т. д. Свойства зависимостей каждого слова можно наблюдать в процессе использования и, следовательно, можно изучить.
Вероятность
[ редактировать ]Ограничение зависимости создает структуру (синтаксис), в которой любое слово соответствующего класса может быть аргументом данного оператора. Ограничение правдоподобия накладывает дополнительные ограничения на эту структуру, делая некоторые комбинации оператор/аргумент более вероятными, чем другие. Таким образом, Джон носит шляпы с большей вероятностью, чем Джон носит снег, что, в свою очередь, более вероятно, чем Джон носит отпуск . Ограничение правдоподобия создает значение (семантику), определяя каждое слово в терминах слов, которые оно может принимать в качестве аргументов или аргументами которых оно может быть.
Каждое слово имеет уникальный набор слов, с которым оно встречается, называемый его выбором . Последовательный выбор слова — это набор слов, для которых отношение зависимости имеет вероятность выше средней. Слова, близкие по значению, имеют схожий последовательный подбор. Этот подход к значению является самоорганизующимся, поскольку для определения значения слов не требуется никакой внешней системы. Вместо этого значение слова определяется его использованием среди говорящих. Модели частого использования можно наблюдать и, следовательно, можно изучить. Новые слова могут быть введены в любое время и определены посредством их использования.
В этом смысле грамматику связей можно рассматривать как своего рода операторную грамматику, поскольку связь слов полностью определяется их контекстом и каждому выбору присваивается логарифмическое правдоподобие.
Снижение
[ редактировать ]Ограничение сокращения действует на комбинации операторов и аргументов с высокой вероятностью и придает более компактные формы. Определенные сокращения позволяют полностью исключить слова из высказывания. Например, фраза «Я ожидаю, что Джон придет» сводится к «Я ожидаю, что Джон придет» , поскольку вероятность прихода с высокой вероятностью ниже «ожидаю» . Предложение Джон носит ботинки и Джон носит шляпы можно свести к Джон носит ботинки и шляпы, поскольку повторение первого аргумента Джон под оператором и весьма вероятно. John reads Things можно свести к John reads , поскольку аргумент Things имеет высокую вероятность возникновения под любым оператором.
Определенные сокращения сокращают слова до более коротких форм, создавая местоимения, суффиксы и префиксы ( морфология ). Джон носит ботинки, а Джон носит шляпы можно сократить до Джон носит ботинки и он носит шляпы , где местоимение он является сокращенной формой от Джона . Суффиксы и префиксы можно получить путем добавления других свободно встречающихся слов или их вариантов. Джон может нравиться, можно свести к Джону нравится . Джон задумчивый сокращен от Джон полон мыслей , а Джон против войны от Джон против войны .
Модификаторы являются результатом нескольких подобных сокращений, которые дают начало прилагательным, наречиям, предложным словосочетаниям , придаточным предложениям и т. д.
- Джон носит ботинки; ботинки кожаные (два предложения, соединенные точкой с запятой ) →
- Джон носит кожаные ботинки (сокращение повторяющегося существительного к относительному местоимению ) →
- Джон носит кожаные сапоги (пропуск фраз с высокой степенью вероятности ) →
- Джон носит кожаные ботинки (пропуск оператора высокой вероятности , перенос краткого модификатора слева от существительного)
Каждый язык имеет уникальный набор сокращений. Например, в некоторых языках есть морфология, а в некоторых нет; некоторые транспонируют короткие модификаторы, а некоторые нет. Каждое слово в языке участвует только в определенных видах редукции. Однако в каждом случае сокращенный материал можно реконструировать на основе знания того, что вероятно в данной комбинации оператор/аргумент. Сокращение, в котором участвует каждое слово, наблюдаемо и, следовательно, поддается изучению, точно так же, как изучаются свойства зависимости и правдоподобия слова.
Информация
[ редактировать ]Важность сокращений в операторной грамматике заключается в том, что они отделяют предложения, содержащие сокращенные формы, от тех, которые их не содержат (основные предложения). Все сокращения являются перефразами , поскольку не удаляют никакой информации, а лишь делают предложения более компактными. Таким образом, базовые предложения содержат всю информацию языка, а сокращенные предложения являются их вариантами. Базовые предложения состоят из простых слов без модификаторов и в основном без аффиксов, например, падает снег , овцы едят траву , Джон знает, что овцы едят траву , то, что овцы едят снег, удивляет Джона .
Каждый оператор в предложении вносит свой вклад в информацию в соответствии с вероятностью его появления со своими аргументами. Высоко ожидаемые комбинации имеют низкую информативность; редкие сочетания обладают высокой информативностью. Точный вклад оператора определяется его выбором, набором слов, с которыми он встречается с высокой частотой. Аргументы boots , шляпы , овцы , трава и снег различаются по значению в зависимости от операторов, для которых они могут с высокой вероятностью появляться в первой или второй позиции аргумента. Например, снег ожидается как первый аргумент падения , а не еды верно обратное , тогда как для овец . Аналогичным образом, операторы eat , devour , жуют и глотают различаются по значению в той мере, в какой различаются аргументы, которые они выбирают, и операторы, которые их выбирают.
Грамматика операторов предсказывает, что информация, передаваемая предложением, представляет собой накопление вкладов каждого аргумента и оператора. Приращение информации, которую данное слово добавляет к новому предложению, определяется тем, как оно использовалось раньше. В свою очередь, новые употребления расширяют или даже изменяют информационное содержание, связанное со словом. Поскольку этот процесс основан на частом использовании, значения слов относительно стабильны с течением времени, но могут меняться в соответствии с потребностями языкового сообщества.
Библиография
[ редактировать ]- Харрис , Зеллиг (1982), Грамматика английского языка по математическим принципам , Нью-Йорк: Джон Уайли и сыновья, ISBN 0-471-02958-0
- Харрис , Зеллиг (1988), Язык и информация , Нью-Йорк: издательство Колумбийского университета, ISBN 0-231-06662-7
- Харрис , Зеллиг (1989), Форма информации в науке: анализ подъязыка иммунологии , Springer, ISBN 90-277-2516-0
- Харрис , Зеллиг (1991), Теория языка и информации: математический подход , Oxford University Press, США, ISBN 0-19-824224-7