Лексика (лингвистика)

Из Википедии, бесплатной энциклопедии

В лингвистике термин лексис (от древнегреческого : λέξις «слово») обозначает полный набор всех возможных слов в языке или определенное подмножество слов, которые сгруппированы по некоторым определенным лингвистическим критериям. Например, общий термин «английская лексика» относится ко всем словам английского языка . [1] в то время как более конкретный термин «английская религиозная лексика» относится к определенному подмножеству английской лексики, охватывающему только слова, которые семантически связаны с религиозной сферой жизни. [2]

В системно-функциональной лингвистике лексика или лексическая единица это способ обозначения определенной вещи или вида явления. Поскольку лексика с системно-функциональной точки зрения представляет собой способ обращения, она может быть реализована с помощью нескольких грамматических слов, таких как «Белый дом», «Нью-Йорк» или «сердечный приступ». Более того, поскольку лексика — это способ обращения, разные слова, такие как «ребенок» , «дети» , « детский» и «детский», могут реализовывать одну и ту же лексическую единицу.

Лексические группы [ править ]

Лексическая группировка может быть:

  • Формульный: он опирается на частично фиксированные выражения и весьма вероятные словосочетания.
  • Идиоматический : следует соглашениям и шаблонам использования.
  • Метафорический : такие понятия, как время и деньги , бизнес и секс , системы и вода , имеют большую часть одного и того же словарного запаса.
  • Грамматический : используются правила, основанные на выборке лексического корпуса.
  • Зависит от регистра: одно и то же слово используется по-разному и/или реже в разных контекстах.

Основная область исследований, психолингвистика и нейролингвистика , включает в себя вопрос о том, как слова извлекаются из ментального лексического корпуса при онлайновой языковой обработке и производстве. Например, когортная модель пытается описать лексический поиск с точки зрения сегментной активации конкурирующих лексических статей. [3] [4]

Формульный язык [ править ]

В последние годы составление языковых баз данных с использованием реальных образцов речи и письма позволило исследователям по-новому взглянуть на состав языков. Помимо прочего, статистические методы исследования дают достоверное представление о том, как взаимодействуют слова. Наиболее интересные открытия были сделаны в отношении дихотомии между использованием языка (как язык используется) и использованием языка (как язык может использоваться).

Использование языка показывает, какие слова и их партнеры наиболее вероятны. Главный вывод этого исследования заключается в том, что пользователи языка в очень высокой степени полагаются на готовые языковые « лексические фрагменты », которые можно легко комбинировать для формирования предложений. Это избавляет говорящего от необходимости грамматически анализировать каждое предложение, но при этом эффективно справляется с ситуацией. Типичные примеры включают: «Я понимаю, что вы имеете в виду», или «Не могли бы вы передать мне…» или «Недавние исследования показывают, что…».

С другой стороны, использование языка — это то, что происходит, когда готовые фрагменты не отвечают непосредственным потребностям говорящего; другими словами, новое предложение вот-вот будет сформировано, и его необходимо проанализировать на предмет правильности. Грамматические правила усваиваются носителями языка, что позволяет им определять жизнеспособность новых предложений. Использование языка можно определить как запасной вариант, когда все другие варианты исчерпаны.

Контекст и сотекст [ править ]

При статистическом анализе структуры языка полезно начать с часто встречающихся контекстных слов, или так называемых ключевых слов в контексте (KWIC). После того, как миллионы образцов устной и письменной речи будут сохранены в базе данных, эти KWIC можно будет отсортировать и проанализировать на предмет их сопутствующего текста или слов, которые обычно встречаются вместе с ними. Ценные принципы, с помощью которых можно анализировать KWIC, включают:

  • Коллокация : слова и их совместное употребление (примеры включают «удовлетворение потребностей» и «запасная позиция»).
  • Семантическая просодия : слова-коннотации несут ("обрати внимание" могут быть нейтральными или протестующими, например, когда учитель говорит ученику: "Обрати внимание!")
  • Объединение : грамматика, используемая в словах (в то время как «Я надеюсь, что это вам подходит» звучит естественно, «Я надеюсь, что вам это подходит» — нет).
  • Регистр : стиль текста, в котором используется слово («Президент клянется поддерживать союзников», скорее всего, встречается в заголовках новостей, тогда как «клятвы» в речи, скорее всего, относятся к «бракам»; в письменной форме глагол «клятва» скорее всего используется как «обещание»). [5]

После сбора данных их можно отсортировать для определения вероятности совпадения. Одним из распространенных и хорошо известных способов является согласование : KWIC центрируется и показывается с десятками примеров его использования, как в примере со словом «возможность» ниже.

Согласие на возможность [ править ]

Похоже, что вот-вот наденут, это вполне возможно.  Теперь, когда Бенна больше нет
    Хиетт говорит, что такая возможность остается реальной: как часть ООП, ФОП
             добавил Грэм.  Это тоже возможно», — признал Уитлок.
           Сильная боль всегда была возможна.  В начале века оба
   что, когда это возможно, любая другая возможность, включая выступления посторонних
     что мы можем, что мы используем любую возможность, включая любую возможность
   можно было бы сдать отдельно.  Другая возможность — «конструктивный вандализм».
   народ отвергает насилие, и возможность насилия может
  французы голосуют и теперь имеют возможность получить два места в
        немедленно расследовать возможность предъявления уголовных обвинений и что ее
    Источники в Шри-Ланке говорят, что возможность переговоров с тамилами
  Шейхства тоже могли иметь возможность поощрять агитацию.
    двенадцати государств-членов о возможности их угрозы
  Мари уже рассматривала возможность убедить [f]
  функция зависимости, а возможность капиталистического развития,
       были практически беззащитны.  Возможность вторжения была очевидна.
    как ни странно и беспокоятся о возможности употребления наркотиков, так и скажем.  Скажи им
  был впервые созван для обсуждения возможности государственного переворота с целью возвращения
         в линейке ми5 и в возможности использования гос. для размазывания
    Причиной этого шага была возможность открытия нового рынка.  Дешевые терминалы
     оцениваться индивидуально.  Возможность генетического тестирования приносит это
    предоставлена ​​привилегия.  Другая возможность, конечно, заключается в том, что прогулка
            Все это подрывает возможность экономических реформ и требует
     получать.  (Зная, что попытка полового акта невозможна, необходимо
   который открыто цинично относился к возможности достижения социализма 5
      чтобы они могли осознать возможность быть гражданами, участвующими в
     отравление и пожар, столкнувшись с возможностью собственной смерти, просто чтобы быть
         вчера услышал, что возможность использования агентства для сбора
   в 1903 году, и я не предвижу возможности заменить это.  Автомобиль, который мы
   здесь действует генетический фактор, и эту возможность поддерживают, по крайней мере, несколько
      отказался даже допускать возможность того, что какая-либо из наций
   имеет долгую историю, существует вероятность того, что недавний всплеск
       Полиция расследует возможность того, что ее видели непродолжительное время.
   любые врачи, которые считают, что существует вероятность того, что они могли быть инфицированы
    находитесь в магазине, велика вероятность, что вы используете увлажняющий крем
           жизнь должна быть сделана.  Вероятность того, что молодой взрослый будет
  он завершил свой отчет о возможности контрабанды наркотиков
  была посвящена изучению возможности того, что так называемые древние народы 

Как только такое соответствие будет создано, можно будет проанализировать совпадение других слов с KWIC. Это делается с помощью t-показателя . Если мы возьмем, к примеру, слово «незнакомец» (сравнительное прилагательное и существительное), анализ t-показателя предоставит нам такую ​​информацию, как частота слов в корпусе: такие слова, как «нет» и «к», не удивительно, очень часты. ; такого слова, как «противоречие», гораздо меньше. Затем он вычисляет вхождение этого слова вместе с KWIC (« совместная частота »), чтобы определить, является ли эта комбинация необычно распространенной, другими словами, встречается ли словосочетание значительно чаще, чем можно было бы ожидать, исходя только из его частоты. Если да, то словосочетание считается сильным и заслуживает более пристального внимания.

В этом примере очень часто встречается словосочетание «не чужой»; так же как и такие слова, как «таинственный», «красивый» и «темный». Это неудивительно. Однако более интересным является то, что «споры не новы». Однако, пожалуй, самым интересным примером является идиоматическое выражение «совершенный незнакомец». Такое словосочетание нельзя было предсказать само по себе, поскольку оно не означает «незнакомец, который совершенен», как следовало бы ожидать. Его необычно высокая частота показывает, что эти два слова сильно сочетаются друг с другом и являются очень идиоматичными выражениями.

Как показано выше , изучение корпусной лингвистики дает нам много информации о реальной природе языка. По сути, лексический корпус, похоже, построен на предпосылке, что к использованию языка лучше всего подходить как к процессу сборки , при котором мозг связывает воедино готовые фрагменты. Интуитивно это имеет смысл: это естественный путь к облегчению бремени необходимости «изобретать велосипед» каждый раз, когда мы говорим. Кроме того, использование известных выражений позволяет быстро передавать массу информации, поскольку слушателю не нужно разбивать высказывание на составные части. В книге «Слова и правила» Стивен Пинкер показывает этот процесс в работе с правильными и неправильными глаголами: мы собираем первые, которые дают нам правила, которые мы можем применять к неизвестным словам (например, окончание «-ed» для глаголов прошедшего времени позволяет нам отклонить неологизм «гуглить» на «гуглил»). Другие образцы, неправильные глаголы, мы храним отдельно как уникальные элементы, которые нужно запомнить. [6]

Метафора как принцип организации лексики [ править ]

Другой метод эффективного хранения языка в лексическом корпусе включает использование метафоры в качестве принципа хранения. («Хранилище» и «файлы» являются хорошими примерами того, как человеческая память и память компьютера связаны с одним и тем же словарем; так было не всегда). Работу Джорджа Лакоффа обычно называют краеугольным камнем изучения метафоры в языке. [7] Один пример довольно распространен: «время – деньги». Мы можем экономить, тратить и тратить время и деньги. Еще один интересный пример связан с бизнесом и сексом: предприятия проникают на рынок, привлекают клиентов и обсуждают «управление взаимоотношениями». Бизнес – это тоже война: запустить рекламную кампанию, закрепиться (уже восходящая метафора в военном использовании) на рынке, понести убытки. Системы же — это вода: поток информации, переполненный людьми, поток трафика. НОА [ нужны разъяснения ] Теория лексического усвоения утверждает, что фильтр метафорической сортировки помогает упростить языковое хранение и избежать перегрузки.

Грамматика [ править ]

Компьютерные исследования показали, что грамматики в смысле ее способности создавать совершенно новый язык избегают, насколько это возможно. Бибер и его команда, работающая в Университете Аризоны над Cobuild GSWE, отметили необычно высокую частоту словосочетаний, которые сами по себе не имеют смысла. Но один или два образца быстро показывают их функцию: их можно вставить как грамматический связующий элемент без предварительного анализа формы. Даже беглое наблюдение примеров показывает, насколько они распространены во всех формах использования языка, хотя мы едва ли осознаем их существование. Исследования показывают, что язык сильно насыщен такими связками во всех регистрах; два примера включают «вы хотите, чтобы я», обычно встречающееся в речи, или «не было ничего значимого», встречающееся в академических регистрах. Объединившись в речь, они могут создавать понятные предложения, такие как «Я не уверен» + «если они» + «они собираются», чтобы сформировать «Я не уверен, собираются ли они». Такое предложение облегчает нагрузку на лексические единицы, так как не требует никакого грамматического анализа. [8]

Зарегистрироваться [ править ]

Британский лингвист Майкл К. Холлидей предлагает полезную дихотомию устной и письменной речи , которая на самом деле влечет за собой сдвиг парадигмы: в то время как лингвистическая теория постулирует превосходство устной речи над письменной (поскольку первая является источником, возникает естественным образом и, таким образом, предшествует письменный язык), или письменное поверх устного (по тем же причинам: письменный язык является высшей формой рудиментарной речи), Холлидей утверждает, что это две совершенно разные сущности.

Он утверждает, что речь грамматически сложна, а письмо лексически плотно. [9] Другими словами, такое предложение, как «мой двоюродный брат, тот, о котором я говорил на днях, — тот, кто живет в Хьюстоне, а не в Далласе, — позвонил мне вчера, чтобы рассказать ту же самую историю о Мэри, которая...» чаще всего встречается в разговоре, а не в газетном заголовке. С другой стороны, типичным заголовком новостей было бы «Премьер-министр клянется в примирении». Один из них более коммуникативный (разговорный), другой — скорее записывающий (письменный).

Работа Холлидея предполагает нечто радикально иное: язык ведет себя в регистрах . Бибер и др. Работая над LGSWE, мы работали с четырьмя (это не исчерпывающие, а лишь примерные): разговорная , литературная , новостная , академическая . Эти четыре регистра ясно подчеркивают различия в использовании языка, которые не были бы ясны с помощью «грамматического» подхода. Неудивительно, что в каждом регистре предпочтение отдается использованию разных слов и структур: в то время как заголовки новостей, например, грамматически просты, разговорные анекдоты полны лексических повторов. Однако лексика новостей может быть весьма насыщенной, равно как и грамматика речи может быть невероятно сложной.

См. также [ править ]

Ссылки [ править ]

  1. ^ Руано-Гарсия 2010 .
  2. ^ Чейз 1988 .
  3. ^ Альтманн, Джерри ТМ (1997). «Слова и то, как мы (в конечном итоге) их находим». Восхождение на Вавилон: исследование языка, разума и понимания . Оксфорд: Издательство Оксфордского университета. стр. 65–83.
  4. ^ Паккард, Джером Л. (2000). «Китайские слова и лексика». Морфология китайского языка: лингвистический и когнитивный подход . Кембридж: Издательство Кембриджского университета. стр. 284–309.
  5. ^ Льюис, М. (1997). Реализация лексического подхода . Публикации по преподаванию языков, Хоув, Англия.
  6. ^ Пинкер, С. (1999). Слова и правила, составляющие языка и жизни . Основные книги.
  7. ^ Лакофф, Г; Джонсон, М. (1980). Метафоры, которыми мы живем . Издательство Чикагского университета. ISBN  9780226468013 .
  8. ^ Бибер, Д. и др., М. (1999). Лонгманская грамматика разговорного и письменного английского языка . Лонгман. {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  9. ^ Холлидей, МАК (1987). «Устная и письменная формы значения». В Граддоле, Д.; Бойд-Баррет, О. (ред.). Медиатексты: авторы и читатели . Клеведон, Вопросы многоязычия и Открытый университет.

Источники [ править ]