Лексическая плотность
Лексическая плотность — это концепция компьютерной лингвистики , которая измеряет структуру и сложность человеческого общения на языке. [1] Лексическая плотность оценивает языковую сложность письменного или устного произведения по функциональным словам (грамматическим единицам) и содержательным словам (лексическим единицам, лексемам ). Одним из методов расчета лексической плотности является вычисление отношения лексических единиц к общему количеству слов. Другой метод — вычислить соотношение лексических единиц к числу более высоких структурных единиц в композиции, например, к общему количеству предложений в предложении. [2] [3]
Лексическая плотность человека меняется в зависимости от возраста, образования, стиля общения, обстоятельств, необычных травм или состояния здоровья. [4] и его или ее творчество. Присущая человеческому языку и родному языку структура может влиять на лексическую плотность стиля письма и речи человека. Кроме того, после этапа раннего детства человеческое общение в письменной форме обычно более лексически более плотное, чем в устной форме. [5] [6] Лексическая плотность влияет на читаемость композиции и легкость, с которой слушатель или читатель может понять сообщение. [7] [8] Лексическая плотность также может влиять на запоминаемость и удержание предложения и сообщения. [9]
Обсуждение
[ редактировать ]Лексическая плотность – это доля содержательных слов (лексических единиц) в данном дискурсе. Его можно измерить либо как отношение лексических единиц к общему числу слов, либо как отношение лексических единиц к числу высших структурных единиц в предложениях (например, придаточных). [2] [3] Лексический элемент обычно представляет собой реальное содержание и включает существительные, глаголы, прилагательные и наречия. Грамматический элемент обычно представляет собой функциональный клей и нить, которые сплетают содержание и включают местоимения, союзы, предлоги, определители и определенные классы конечных глаголов и наречий. [5]
Лексическая плотность — один из методов, используемых в анализе дискурса, как описательный параметр, который варьируется в зависимости от регистра и жанра. Существует множество предложенных методов расчета лексической плотности любого произведения или корпуса. Лексическую плотность можно определить как:
- Где:
- = лексическая плотность анализируемого текста
- = количество лексических или грамматических токенов (существительных, прилагательных, глаголов, наречий) в анализируемом тексте
- = количество всех токенов (общее количество слов) в анализируемом тексте
Ура лексическая плотность
[ редактировать ]В 1971 году Юр предложил следующую формулу для расчета лексической плотности предложения:
- Л д = Количество лексических единиц / Общее количество слов * 100
Бибер называет это соотношение «соотношением типа и токена». [10]
Лексическая плотность Холлидея
[ редактировать ]В 1985 году Холлидей пересмотрел знаменатель формулы Юра и предложил следующую формулу для расчета лексической плотности предложения: [1]
- Л д = Количество лексических единиц / Общее количество предложений * 100
В некоторых формулировках предложенная Холлидеем лексическая плотность рассчитывается как простое соотношение без множителя «100». [2] [1]
Характеристики
[ редактировать ]Измерения лексической плотности могут различаться для одной и той же композиции в зависимости от того, как определяется «лексический элемент» и какие элементы классифицируются как лексические или грамматические элементы. Любая принятая методология, последовательно применяемая к различным композициям, обеспечивает лексическую плотность этих композиций. Обычно лексическая плотность письменного произведения выше, чем устного. [2] [3] По словам Юра, письменные формы человеческого общения на английском языке обычно имеют лексическую плотность выше 40%, тогда как устные формы обычно имеют лексическую плотность ниже 40%. [2] В обзоре исторических текстов, проведенном Майклом Стаббсом, типичная лексическая плотность художественной литературы колебалась от 40% до 54%, а документальной литературы - от 40% до 65%. [3] [11] [12]
Отношения и близость между участниками конкретного общения влияют на лексическую плотность, утверждает Уре, равно как и обстоятельства, предшествующие началу общения одного и того же говорящего или писателя. По ее мнению, более высокая лексическая плотность письменных форм общения обусловлена прежде всего тем, что письменные формы человеческого общения предполагают большую подготовку, размышление и пересмотр. [2] Человеческие дискуссии и разговоры, включающие или ожидающие обратной связи, как правило, менее редки и имеют меньшую лексическую плотность. Напротив, утверждают Стаббс и Бибер, инструкции, приказы правоохранительных органов, новости, читаемые с экранных подсказок в течение отведенного времени, и литература, которая, как ожидают авторы, будет доступна читателю для повторного чтения, имеют тенденцию максимизировать лексическую плотность. [2] [13] В исследованиях лексической плотности устного и письменного материала в различных европейских странах и возрастных группах Йоханссон и Стрёмквист сообщают, что лексическая плотность групп населения была сходной и зависела от морфологической структуры родного языка, а внутри страны возрастные группы, выбранные для выборки, были схожими и зависели от морфологической структуры родного языка. . Лексическая плотность была самой высокой у взрослых, тогда как вариации, оцениваемые как лексическое разнообразие, утверждает Йоханссон, были выше у подростков той же возрастной группы (13-летние, 17-летние). [14] [15]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с Майкл Холлидей (1985). Разговорная и письменная речь . Университет Дикина. стр. 61–64. ISBN 978-0-7300-0309-0 .
- ^ Jump up to: а б с д и ж г Эрик Кастелло (2008). Тесты на сложность текста и понимание прочитанного . Питер Лэнг. стр. 49–51. ISBN 978-3-03911-717-8 .
- ^ Jump up to: а б с д Белинда Кроуфорд Камичиоттоли (2007). Лекции по языку бизнес-исследований: корпусный анализ . Издательство Джона Бенджамина. п. 73. ИСБН 978-90-272-5400-9 .
- ^ Пол Йодер (2006). «Прогнозирование скорости роста лексической плотности у детей раннего возраста с расстройствами аутистического спектра». Американский журнал патологии речи и языка . 15 (4): 362–373.
- ^ Jump up to: а б Майкл Холлидей (1985). Разговорная и письменная речь . Университет Дикина. стр. 61–75 (глава 5), 76–91 (глава 6). ISBN 978-0-7300-0309-0 .
- ^ Виктория Йоханссон (2009). Аспекты развития производства текста в письменной и устной форме . Кафедра лингвистики и фонетики Центра языков и литературы Лундского университета. стр. 1–16. ISBN 978-91-974116-7-7 .
- ^ В К; С Фан; Д. П. Томас (2013). «Лексическая плотность и читаемость: пример учебников английского языка». Международный журнал языка, общества и культуры . 37 (7): 61–71.
- ^ О'Локлин, Киран (1995). «Лексическая плотность результатов кандидатов в прямых и полупрямых версиях устного теста». Языковое тестирование . 12 (2). Публикации SAGE: 217–237. дои : 10.1177/026553229501200205 . S2CID 145638000 .
- ^ Перфетти, Чарльз А. (1969). «Лексическая плотность и глубина структуры фразы как переменные в удержании предложения». Журнал вербального обучения и вербального поведения . 8 (6). Эльзевир Б.В.: 719–724. дои : 10.1016/s0022-5371(69)80035-6 . ISSN 0022-5371 .
- ^ Дуглас Бибер (2007). Дискурс в движении: использование корпусного анализа для описания структуры дискурса . Издательство Джона Бенджамина. стр. 97–98 со сноской 7. ISBN. 978-90-272-2302-9 .
- ^ Марк Варшауэр; Ричард Керн (2000). Сетевое обучение языку: концепции и практика . Издательство Кембриджского университета. стр. 107–108. ISBN 978-0-521-66742-5 .
- ^ Майкл Стаббс (1996). Анализ текста и корпуса: компьютерные исследования языка и культуры . Уайли. стр. 71–73. ISBN 978-0-631-19512-2 .
- ^ Майкл Стаббс (1986). «Лексическая плотность: техника и некоторые выводы». В Малкольме Култхарде (ред.). Речь о Тексте . Университет Бирмингема: исследования английского языка. стр. 27–42.
- ^ Виктория Йоханссон (2008). «Лексическое разнообразие и лексическая плотность в речи и письме: взгляд на развитие». Рабочие материалы по лингвистике и фонетике . 53 . Лундский университет: 61–79.
- ^ Свен Стрёмквист; Виктория Йоханссон; Сара Криз; Х Рагнарсдоттир; Равид Айзенманн; Дорит Равид (2002). «К межъязыковому сравнению лексических квантов в речи и письме». Письменность и грамотность . 5 : 45–67. doi : 10.1075/wll.5.1.03str .
Дальнейшее чтение
[ редактировать ]- Юр, Дж (1971). Лексическая плотность и регистровая дифференциация. В Г. Перрене и Дж. Л. М. Триме (ред.), «Приложения лингвистики» , Лондон: Издательство Кембриджского университета. 443–452.