Jump to content

Количественная лингвистика

(Перенаправлено с количественного лингвиста )

Количественная лингвистика ( КЛ ) — субдисциплина общей лингвистики и, точнее, математической лингвистики . Количественная лингвистика занимается изучением языка, его изменением и применением, а также структурой естественных языков. QL исследует языки, используя статистические методы; его наиболее важной целью является формулирование языковых законов и, в конечном счете, общей теории языка в смысле набора взаимосвязанных языковых законов. [1] Синергетическая лингвистика с самого начала была специально предназначена для этой цели. [2] QL эмпирически основан на результатах языковой статистики, поля, которое можно интерпретировать как статистику языков или как статистику любого лингвистического объекта. Эта область не обязательно связана со значительными теоретическими амбициями. Корпусная лингвистика и компьютерная лингвистика – это другие области, которые предоставляют важные эмпирические данные .

Самые ранние подходы к QL восходят к древнеиндийскому миру. Одним из исторических источников являются приложения комбинаторики к лингвистическим вопросам. [3] другой основан на элементарных статистических исследованиях, которые можно найти в разделе колометрия и стихометрия . [4]

Языковые законы

[ редактировать ]
Частота демонстративных выступлений на сербско-хорватском языке

В QL понятие права понимается как класс правовых гипотез, которые выведены из теоретических предположений, сформулированы математически, взаимосвязаны с другими законами в этой области и достаточно и успешно проверены на эмпирических данных, т.е. не могут быть опровергнуты, несмотря на все усилия. Кёлер пишет о законах КЛ: «Более того, можно показать, что эти свойства языковых элементов и отношений между ними подчиняются универсальным законам, которые могут быть сформулированы строго математически так же, как это принято в естественных науках. имея в виду при этом, что эти законы имеют стохастический характер; они не соблюдаются в каждом отдельном случае (это было бы ни необходимо, ни невозможно), они скорее определяют вероятности изучаемых событий или пропорций; легко найти контрпримеры; к каждому из приведенных примеров; тем не менее, эти случаи не нарушают соответствующих законов, так как отклонения от статистической средней не только допустимы, но даже существенны, они сами количественно точно определяются соответствующими законами; это в естественных науках, которые уже давно отказались от старых детерминистских и причинных взглядов на мир и заменили их статистическими/вероятностными моделями». [5]

Лингвистические законы

[ редактировать ]

В количественной лингвистике лингвистические законы — это статистические закономерности, возникающие в различных языковых масштабах (т. е. фонемах, слогах, словах или предложениях), которые можно сформулировать математически и которые были выведены из определенных теоретических предположений. Они также должны быть успешно проверены с использованием данных, то есть не быть опровергнуты эмпирическими данными. Среди основных лингвистических законов, предложенных различными авторами, можно выделить следующие: [6]

  • Закон Ципфа : частота слов обратно пропорциональна их положению в списках частотности. Аналогичное распределение можно наблюдать между рангом и частотой звуков, фонем и букв. [7]
  • Закон Кучи : он описывает количество отдельных слов в документе (или наборе документов) в зависимости от длины документа.
  • Закон краткости или закон сокращений Ципфа : качественно он гласит, что чем чаще используется слово, тем «короче» оно имеет тенденцию быть. [8]
  • Закон Менцерата (также закон Менцерата-Альтмана): этот закон гласит, что размеры составляющих конструкции уменьшаются с увеличением размера исследуемой конструкции. Чем длиннее, например, предложение (измеряется по количеству предложений), тем короче предложения (измеряется по количеству слов), или: чем длиннее слово (в слогах или морфах), тем короче слоги или слова в звуки).
  • Закон диверсификации: если лингвистические категории, такие как части речи или флективные окончания, появляются в различных формах, можно показать, что частота их появления в текстах контролируется законами.
  • Закон Мартина: Этот закон касается лексических цепочек, которые получаются путем поиска определения слова в словаре, затем поиска определения только что полученного определения и т. д. Наконец, все эти определения образуют иерархию все более и более общих значений. при этом количество определений уменьшается с увеличением общности. Среди уровней такого рода иерархии существует ряд правоотношений.
  • Закон изменения языка: процессы роста языка, такие как рост словарного запаса, распространение иностранных или заимствованных слов, изменения в флективной системе и т. д., подчиняются закону, известному в QL как закон Пиотровского, и соответствует моделям роста в других научных дисциплинах. Закон Пиотровского представляет собой случай так называемой логистической модели (ср. логистическое уравнение). Показано, что оно охватывает и процессы овладения языком (ср. закон о приобретении языка).
  • Закон текстового блока: лингвистические единицы (например, слова, буквы, синтаксические функции и конструкции) демонстрируют определенное распределение частот в одинаково больших текстовых блоках.

Стилистика

[ редактировать ]

Изучение поэтических, а также непоэтических стилей может основываться на статистических методах; более того, можно проводить соответствующие исследования на основе конкретных форм (параметров), которые принимают языковые законы в текстах разных стилей. В таких случаях QL поддерживает исследования в области стилистики : одной из общих целей является получение как можно более объективных доказательств, по крайней мере, в части области стилистических явлений, ссылаясь на законы языка. Одно из центральных предположений QL заключается в том, что некоторые законы (например, распределение длин слов) требуют разных моделей, по крайней мере, разных значений параметров законов (распределений или функций) в зависимости от типа текста, к которому принадлежит текст. При изучении поэтических текстов методы КЖ образуют субдисциплину Количественного изучения литературы ( стилометрики ). [9]

Важные авторы

[ редактировать ]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Рейнхард Кёлер: Предмет и рабочий метод количественной лингвистики . В: Рейнхард Кёлер, Габриэль Альтманн, Раймунд Г. Пиотровски (ред.): Количественная лингвистика - Количественная лингвистика. Международный справочник. де Грюйтер, Берлин/Нью-Йорк, 2005 г., стр. 1–16. ISBN   3-11-015578-8 .
  2. ^ Рейнхард Кёлер: Синергетическая лингвистика . В: Рейнхард Кёлер, Габриэль Альтманн, Раймунд Г. Пиотровски (ред.): Количественная лингвистика - Количественная лингвистика. Международный справочник. де Грюйтер, Берлин/Нью-Йорк, 2005 г., стр. 760–774. ISBN   3-11-015578-8 .
  3. ^ Н.Л. Биггс: Корни комбинаторики. В: Historia Mathematica 6, 1979, стр. 109–136.
  4. ^ Адам Павловский: Пролегомены к истории корпусной и количественной лингвистики. Греческая античность. В: Glottotheory 1, 2008, стр. 48–54.
  5. ^ см . примечание 1, стр. 1–2.
  6. ^ см . ссылки: Кёлер, Альтманн, Пиотровски (ред.) (2005).
  7. ^ Х. Гитер, М. В. Арапов (ред.): Исследования по закону Ципфа. Бохум: Брокмейер 1982. ISBN   3-88339-244-8 .
  8. ^ Зипф ГК. 1935 Психобиология языка, введение в динамическую филологию. Бостон, Массачусетс: Хоутон – Миффлин.
  9. ^ Александр Мелер: Свойства текстовых единиц и систем . В: Рейнхард Кёлер, Габриэль Альтманн, Раймунд Г. Пиотровски (ред.): Количественная лингвистика - Количественная лингвистика. Международный справочник. де Грюйтер, Берлин/Нью-Йорк, 2005 г., с. 325-348, особенно. Количественная стилистика , стр. 339–340. ISBN   3-11-015578-8 ; Вивьен Альтманн, Габриэль Альтманн: Инструкции по количественному анализу текста. Методы и приложения. Люденшайд: RAM-Verlag 2008, ISBN   978-3-9802659-5-9 .
  10. ^ Гжибек, Питер, и Кёлер, Рейнхард (ред.) (2007): Точные методы изучения языка и текста. Посвящается Габриэлю Альтманну по случаю его 75-летия. Берлин/Нью-Йорк: Мутон де Грюйтер
  11. ^ de:Пользователь:Dr._Karl-Heinz_Best
  12. ^ индекс
  13. ^ de: Сергей Григорьевич Чебанов
  14. ^ Бест, Карл-Хайнц (2009): Уильям Пэйлин Элдертон (1877-1962). Глоттометрия 19, с. 99-101 (PDF ram-verlag.eu ).
  15. ^ Домашняя страница_Гертрауд Фенк
  16. ^ де: Эрнст Фёрстеманн ; Карл-Хайнц Бест: Эрнст Вильгельм Фёрстеманн (1822-1906) . В: Glottometrics 12, 2006, стр. 77–86 (PDF ram-verlag.eu )
  17. ^ Дитер Айхеле: Работа В. Фукса . В: Рейнхард Кёлер, Габриэль Альтманн, Раймунд Г. Пиотровски (ред.): Количественная лингвистика - Количественная лингвистика. Международный справочник . де Грютер, Берлин/Нью-Йорк, 2005 г., стр. 152–158. ISBN   3-11-015578-8
  18. ^ Питер Гржибек :: Домашняя страница: Главная / Контакты. Архивировано 29 сентября 2012 г., в Wayback Machine.
  19. ^ от: Густав Хердан
  20. ^ «Гердановское измерение – Законы количественной лингвистики» . Архивировано из оригинала 19 июля 2011 г. Проверено 22 мая 2010 г.
  21. ^ de: Людек Гржебичек
  22. ^ de: Фридрих Вильгельм Кединг
  23. ^ Universität Trier: профессор доктор Рейнхард Келер. Архивировано 7 апреля 2015 г. в Wayback Machine.
  24. ^ Кордич, Снежана (2001). Слова на границе между лексиконом и грамматикой в ​​сербско-хорватском языке [ Сербско-хорватские слова на границе между лексиконом и грамматикой ]. Исследования по славянскому языкознанию; 18 (на немецком языке). Мюнхен: Линком Европа. п. 280. ИСБН  3-89586-954-6 . LCCN   2005530314 . ОСЛК   47905097 . ОЛ   2863539В . Нью-Йоркский политехнический институт   b15245330 . NCID   BA56769448 .
  25. ^ Кордич, Снежана (2005) [1-й паб. 1999 год; 2-й паб. 2002 г.; 3-й паб. 2005]. Придаточные предложения в сербско-хорватском языке [ Относительные придаточные предложения в сербско-хорватском языке ]. Исследования по славянскому языкознанию; 10 (на немецком языке). Мюнхен: Линком Европа. п. 330. ИСБН  3-89586-573-7 . OCLC   42422661 . ОЛ   2863535В . S2CID   171902446 . Нью-Йоркский политехнический институт   b14328353 . Содержание
  26. ^ Университет Георга Августа Геттингена - Лефельдт, Вернер, проф. и т. д. Доктор
  27. ^ Festschrift по случаю 70-летия: Проблемы общего, германского и славянского языкознания. Материалы к 70-летию профессора В. Левицкого. Под редакцией Габриэля Альтманна, Ирины Задорошной, Юлии Мацкуляк. Книги, Черновцы, 2008. (Нет ISBN.) Левицкому посвящено: Глоттометрия , выпуск 16, 2008 г.; Эммерих Келих: Вклад Черновца в количественную лингвистику: К 70-летию со дня рождения профессора доктора Келиха. Хабил Виктор Владимирович Левицкий. В: Научный вестник Черновецкого университета: Германская филология. Выпуск 407 , 2008, стр. 3–10.
  28. ^ Компьютер-человек-язык - домашняя страница сотрудников, ZJU
  29. ^ Карл-Хайнц Бест: Пауль Менцерат (1883-1954) . В: Глоттометрия 14, 2007 г., стр. 86–98 (PDF ram-verlag.eu )
  30. ^ Шизуо Мизутани; Портрет по случаю его 80-летия в: Glottometrics 12, 2006 г. (PDF ram-verlag.eu ); о Мизутани: Наоко Маруяма: Мизутани (1926). Основатель японской количественной лингвистики. В: Глоттометрия 10, 2005, стр. 99-107 (PDF ram-verlag.eu ).
  31. ^ Чарльз Мюллер: Посвящение в лингвистическую статистику . Париж: Ларус, 1968; Немецкий: Введение в языковую статистику . Хюбер, Мюнхен, 1972.
  32. ^ Раймунд Г. Пиотровский, Р.Г. Пиотровский; ср. Закон Пиотровского: http://lql.uni-trier.de/index.php/Change_in_language. Архивировано 19 июля 2011 г. в Wayback Machine.
  33. ^ de: Пиотровский-Гезец
  34. Журнал количественной лингвистики 4, № 1, 1997 (Фестивальный сборник в честь Ю. Тулдава)
  35. ^ Доктор Эндрю Уилсон - лингвистика и английский язык в Ланкастерском университете
  36. ^ автор: Альберт Тамб
  37. ^ де: Эберхард Цвирнер
  • Карл-Хайнц Бест: Количественная лингвистика. Подход . 3-е, сильно переработанное и дополненное издание. Пеуст и Гутшмидт, Геттинген, 2006 г., ISBN   3-933043-17-4 .
  • Карл-Хайнц Бест, Отто Роттманн: количественная лингвистика, приглашение. RAM-Verlag, Люденшайд, 2017 г. ISBN   978-3-942303-51-4 .
  • Рейнхард Кёлер при содействии Кристианы Хоффманн: Библиография по количественной лингвистике. Бенджаминс, Амстердам/Филадельфия, 1995 г., ISBN   90-272-3751-4 .
  • Рейнхард Кёлер, Габриэль Альтманн, Габриэль, Раймунд Г. Пиотровски (ред.): Количественная лингвистика - Количественная лингвистика. Международный справочник — Международный справочник . де Грюйтер, Берлин/Нью-Йорк, 2005 г., ISBN   3-11-015578-8 .
  • Хайтао Лю и Вэй Хуан. Количественная лингвистика: современное состояние, теории и методы . Журнал Чжэцзянского университета (гуманитарные и социальные науки) . 2012, 43(2): 178-192. на китайском языке.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: feb0e516f96ff911d375c4d6bb1b1829__1711290420
URL1:https://arc.ask3.ru/arc/aa/fe/29/feb0e516f96ff911d375c4d6bb1b1829.html
Заголовок, (Title) документа по адресу, URL1:
Quantitative linguistics - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)