Лемма (морфология)
В морфологии и лексикографии лемма .: ( мн.ч , леммы или лемматы — каноническая форма ) [1] словарная форма , или форма цитирования набора словоформ . [2] В английском языке , например, Break , Breaks , Break , Breaking и Breaking — это формы одной и той же лексемы , где Break является леммой, по которой они индексируются. Лексема в этом контексте относится к набору всех изменяемых или чередующихся форм в парадигме одного слова, а лемма относится к конкретной форме, которая выбрана по соглашению для представления лексемы. Леммы имеют особое значение в сильно изменяемых языках, таких как арабский , турецкий и русский . Процесс определения леммы для данной лексемы называется лемматизацией . Лемму можно рассматривать как главную из главных частей , хотя лемматизация по крайней мере отчасти произвольна.
Морфология
[ редактировать ]Форма слова, выбранная в качестве леммы, обычно является наименее выраженной формой, но есть несколько исключений, таких как использование инфинитива для глаголов в некоторых языках.
В английском языке формой цитирования существительного является форма единственного числа (и неподаточное): mouse , а не mouses . Для многословных лексем, содержащих притяжательные прилагательные или возвратные местоимения , в форме цитирования используется форма неопределенного местоимения one : сделать все возможное , лжесвидетельствовать . В европейских языках с грамматическим родом форма цитирования правильных прилагательных и существительных обычно мужского рода единственного числа. [ нужна ссылка ] Если в языке также есть падежи , формой цитирования часто является именительный падеж единственного числа мужского рода.
Для многих языков формой цитирования глагола является инфинитив : французский aller , немецкий gehen , хиндустани जाना / جانا , испанский ir . Английские глаголы обычно имеют инфинитив, который в своей простой форме (без частицы to ) является наименее выраженным (например, Break выбирается вместо Break , Breaks , Break , Breaking и Breaked ); для дефектных глаголов, не имеющих инфинитива, используется настоящее время (например, must имеет только одну форму, а will не имеет инфинитива, и обе леммы являются формами настоящего времени их лексем). В латинском , древнегреческом , новогреческом и болгарском языках от первого лица единственного числа настоящее время традиционно используется , но в некоторых современных словарях вместо этого используется инфинитив (за исключением болгарского языка, в котором отсутствуют инфинитивы; для сокращенных глаголов в древнегреческом языке используется несжатое первое лицо). настоящее время единственного числа используется для раскрытия контрактной гласной: φιλέω philéō вместо φιλῶ philō «Я люблю» [подразумевает привязанность], ἀγαπάω agapáō вместо ἀγαπῶ agapō «Я люблю» [подразумевает уважение]). В финских словарях глаголы располагаются не под корнем, а под первым инфинитивом, отмеченным знаком -(t)a , -(t)ä .
В японском языке используется непрошедшее (настоящее и будущее) время. В арабском языке мужская форма третьего лица единственного числа прошедшего/совершенного времени является наименее выраженной формой и используется для записей в современных словарях. В старых словарях, которые до сих пор широко используются, используется трехбуквенный вариант слова: глагол или существительное. Это похоже на иврит , в котором также используется совершенная форма третьего лица единственного числа мужского рода, например ברא bara' create, כפר kaphar отрицать. Грузинский язык использует отглагольное существительное . В языке корейском -da к основе присоединяется .
В тамильском языке , агглютинативном языке , часто цитируется основа глагола (которая также является повелительной формой - наименее выраженной), например, இரு
В ирландском языке слова сильно изменяются в зависимости от падежа (родительный, именительный, дательный и звательный падеж) и от их места в предложении из-за первоначальных мутаций . Существительное говорящий , лемма для существительного, означающего «говорящий», имеет разнообразные формы: говорящий , говорящий , говорящий , говорящий , говорящие , говорящие и говорящие .
Некоторые фразы цитируются в виде своего рода леммы: Carthago delenda est (буквально: «Карфаген должен быть разрушен») — распространенный способ цитировать Катона , но то, что он сказал, было ближе к censeo Carthaginem esse delendam («Я считаю, что Карфаген находится в необходимость разрушения»).
Лексикография
[ редактировать ]В словаре лемма «идти» представляет собой изменяемые формы «идти», «идет», «идет», «пошел» и «ушел». Связь между изменяемой формой и ее леммой обычно обозначается угловой скобкой, например, «пошел» < «идти». Конечно, недостатком таких упрощений является невозможность найти склоняемую или спряженную форму слова, но в некоторых словарях, например в словаре Вебстера , список «пошел». Многоязычные словари по-разному решают эту проблему: в словаре немецкого языка Langenscheidt не упоминается ging (< gehen ), а в словаре Cassell он есть.
Леммы или основы слов часто используются в корпусной лингвистике для определения частоты слов. В этом случае конкретное определение «леммы» является гибким в зависимости от задачи, для которой оно используется.
Произношение
[ редактировать ]Слово может иметь различное произношение в зависимости от его фонетического окружения (соседних звуков) или от степени ударения в предложении. Примером последнего являются слабые и сильные формы некоторых служебных слов английского языка , таких как some и But (произносится /sʌm/ , /bʌt/ при ударении, но /s(ə)m/ , /bət/ при отсутствии ударения). В словарях обычно приводится произношение, употребляемое при произношении слова отдельно (его обособленная форма ) и с ударением, но могут отмечаться и распространенные слабые формы произношения.
Разница между основой и леммой
[ редактировать ]Основа — это часть слова, которая никогда не меняется даже при морфологическом изменении; лемма — наименее выраженная форма слова. В лингвистическом анализе основа определяется в более общем смысле как форма без каких-либо возможных флективных морфем (но включая деривационные морфемы и может содержать несколько корней). [3] Когда принимается во внимание фонология , определение неизменяемой части слова бесполезно, как это видно по фонологическим формам слов в предыдущем примере: «произведено» / p r ə ˈ dj uː s t / vs «производство» / p r ə ˈ d ʌ k ʃ ən / .
Некоторые лексемы имеют несколько основ, но одну лемму. Например, глагол « идти » имеет основы «идти» и «шел» из-за дополнения : прошедшее время было заимствовано из другого глагола « ехать ».
Заглавное слово
[ редактировать ]или Заглавное слово крылатое слово [4] — лемма , согласно которой появляется набор связанных статей словаря или энциклопедии . Заголовок используется для поиска записи и определяет ее положение в алфавите. В зависимости от размера и характера словаря или энциклопедии статья может включать альтернативные значения слова, его этимологию , произношение и флексию , связанные леммы, такие как сложные слова или фразы, содержащие заглавное слово, а также энциклопедическую информацию о понятиях, представленных слово.
Например, заглавное слово хлеб может содержать следующие (упрощенные) определения:
- Хлеб
- (существительное)
- (глагол)
- Обвалять в сухарях
- — знать, с какой стороны твой хлеб намазан маслом, чтобы знать, как действовать в своих интересах.
Академический словарь литовского языка содержит около 500 000 главных слов. Оксфордский словарь английского языка (OED) насчитывает около 273 000 главных слов и 220 000 других лемм. [5] в то время как в Третьем новом международном словаре Вебстера их около 470 000. [6] Deutsches Wörterbuch (DWB), крупнейший словарь немецкого языка , насчитывает около 330 000 главных слов. [7] Эти значения указаны составителями словарей и могут не использовать точно такое же определение главного слова. Кроме того, заголовки могут неточно отражать физический размер словаря. исходных обычно документов , Например, OED и DWB включают исчерпывающие исторические обзоры и точные цитаты из которые не встречаются в стандартных словарях.
Термин «лемма» происходит от практики использования этого слова в греко-римской древности для обозначения заголовков маргинальных глосс в схолиях ; по этой причине древнегреческая иногда используется форма множественного числа, а именно лемматы (греч. λῆμμα, мн. λήμματα).
См. также
[ редактировать ]- Лексема
- Структура лексической разметки
- Нулевая морфема
- Основные части
- Корень (лингвистика)
- Неизменяемое слово
Ссылки
[ редактировать ]- ^ Згуста, Ладислав (2006). Долезал, Фредрик Ф.М. (ред.). Лексикография тогда и сейчас . п. 202. ИСБН 3484391294 .
Незначительная... проблема может возникнуть, когда необходимо выбрать каноническую форму главного слова, то есть форму, в которой оно будет цитироваться.
- ^ Фрэнсис, Западная Нью-Йорк; Кучера, Х (1982). Частотный анализ употребления английского языка: лексика и использование . Бостон: Хоутон Миффлин.
- ^ Рошель Либер (2022). Введение в морфологию (3-е изд.). Издательство Кембриджского университета . дои : 10.1017/9781108957960 . ISBN 978-1-108-95796-0 . ОЛ 35578155М . Викиданные Q125778052 .
- ^ Оксфордский словарь английского языка , 3-е место. издание, 2018, св , определение 5
- ^ «Глоссарий — Оксфордский словарь английского языка» . public.oed.com . Проверено 3 октября 2016 г.
- ^ «Мвунасокращенный» . www.merriam-webster.com . Проверено 3 октября 2016 г.
- ^ Deutsches Wörterbuch. Архивировано 12 августа 2016 г. в Wayback Machine в BBAW, получено 22 июня 2012 г.