Jump to content

Лемма (морфология)

(Перенаправлено из формы цитирования )

В морфологии и лексикографии лемма .: ( мн.ч , леммы или лемматы каноническая форма ) [1] словарная форма , или форма цитирования набора словоформ . [2] В английском языке , например, Break , Breaks , Break , Breaking и Breaking — это формы одной и той же лексемы , где Break является леммой, по которой они индексируются. Лексема в этом контексте относится к набору всех изменяемых или чередующихся форм в парадигме одного слова, а лемма относится к конкретной форме, которая выбрана по соглашению для представления лексемы. Леммы имеют особое значение в сильно изменяемых языках, таких как арабский , турецкий и русский . Процесс определения леммы для данной лексемы называется лемматизацией . Лемму можно рассматривать как главную из главных частей , хотя лемматизация по крайней мере отчасти произвольна.

Морфология

[ редактировать ]

Форма слова, выбранная в качестве леммы, обычно является наименее выраженной формой, но есть несколько исключений, таких как использование инфинитива для глаголов в некоторых языках.

В английском языке формой цитирования существительного является форма единственного числа (и неподаточное): mouse , а не mouses . Для многословных лексем, содержащих притяжательные прилагательные или возвратные местоимения , в форме цитирования используется форма неопределенного местоимения one : сделать все возможное , лжесвидетельствовать . В европейских языках с грамматическим родом форма цитирования правильных прилагательных и существительных обычно мужского рода единственного числа. [ нужна ссылка ] Если в языке также есть падежи , формой цитирования часто является именительный падеж единственного числа мужского рода.

Для многих языков формой цитирования глагола является инфинитив : французский aller , немецкий gehen , хиндустани जाना / جانا , испанский ir . Английские глаголы обычно имеют инфинитив, который в своей простой форме (без частицы to ) является наименее выраженным (например, Break выбирается вместо Break , Breaks , Break , Breaking и Breaked ); для дефектных глаголов, не имеющих инфинитива, используется настоящее время (например, must имеет только одну форму, а will не имеет инфинитива, и обе леммы являются формами настоящего времени их лексем). В латинском , древнегреческом , новогреческом и болгарском языках от первого лица единственного числа настоящее время традиционно используется , но в некоторых современных словарях вместо этого используется инфинитив (за исключением болгарского языка, в котором отсутствуют инфинитивы; для сокращенных глаголов в древнегреческом языке используется несжатое первое лицо). настоящее время единственного числа используется для раскрытия контрактной гласной: φιλέω philéō вместо φιλῶ philō «Я люблю» [подразумевает привязанность], ἀγαπάω agapáō вместо ἀγαπῶ agapō «Я люблю» [подразумевает уважение]). В финских словарях глаголы располагаются не под корнем, а под первым инфинитивом, отмеченным знаком -(t)a , -(t)ä .

В японском языке используется непрошедшее (настоящее и будущее) время. В арабском языке мужская форма третьего лица единственного числа прошедшего/совершенного времени является наименее выраженной формой и используется для записей в современных словарях. В старых словарях, которые до сих пор широко используются, используется трехбуквенный вариант слова: глагол или существительное. Это похоже на иврит , в котором также используется совершенная форма третьего лица единственного числа мужского рода, например ברא bara' create, כפר kaphar отрицать. Грузинский язык использует отглагольное существительное . В языке корейском -da к основе присоединяется .

В тамильском языке , агглютинативном языке , часто цитируется основа глагола (которая также является повелительной формой - наименее выраженной), например, இரு

В ирландском языке слова сильно изменяются в зависимости от падежа (родительный, именительный, дательный и звательный падеж) и от их места в предложении из-за первоначальных мутаций . Существительное говорящий , лемма для существительного, означающего «говорящий», имеет разнообразные формы: говорящий , говорящий , говорящий , говорящий , говорящие , говорящие и говорящие .

Некоторые фразы цитируются в виде своего рода леммы: Carthago delenda est (буквально: «Карфаген должен быть разрушен») — распространенный способ цитировать Катона , но то, что он сказал, было ближе к censeo Carthaginem esse delendam («Я считаю, что Карфаген находится в необходимость разрушения»).

Лексикография

[ редактировать ]

В словаре лемма «идти» представляет собой изменяемые формы «идти», «идет», «идет», «пошел» и «ушел». Связь между изменяемой формой и ее леммой обычно обозначается угловой скобкой, например, «пошел» < «идти». Конечно, недостатком таких упрощений является невозможность найти склоняемую или спряженную форму слова, но в некоторых словарях, например в словаре Вебстера , список «пошел». Многоязычные словари по-разному решают эту проблему: в словаре немецкого языка Langenscheidt не упоминается ging (< gehen ), а в словаре Cassell он есть.

Леммы или основы слов часто используются в корпусной лингвистике для определения частоты слов. В этом случае конкретное определение «леммы» является гибким в зависимости от задачи, для которой оно используется.

Произношение

[ редактировать ]

Слово может иметь различное произношение в зависимости от его фонетического окружения (соседних звуков) или от степени ударения в предложении. Примером последнего являются слабые и сильные формы некоторых служебных слов английского языка , таких как some и But (произносится /sʌm/ , /bʌt/ при ударении, но /s(ə)m/ , /bət/ при отсутствии ударения). В словарях обычно приводится произношение, употребляемое при произношении слова отдельно (его обособленная форма ) и с ударением, но могут отмечаться и распространенные слабые формы произношения.

Разница между основой и леммой

[ редактировать ]

Основа — это часть слова, которая никогда не меняется даже при морфологическом изменении; лемма — наименее выраженная форма слова. В лингвистическом анализе основа определяется в более общем смысле как форма без каких-либо возможных флективных морфем (но включая деривационные морфемы и может содержать несколько корней). [3] Когда принимается во внимание фонология , определение неизменяемой части слова бесполезно, как это видно по фонологическим формам слов в предыдущем примере: «произведенный» / p r ə ˈ dj s t / vs «производство» / p r ə ˈ d ʌ k ʃ ən / .

Некоторые лексемы имеют несколько основ, но одну лемму. Например, глагол « идти » имеет основы «идти» и «шел» из-за дополнения : прошедшее время было заимствовано из другого глагола « ехать ».

Заглавное слово

[ редактировать ]

или Заглавное слово крылатое слово [4] лемма , согласно которой появляется набор связанных статей словаря или энциклопедии . Заголовок используется для поиска записи и определяет ее положение в алфавите. В зависимости от размера и характера словаря или энциклопедии статья может включать альтернативные значения слова, его этимологию , произношение и флексию , связанные леммы, такие как сложные слова или фразы, содержащие заглавное слово, а также энциклопедическую информацию о понятиях, представленных слово.

Например, заглавное слово хлеб может содержать следующие (упрощенные) определения:

Хлеб
(существительное)
(глагол)
  • Обвалять в сухарях
знать, с какой стороны твой хлеб намазан маслом, чтобы знать, как действовать в своих интересах.

Академический словарь литовского языка содержит около 500 000 главных слов. Оксфордский словарь английского языка (OED) насчитывает около 273 000 главных слов и 220 000 других лемм. [5] в то время как в Третьем новом международном словаре Вебстера их около 470 000. [6] Deutsches Wörterbuch (DWB), крупнейший словарь немецкого языка , насчитывает около 330 000 главных слов. [7] Эти значения указаны составителями словарей и могут не использовать точно такое же определение главного слова. Кроме того, заголовки могут неточно отражать физический размер словаря. исходных обычно документов , Например, OED и DWB включают исчерпывающие исторические обзоры и точные цитаты из которые не встречаются в стандартных словарях.

Термин «лемма» происходит от практики использования этого слова в греко-римской древности для обозначения заголовков маргинальных глосс в схолиях ; по этой причине древнегреческая иногда используется форма множественного числа, а именно лемматы (греч. λῆμμα, мн. λήμματα).

См. также

[ редактировать ]
  1. ^ Згуста, Ладислав (2006). Долезал, Фредрик Ф.М. (ред.). Лексикография тогда и сейчас . п. 202. ИСБН  3484391294 . Незначительная... проблема может возникнуть, когда необходимо выбрать каноническую форму главного слова, то есть форму, в которой оно будет цитироваться.
  2. ^ Фрэнсис, Западная Нью-Йорк; Кучера, Х (1982). Частотный анализ употребления английского языка: лексика и использование . Бостон: Хоутон Миффлин.
  3. ^ Рошель Либер (2022). Введение в морфологию (3-е изд.). Издательство Кембриджского университета . дои : 10.1017/9781108957960 . ISBN  978-1-108-95796-0 . ОЛ   35578155М . Викиданные   Q125778052 .
  4. ^ Оксфордский словарь английского языка , 3-е место. издание, 2018, св , определение 5
  5. ^ «Глоссарий — Оксфордский словарь английского языка» . public.oed.com . Проверено 3 октября 2016 г.
  6. ^ «Мвунасокращенный» . www.merriam-webster.com . Проверено 3 октября 2016 г.
  7. ^ Deutsches Wörterbuch. Архивировано 12 августа 2016 г. в Wayback Machine в BBAW, получено 22 июня 2012 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 340cbed1a05edb807939f016dece9374__1718380260
URL1:https://arc.ask3.ru/arc/aa/34/74/340cbed1a05edb807939f016dece9374.html
Заголовок, (Title) документа по адресу, URL1:
Lemma (morphology) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)