Jump to content

Толковый комбинаторный словарь

Объяснительный комбинаторный словарь (ECD) — это тип одноязычного словаря, созданный как часть смысловой лингвистической модели естественного языка. [ 1 ] [ 2 ] [ 3 ] Он предназначен для полной записи лексики данного языка. [ 4 ] языка По существу, он идентифицирует и описывает в отдельных статьях каждую лексему (грубо говоря, каждое слово или набор изменяемых форм, основанных на одной основе) и фраземы (грубо говоря, идиомы и другие многословные устойчивые выражения). Помимо прочего, каждая запись содержит (1) определение, которое включает в себя семантические актанты лексемы (например, дефиниендум давать принимает форму X дает Y Z , где выражены три его актанта - дающий X , вещь, данная Y , и лицо, которому присвоено Z ) (2) полная информация о лексическом совпадении (например, запись для атаки сообщает вам, что одно из ее словосочетаний — начать атаку , запись для группы обеспечивает организацию вечеринки , а запись лекции обеспечивает проведение лекции , что позволяет пользователю избежать ошибки типа * доставить вечеринку ); (3) обширный набор примеров. ECD — это производственный словарь, то есть его цель — предоставить всю информацию, необходимую учащемуся-иностранцу или автомату для создания идеально сформированных высказываний на языке. Поскольку количество лексем и фразем естественного языка исчисляется сотнями тысяч, полный РДРВ в бумажной форме занял бы место большой энциклопедии. Такая работа еще предстоит осуществить; хотя ECD русского и французского языков опубликованы, каждый из них описывает менее одного процента словарного запаса соответствующих языков.

ECD был предложен в конце 1960-х годов Александром Жолковским и Игорем Мельчуком. [ 5 ] [ 6 ] [ 7 ] и позже был развит Юрием Апресяном. [ 8 ] [ 9 ] [ 10 ] [ 11 ] [ 12 ] [ 13 ] [ 14 ] [ 15 ] [ 16 ] В настоящее время доступны в печатном виде три ECD: один на русском языке, [ 17 ] и два для французского языка. [ 18 ] [ 19 ] Словарь испанских словосочетаний — DICE (= Diccionario de collocations del español) — находится в стадии разработки. [ 20 ] [ 21 ]

Характеристики ЭЦП

[ редактировать ]

Полный ECD языка будет содержать записи для каждой лексемы, конструкции или идиомы, называемых совместно «лексическими единицами» (LU), используемых в языке. Записи в ECD основаны на семантическом определении LU, и каждая запись содержит полный список ее словосочетаний и лексических функций . также [ 22 ]

Записи об исторически связанных лексических единицах, которые являются омофонами и имеют общий значительный семантический компонент (т. е. значения), группируются в более крупные единицы, называемые «вокалами», тем самым признавая многозначность , сохраняя при этом особый статус рассматриваемых независимых единиц. английский вокабула Improve Например, включает в себя шесть Лексических Единиц, каждая из которых снабжена отдельной лексической статьей:

УЛУЧШИТЬ , глагол

УЛУЧШИТЬ I.1a X улучшается ≡ «Ценность или качество X становится выше»
[ Погода внезапно улучшилась; Система со временем будет улучшаться ]
УЛУЧШИТЬ I.1b X улучшает Y ≡ 'X вызывает 1 , что Y улучшает I.1a '
[ Последние изменения радикально улучшили систему ]
УЛУЧШИТЬ I.2 X улучшается ≡ 'Здоровье больного человека X улучшается I.1a '
[ Джим постепенно поправляется ]
УЛУЧШИТЬ I.3 X улучшается в Y ≡ 'Выполнение X Y улучшает I.1a , что вызвано 1 тем, что X практиковал или практикует Y'
[ Джим постоянно совершенствуется в алгебре ]
УЛУЧШЕНИЕ II X улучшает Y посредством Z-образования ≡ «X добровольно вызывает 2 повышение рыночной стоимости объекта недвижимости Y в результате Z-образования Y»
[ Джим улучшил свой дом, установив сантехнику ]
УЛУЧШИТЬ III X улучшает Y ≡ «X создает новый Y», улучшая I.1b
[ Джим значительно улучшил перевод Патрика ]

Лексикографические цифры (выделенные жирным шрифтом после входного слова) отражают степени или уровни семантического расстояния между лексическими единицами внутри вокабула: римские цифры обозначают семантические группировки самого высокого уровня, арабские цифры обозначают следующий самый высокий уровень, а буквы обозначают самый низкий уровень. ровные расстояния. четыре лексемы, сгруппированные в IMPROVE I Например, , считаются более близкими друг к другу, чем IMPROVE II или IMPROVE III , поскольку значения каждой из IMPROVE I.1b и IMPROVE I.2 фактически включают в себя значение IMPROVE I. 1а . IMPROVE I.1a и IMPROVE I.1b еще более тесно связаны, потому что в английском языке есть много пар слов — в частности, лабильные или амбитранзитивные глаголы — которые связаны семантическим чередованием «P» ~ «причина 1 с P» (как как указано выше, «улучшить» ~ «привести к улучшению»).

Индексы и надстрочные индексы, прикрепленные к словам в определении, относятся к подсмыслам (индексам) и омофоническим статьям (надстрочным индексам) слова, как указано в Словаре современного английского языка Лонгмана. [ 23 ] - таким образом, «устройство 1 1 «» относится к первой записи устройства в этом словаре, первому смыслу.

Структура записи ECD

[ редактировать ]

Запись ECD для данной лексической единицы, назовем ее «L», разделена на три основных раздела или «зоны»:

Семантическая зона

[ редактировать ]

Семантическая зона описывает семантические свойства L и состоит из двух подзон:

1) определение L, полностью уточняющее значение L; и
2) Коннотации L (значения, которые язык ассоциируется с L, но не являются частью его определения). [ 24 ] [ 25 ]

Фонологическая/графематическая зона

[ редактировать ]

Фонологическая/графематическая зона дает все данные о фонологических свойствах L. Здесь мы снова находим две подзоны:

1) произношение L, включая его слоговое строение, а также любые нестандартные просодические свойства; [ 26 ] и
2) орфографическая информация о вариантах написания Л и т. д.

Зона совместного появления

[ редактировать ]

Зона совместного появления представляет все данные о комбинаторных свойствах L. Он разделен на пять подзон — морфологическую, синтаксическую, лексическую, стилистическую и прагматическую.

Морфологическая подзона содержит флективные данные, включая класс спряжения/склонения, неправильные формы, отсутствующие формы, разрешенные чередования и т. д. [ 27 ]
Синтаксическая подзона состоит из двух частей:
а) шаблон управления, который описывает элементы, которыми L может синтаксически управлять (аргументы, дополнения и т. д.);
б) Часть речи и синтаксические особенности, описывающие конструкции, в которых L может выступать как синтаксически зависимая .
Лексическая подзона определяет лексические функции , в которых участвует L, охватывая как семантические производные , так и словосочетания L с другими отдельными LU или очень маленькими и нерегулярными группами LU.
Стилистическая подзона определяет речевой регистр Л (неформальный, разговорный, вульгарный, поэтический и т. д.), временную (устаревшую, архаичную) и географическую (британскую, индийскую, австралийскую) изменчивость и тому подобное.
Прагматическая подзона описывает ситуации реальной жизни, в которых конкретное выражение уместно или неуместно.
  1. ^ Мельчук, Игорь А. (2006). Толковый комбинаторный словарь. В Джандоменико Сика (ред.), Открытые проблемы лингвистики и лексикографии, 225–355. Монца: Полиметрика
  2. ^ Пирсон, Дженнифер. 1998 г. Термины в контексте. Амстердам: Джон Бенджаминс 76–82.
  3. ^ Фонтенель, Тьерри. (2008) Использование двуязычного словаря для создания семантических сетей. В Тьерри Фонтенелле (ред.), Практическая лексикография: читатель, 175. Оксфорд: Издательство Оксфордского университета.
  4. ^ Фроули, Уильям. (1988). Новые формы специализированных словарей. Международный журнал лексикографии 1, 189–213.
  5. ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1965). «О возможном методе и инструментах семантического синтеза». Научно-техническая информация . 5 : 23–28.
  6. ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1966). «О системе семантического синтеза. I. Структура словаря». Научно-техническая информация . 11 : 48–55.
  7. ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1967). «О семантическом синтезе [О семантическом синтезе]». Кибернетические проблемы . 19 : 177–238.
  8. ^ Апресян, Юрий (1969). «Толкование лексических значений как проблема теоретической семантики». Известия Академии наук СССР, Серия Лит. Я Языка . 28 : 11–23.
  9. ^ Апресян, Юрий (1969). «О языке описания лексических значений». Известия Академии наук СССР, Серия Лит. Я Языка . 28 : 415–428.
  10. ^ Апресян, Юрий (1974). Лексическая семантика. Лексическая семантика. Синонимические средства языка . Москва: Наука.
  11. ^ Апресан, Юрий (1980). Типовая информация для поверхностно-семантического компонента Смысл ⇔ Текст [Типы информации для поверхностно-семантического компонента смыслово-текстовой модели] . Вена: Венский славистический альманах.
  12. ^ Апресян, Юрж (1988). Караулов, Юрий (ред.). «Морфологическая информация в одноязычном словаре». Словарные категории . Москва: Наука: 31–59.
  13. ^ Apresjan, Jurij (1988). "Tipy kommunikativnoj informacii dlja tolkovogo slovarja [Types of Communicative Information for a Monolingual Dictionary]". Jazyk: Sistema I Funkcionirovanie . Moscow: Nauka: 10–22.
  14. ^ Признательность, Юрий (1990). «Типы лексикографической информации о означающем лексемы». Типология I Грамматика . Москва: Наука: 91–108.
  15. ^ Признательность, Юрий (1990). «Формальная модель языка и представление лексикографических знаний». IVВопросы языкознания . 6 : 91–108.
  16. ^ Признательность, Юрий (1995). Выбор Труди. Том II. Интегральное описание языка и системная лексикография. Том II. Интегральное лингвистическое описание и системная лексикография . Москва: Школа «Языки русской культуры».
  17. ^ Мельчук Игорь А.; Александр Жолковский (1984). Толковый комбинаторный словарь современного русского языка. Семантико-синтаксические исследования русской лексики . Вена: Венский славистский альманах.
  18. ^ Мельчук Игорь А.; Арбачевский-Жумари, Н.; Иорданская, Лида; Манта, С.; Польгер, Ален (1999). Толковый и комбинационный словарь современного французского языка. Лексико-семантическое исследование IV . Монреаль: Les Presses de l'Université de Montréal.
  19. ^ Мельчук Игорь А.; Ален Польгер (2007). Активный французский лексикон: изучение словарного запаса на основе 20 000 семантических производных и словосочетаний французского языка . Париж: Дюкуло.
  20. ^ Алонсо Рамос, Маргарита (2003). Фернандес Монтравета, А.; А. Марти Антонин; Г. Васкес Гарсиа (ред.). «К словарю испанских словосочетаний и их кодификации». Компьютерная и семантическая лексикография . Барселона: Университет Барселоны : 11–34.
  21. ^ Алонсо Рамос, Маргарита (2004). Батанер, П. и Дж. ДеСесарис Гарсиа (ред.). «Разработка словаря словосочетаний испанского языка и его приложений». Лексикографии: Труды I Международного симпозиума по лексикографии, Барселона: IULA : 149–162.
  22. ^ Фроули, Уильям. (1988). Новые формы специализированных словарей. Международный журнал лексикографии 1, 189–213.
  23. ^ Словарь современного английского языка Лонгмана . Лондон: Лонгман. 1978.
  24. ^ Иорданская, Лида; Игорь Алексеевич Мельчук (1984). «Коннотация в семантике и лексикографии». Толковый и комбинаторный словарь современного французского языка: Лексико-семантическое исследование И. Монреаль: Presses de l'Université de Montréal: 33–40.
  25. ^ Иорданская, Лида; Игорь А. Мельчук (2006). Бергер, Т.; К. Гучмидт; С. Кемпген; П. Коста (ред.). «Коннотация». Славянские языки: международный справочник по их истории, структуре и исследованию . Нью-Йорк: Уолтер де Грюйтер.
  26. ^ Признательность, Юрий (1990). «Типы лексикографической информации о означающем лексемы». Типология I Грамматика . Москва: Наука: 91–108.
  27. ^ Апресян, Юрж (1988). Караулов, Юрий (ред.). «Морфологическая информация в одноязычном словаре». Словарные категории . Москва: Наука: 31–59.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e88b22fffbf68d6d43421b43fa4c9a3e__1710963540
URL1:https://arc.ask3.ru/arc/aa/e8/3e/e88b22fffbf68d6d43421b43fa4c9a3e.html
Заголовок, (Title) документа по адресу, URL1:
Explanatory combinatorial dictionary - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)