Толковый комбинаторный словарь
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Объяснительный комбинаторный словарь (ECD) — это тип одноязычного словаря, созданный как часть смысловой лингвистической модели естественного языка. [1] [2] [3] Он предназначен для полной записи лексики данного языка. [4] языка По существу, он идентифицирует и описывает в отдельных статьях каждую лексему (грубо говоря, каждое слово или набор изменяемых форм, основанных на одной основе) и фраземы (грубо говоря, идиомы и другие многословные устойчивые выражения). Помимо прочего, каждая запись содержит (1) определение, которое включает в себя семантические актанты лексемы (например, дефиниендум давать принимает форму X дает Y Z , где выражены три его актанта - дающий X , вещь, данная Y , и лицо, переданное Z ) (2) полная информация о лексическом совпадении (например, запись для атаки сообщает вам, что одно из ее словосочетаний — начать атаку , запись для партии обеспечивает бросок вечеринки , а запись для лекция обеспечивает проведение лекции — позволяет пользователю избежать ошибки типа * доставить вечеринку ); (3) обширный набор примеров. ECD — это производственный словарь, то есть его цель — предоставить всю информацию, необходимую учащемуся-иностранцу или автомату для создания идеально сформированных высказываний на языке. Поскольку количество лексем и фразем естественного языка исчисляется сотнями тысяч, полный РДРВ в бумажной форме занял бы место большой энциклопедии. Такая работа еще предстоит осуществить; хотя ECD русского и французского языков опубликованы, каждый из них описывает менее одного процента словарного запаса соответствующих языков.
ECD был предложен в конце 1960-х годов Александром Жолковским и Игорем Мельчуком. [5] [6] [7] и позже был развит Юрием Апресяном. [8] [9] [10] [11] [12] [13] [14] [15] [16] В настоящее время доступны в печатном виде три ECD: один на русском языке, [17] и два для французского языка. [18] [19] Словарь испанских словосочетаний — DICE (= Diccionario de collocations del español) — находится в стадии разработки. [20] [21]
Характеристики ЭЦП
[ редактировать ]Полный ECD языка будет содержать записи для каждой лексемы, конструкции или идиомы, называемых совместно «лексическими единицами» (LU), используемых в языке. Записи в ECD основаны на семантическом определении LU, и каждая запись содержит полный список ее словосочетаний и лексических функций . также [22]
Записи об исторически связанных лексических единицах, которые являются омофонами и имеют общий значительный семантический компонент (т. е. значения), группируются в более крупные единицы, называемые «вокалами», тем самым признавая многозначность , сохраняя при этом особый статус рассматриваемых независимых единиц. английский вокабула Improve Например, включает в себя шесть Лексических Единиц, каждая из которых снабжена отдельной лексической статьей:
УЛУЧШИТЬ , глагол
- УЛУЧШИТЬ I.1a X улучшается ≡ «Ценность или качество X становится выше»
- [ Погода внезапно улучшилась; Система со временем будет улучшаться ]
- УЛУЧШИТЬ I.1b X улучшает Y ≡ 'X вызывает 1 , что Y улучшает I.1a '
- [ Последние изменения радикально улучшили систему ]
- УЛУЧШИТЬ I.2 X улучшается ≡ 'Здоровье больного человека X улучшается I.1a '
- [ Джим постепенно поправляется ]
- УЛУЧШИТЬ I.3 X улучшается в Y ≡ 'Выполнение X Y улучшает I.1a , что вызвано 1 тем, что X практиковал или практикует Y'
- [ Джим постоянно совершенствуется в алгебре ]
- УЛУЧШЕНИЕ II X улучшает Y посредством Z-образования ≡ «X добровольно приводит к тому, что 2 рыночная стоимость объекта недвижимости Y становится выше в результате Z-образования Y»
- [ Джим улучшил свой дом, установив сантехнику ]
- УЛУЧШИТЬ III X улучшает Y ≡ «X создает новый Y», улучшая I.1b Y»
- [ Джим существенно улучшил перевод Патрика ]
Лексикографические цифры (выделенные жирным шрифтом после входного слова) отражают степени или уровни семантического расстояния между лексическими единицами внутри вокабула: римские цифры обозначают семантические группировки самого высокого уровня, арабские цифры обозначают следующий самый высокий уровень, а буквы обозначают самый низкий уровень. ровные расстояния. четыре лексемы, сгруппированные в группу IMPROVE I Например, , считаются более близкими друг к другу, чем IMPROVE II или IMPROVE III , поскольку значения каждой из IMPROVE I.1b и IMPROVE I.2 фактически включают в себя значение IMPROVE I. 1а . IMPROVE I.1a и IMPROVE I.1b еще более тесно связаны, потому что в английском языке есть много пар слов – в частности, лабильные или амбитранзитивные глаголы – которые связаны семантическим чередованием «P» ~ «причина 1 с P» (как как указано выше, «улучшить» ~ «привести к улучшению»).
Индексы и надстрочные индексы, прикрепленные к словам в определении, относятся к подсмыслам (индексам) и омофоническим статьям (надстрочным индексам) слова, как указано в Словаре современного английского языка Лонгмана. [23] - таким образом, «устройство 1 1 «» относится к первой записи устройства в этом словаре, первому смыслу.
Структура записи ECD
[ редактировать ]Запись ECD для определенной лексической единицы, назовем ее «L», разделена на три основных раздела или «зоны»:
Семантическая зона
[ редактировать ]Семантическая зона описывает семантические свойства L и состоит из двух подзон:
- 1) определение L, полностью уточняющее значение L; и
- 2) Коннотации L (значения, которые язык ассоциируется с L, но не являются частью его определения). [24] [25]
Фонологическая/графематическая зона
[ редактировать ]Фонологическая/графематическая зона дает все данные о фонологических свойствах L. Здесь мы снова находим две подзоны:
- 1) произношение L, включая его слоговое строение, а также любые нестандартные просодические свойства; [26] и
- 2) орфографическая информация о вариантах написания Л и т. д.
Зона совместного появления
[ редактировать ]Зона совместного появления представляет все данные о комбинаторных свойствах L. Он разделен на пять подзон — морфологическую, синтаксическую, лексическую, стилистическую и прагматическую.
- Морфологическая подзона содержит флективные данные, включая класс спряжения/склонения, неправильные формы, отсутствующие формы, разрешенные чередования и т. д. [27]
- Синтаксическая подзона состоит из двух частей:
- а) Шаблон управления, который описывает элементы, которыми L может синтаксически управлять (аргументы, дополнения и т. д.);
- б) Часть речи и синтаксические особенности, описывающие конструкции, в которых L может выступать как синтаксически зависимая .
- Лексическая подзона определяет лексические функции , в которых участвует L, охватывая как семантические производные , так и словосочетания L с другими отдельными LU или очень небольшими и нерегулярными группами LU.
- Стилистическая подзона определяет речевой регистр Л (неформальный, разговорный, вульгарный, поэтический и т. д.), временную (устаревшую, архаичную) и географическую (британскую, индийскую, австралийскую) изменчивость и тому подобное.
- Прагматическая подзона описывает ситуации реальной жизни, в которых конкретное выражение уместно или неуместно.
Ссылки
[ редактировать ]- ^ Мельчук, Игорь А. (2006). Толковый комбинаторный словарь. В Джандоменико Сика (ред.), Открытые проблемы лингвистики и лексикографии, 225–355. Монца: Полиметрика
- ^ Пирсон, Дженнифер. 1998 г. Термины в контексте. Амстердам: Джон Бенджаминс 76–82.
- ^ Фонтенель, Тьерри. (2008) Использование двуязычного словаря для создания семантических сетей. В Тьерри Фонтенелле (ред.), Практическая лексикография: читатель, 175. Оксфорд: Издательство Оксфордского университета.
- ^ Фроули, Уильям. (1988). Новые формы специализированных словарей. Международный журнал лексикографии 1, 189–213.
- ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1965). «О возможном методе и инструментах семантического синтеза». Научно-техническая информация . 5 : 23–28.
- ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1966). «О системе семантического синтеза. I. Структура словаря». Научно-техническая информация . 11 : 48–55.
- ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1967). «О семантическом синтезе [О семантическом синтезе]». Кибернетические проблемы . 19 : 177–238.
- ^ Апресян, Юрий (1969). «Интерпретация лексических значений как проблема теоретической семантики». Экспортирована в Академию Наук СССР. Серия Лит. И Языка 28 : 11–23.
- ^ Апресян, Юрий (1969). «О языке для описания лексических значений». Известия Академии Наук СССР, Серия Лит. Я Языка . 28 : 415–428.
- ^ Апресян, Юрий (1974). Лексическая семантика. Лексическая семантика. Синонимические средства языка . Москва: Наука.
- ^ Апресан, Юрий (1980). Типовая информация для поверхностно-семантического компонента Смысл ⇔ Текст [Типы информации для поверхностно-семантического компонента смыслово-текстовой модели] . Вена: Венский славистический альманах.
- ^ Апресян, Юрж (1988). Караулов, Юрий (ред.). «Морфологическая информация в одноязычном словаре». Словарные категории . Москва: Наука: 31–59.
- ^ Apresjan, Jurij (1988). "Tipy kommunikativnoj informacii dlja tolkovogo slovarja [Types of Communicative Information for a Monolingual Dictionary]". Jazyk: Sistema I Funkcionirovanie . Moscow: Nauka: 10–22.
- ^ Апресян, Юрий (1990). «Типы лексикографической информации об означающем лексеме». Типология и грамматика . Москва: Наука: 91–108.
- ^ Апресян, Юрий (1990). «Формальная модель языка и представление лексикографических знаний». И.В.Вопросы языкознания . 6 : 91–108.
- ^ Апресян, Юрий (1995). Избранные труды. Том II. Интегральное описание языка и системная лексикография. Том II. Интегральное лингвистическое описание и системная лексикография . Москва: Школа «Языки русской культуры».
- ^ Мельчук Игорь А.; Александр Жолковский (1984). Толковый комбинаторный словарь современного русского языка. Семантико-синтаксические исследования русской лексики . Вена: Венский славистский альманах.
- ^ Мельчук Игорь А.; Арбачевский-Жумари, Н.; Иорданская, Лида; Манта, С.; Польгер, Ален (1999). Толковый и комбинационный словарь современного французского языка. Лексико-семантическое исследование IV . Монреаль: Les Presses de l'Université de Montréal.
- ^ Мельчук Игорь А.; Ален Польгер (2007). Активный французский лексикон: изучение словарного запаса на основе 20 000 семантических производных и словосочетаний французского языка . Париж: Дюкуло.
- ^ Алонсо Рамос, Маргарита (2003). Фернандес Монтравета, А.; А. Марти Антонин; Г. Васкес Гарсия (ред.). «К словарю испанских словосочетаний и их кодификации». Компьютерная и семантическая лексикография . Барселона: Университет Барселоны : 11–34.
- ^ Алонсо Рамос, Маргарита (2004). Батанер, П. и Дж. ДеСесарис Гарсиа (ред.). «Разработка словаря испанских словосочетаний и его приложений». По лексикографии: Труды I Международного симпозиума по лексикографии, Барселона: IULA : 149–162.
- ^ Фроули, Уильям. (1988). Новые формы специализированных словарей. Международный журнал лексикографии 1, 189–213.
- ^ Словарь современного английского языка Лонгмана . Лондон: Лонгман. 1978.
- ^ Иорданская, Лида; Игорь Алексеевич Мельчук (1984). «Коннотация в семантике и лексикографии». Толковый и комбинаторный словарь современного французского языка: Лексико-семантическое исследование И. Монреаль: Presses de l'Université de Montréal: 33–40.
- ^ Иорданская, Лида; Игорь А. Мельчук (2006). Бергер, Т.; К. Гучмидт; С. Кемпген; П. Коста (ред.). «Коннотация». Славянские языки: международный справочник по их истории, структуре и исследованию . Нью-Йорк: Уолтер де Грюйтер.
- ^ Апресян, Юрий (1990). «Типы лексикографической информации об означающем лексеме». Типология и грамматика . Москва: Наука: 91–108.
- ^ Апресян, Юрж (1988). Караулов, Юрий (ред.). «Морфологическая информация в одноязычном словаре». Словарные категории . Москва: Наука: 31–59.