Толковый комбинаторный словарь
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Объяснительный комбинаторный словарь (ECD) — это тип одноязычного словаря, созданный как часть смысловой лингвистической модели естественного языка. [ 1 ] [ 2 ] [ 3 ] Он предназначен для полной записи лексики данного языка. [ 4 ] языка По существу, он идентифицирует и описывает в отдельных статьях каждую лексему (грубо говоря, каждое слово или набор изменяемых форм, основанных на одной основе) и фраземы (грубо говоря, идиомы и другие многословные устойчивые выражения). Помимо прочего, каждая запись содержит (1) определение, которое включает в себя семантические актанты лексемы (например, дефиниендум давать принимает форму X дает Y Z , где выражены три его актанта - дающий X , вещь, данная Y , и лицо, которому присвоено Z ) (2) полная информация о лексическом совпадении (например, запись для атаки сообщает вам, что одно из ее словосочетаний — начать атаку , запись для группы обеспечивает организацию вечеринки , а запись лекции обеспечивает проведение лекции , что позволяет пользователю избежать ошибки типа * доставить вечеринку ); (3) обширный набор примеров. ECD — это производственный словарь, то есть его цель — предоставить всю информацию, необходимую учащемуся-иностранцу или автомату для создания идеально сформированных высказываний на языке. Поскольку количество лексем и фразем естественного языка исчисляется сотнями тысяч, полный РДРВ в бумажной форме занял бы место большой энциклопедии. Такая работа еще предстоит осуществить; хотя ECD русского и французского языков опубликованы, каждый из них описывает менее одного процента словарного запаса соответствующих языков.
ECD был предложен в конце 1960-х годов Александром Жолковским и Игорем Мельчуком. [ 5 ] [ 6 ] [ 7 ] и позже был развит Юрием Апресяном. [ 8 ] [ 9 ] [ 10 ] [ 11 ] [ 12 ] [ 13 ] [ 14 ] [ 15 ] [ 16 ] В настоящее время доступны в печатном виде три ECD: один на русском языке, [ 17 ] и два для французского языка. [ 18 ] [ 19 ] Словарь испанских словосочетаний — DICE (= Diccionario de collocations del español) — находится в стадии разработки. [ 20 ] [ 21 ]
Характеристики ЭЦП
[ редактировать ]Полный ECD языка будет содержать записи для каждой лексемы, конструкции или идиомы, называемых совместно «лексическими единицами» (LU), используемых в языке. Записи в ECD основаны на семантическом определении LU, и каждая запись содержит полный список ее словосочетаний и лексических функций . также [ 22 ]
Записи об исторически связанных лексических единицах, которые являются омофонами и имеют общий значительный семантический компонент (т. е. значения), группируются в более крупные единицы, называемые «вокалами», тем самым признавая многозначность , сохраняя при этом особый статус рассматриваемых независимых единиц. английский вокабула Improve Например, включает в себя шесть Лексических Единиц, каждая из которых снабжена отдельной лексической статьей:
УЛУЧШИТЬ , глагол
- УЛУЧШИТЬ I.1a X улучшается ≡ «Ценность или качество X становится выше»
- [ Погода внезапно улучшилась; Система со временем будет улучшаться ]
- УЛУЧШИТЬ I.1b X улучшает Y ≡ 'X вызывает 1 , что Y улучшает I.1a '
- [ Последние изменения радикально улучшили систему ]
- УЛУЧШИТЬ I.2 X улучшается ≡ 'Здоровье больного человека X улучшается I.1a '
- [ Джим постепенно поправляется ]
- УЛУЧШИТЬ I.3 X улучшается в Y ≡ 'Выполнение X Y улучшает I.1a , что вызвано 1 тем, что X практиковал или практикует Y'
- [ Джим постоянно совершенствуется в алгебре ]
- УЛУЧШЕНИЕ II X улучшает Y посредством Z-образования ≡ «X добровольно вызывает 2 повышение рыночной стоимости объекта недвижимости Y в результате Z-образования Y»
- [ Джим улучшил свой дом, установив сантехнику ]
- УЛУЧШИТЬ III X улучшает Y ≡ «X создает новый Y», улучшая I.1b Y»
- [ Джим значительно улучшил перевод Патрика ]
Лексикографические цифры (выделенные жирным шрифтом после входного слова) отражают степени или уровни семантического расстояния между лексическими единицами внутри вокабула: римские цифры обозначают семантические группировки самого высокого уровня, арабские цифры обозначают следующий самый высокий уровень, а буквы обозначают самый низкий уровень. ровные расстояния. четыре лексемы, сгруппированные в IMPROVE I Например, , считаются более близкими друг к другу, чем IMPROVE II или IMPROVE III , поскольку значения каждой из IMPROVE I.1b и IMPROVE I.2 фактически включают в себя значение IMPROVE I. 1а . IMPROVE I.1a и IMPROVE I.1b еще более тесно связаны, потому что в английском языке есть много пар слов — в частности, лабильные или амбитранзитивные глаголы — которые связаны семантическим чередованием «P» ~ «причина 1 с P» (как как указано выше, «улучшить» ~ «привести к улучшению»).
Индексы и надстрочные индексы, прикрепленные к словам в определении, относятся к подсмыслам (индексам) и омофоническим статьям (надстрочным индексам) слова, как указано в Словаре современного английского языка Лонгмана. [ 23 ] - таким образом, «устройство 1 1 «» относится к первой записи устройства в этом словаре, первому смыслу.
Структура записи ECD
[ редактировать ]Запись ECD для данной лексической единицы, назовем ее «L», разделена на три основных раздела или «зоны»:
Семантическая зона
[ редактировать ]Семантическая зона описывает семантические свойства L и состоит из двух подзон:
- 1) определение L, полностью уточняющее значение L; и
- 2) Коннотации L (значения, которые язык ассоциируется с L, но не являются частью его определения). [ 24 ] [ 25 ]
Фонологическая/графематическая зона
[ редактировать ]Фонологическая/графематическая зона дает все данные о фонологических свойствах L. Здесь мы снова находим две подзоны:
- 1) произношение L, включая его слоговое строение, а также любые нестандартные просодические свойства; [ 26 ] и
- 2) орфографическая информация о вариантах написания Л и т. д.
Зона совместного появления
[ редактировать ]Зона совместного появления представляет все данные о комбинаторных свойствах L. Он разделен на пять подзон — морфологическую, синтаксическую, лексическую, стилистическую и прагматическую.
- Морфологическая подзона содержит флективные данные, включая класс спряжения/склонения, неправильные формы, отсутствующие формы, разрешенные чередования и т. д. [ 27 ]
- Синтаксическая подзона состоит из двух частей:
- а) шаблон управления, который описывает элементы, которыми L может синтаксически управлять (аргументы, дополнения и т. д.);
- б) Часть речи и синтаксические особенности, описывающие конструкции, в которых L может выступать как синтаксически зависимая .
- Лексическая подзона определяет лексические функции , в которых участвует L, охватывая как семантические производные , так и словосочетания L с другими отдельными LU или очень маленькими и нерегулярными группами LU.
- Стилистическая подзона определяет речевой регистр Л (неформальный, разговорный, вульгарный, поэтический и т. д.), временную (устаревшую, архаичную) и географическую (британскую, индийскую, австралийскую) изменчивость и тому подобное.
- Прагматическая подзона описывает ситуации реальной жизни, в которых конкретное выражение уместно или неуместно.
Ссылки
[ редактировать ]- ^ Мельчук, Игорь А. (2006). Толковый комбинаторный словарь. В Джандоменико Сика (ред.), Открытые проблемы лингвистики и лексикографии, 225–355. Монца: Полиметрика
- ^ Пирсон, Дженнифер. 1998 г. Термины в контексте. Амстердам: Джон Бенджаминс 76–82.
- ^ Фонтенель, Тьерри. (2008) Использование двуязычного словаря для создания семантических сетей. В Тьерри Фонтенелле (ред.), Практическая лексикография: читатель, 175. Оксфорд: Издательство Оксфордского университета.
- ^ Фроули, Уильям. (1988). Новые формы специализированных словарей. Международный журнал лексикографии 1, 189–213.
- ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1965). «О возможном методе и инструментах семантического синтеза». Научно-техническая информация . 5 : 23–28.
- ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1966). «О системе семантического синтеза. I. Структура словаря». Научно-техническая информация . 11 : 48–55.
- ^ Жолковский, Александр; Игорь Алексеевич Мельчук (1967). «О семантическом синтезе [О семантическом синтезе]». Кибернетические проблемы . 19 : 177–238.
- ^ Апресян, Юрий (1969). «Толкование лексических значений как проблема теоретической семантики». Известия Академии наук СССР, Серия Лит. Я Языка . 28 : 11–23.
- ^ Апресян, Юрий (1969). «О языке описания лексических значений». Известия Академии наук СССР, Серия Лит. Я Языка . 28 : 415–428.
- ^ Апресян, Юрий (1974). Лексическая семантика. Лексическая семантика. Синонимические средства языка . Москва: Наука.
- ^ Апресан, Юрий (1980). Типовая информация для поверхностно-семантического компонента Смысл ⇔ Текст [Типы информации для поверхностно-семантического компонента смыслово-текстовой модели] . Вена: Венский славистический альманах.
- ^ Апресян, Юрж (1988). Караулов, Юрий (ред.). «Морфологическая информация в одноязычном словаре». Словарные категории . Москва: Наука: 31–59.
- ^ Apresjan, Jurij (1988). "Tipy kommunikativnoj informacii dlja tolkovogo slovarja [Types of Communicative Information for a Monolingual Dictionary]". Jazyk: Sistema I Funkcionirovanie . Moscow: Nauka: 10–22.
- ^ Признательность, Юрий (1990). «Типы лексикографической информации о означающем лексемы». Типология I Грамматика . Москва: Наука: 91–108.
- ^ Признательность, Юрий (1990). «Формальная модель языка и представление лексикографических знаний». IVВопросы языкознания . 6 : 91–108.
- ^ Признательность, Юрий (1995). Выбор Труди. Том II. Интегральное описание языка и системная лексикография. Том II. Интегральное лингвистическое описание и системная лексикография . Москва: Школа «Языки русской культуры».
- ^ Мельчук Игорь А.; Александр Жолковский (1984). Толковый комбинаторный словарь современного русского языка. Семантико-синтаксические исследования русской лексики . Вена: Венский славистский альманах.
- ^ Мельчук Игорь А.; Арбачевский-Жумари, Н.; Иорданская, Лида; Манта, С.; Польгер, Ален (1999). Толковый и комбинационный словарь современного французского языка. Лексико-семантическое исследование IV . Монреаль: Les Presses de l'Université de Montréal.
- ^ Мельчук Игорь А.; Ален Польгер (2007). Активный французский лексикон: изучение словарного запаса на основе 20 000 семантических производных и словосочетаний французского языка . Париж: Дюкуло.
- ^ Алонсо Рамос, Маргарита (2003). Фернандес Монтравета, А.; А. Марти Антонин; Г. Васкес Гарсиа (ред.). «К словарю испанских словосочетаний и их кодификации». Компьютерная и семантическая лексикография . Барселона: Университет Барселоны : 11–34.
- ^ Алонсо Рамос, Маргарита (2004). Батанер, П. и Дж. ДеСесарис Гарсиа (ред.). «Разработка словаря словосочетаний испанского языка и его приложений». Лексикографии: Труды I Международного симпозиума по лексикографии, Барселона: IULA : 149–162.
- ^ Фроули, Уильям. (1988). Новые формы специализированных словарей. Международный журнал лексикографии 1, 189–213.
- ^ Словарь современного английского языка Лонгмана . Лондон: Лонгман. 1978.
- ^ Иорданская, Лида; Игорь Алексеевич Мельчук (1984). «Коннотация в семантике и лексикографии». Толковый и комбинаторный словарь современного французского языка: Лексико-семантическое исследование И. Монреаль: Presses de l'Université de Montréal: 33–40.
- ^ Иорданская, Лида; Игорь А. Мельчук (2006). Бергер, Т.; К. Гучмидт; С. Кемпген; П. Коста (ред.). «Коннотация». Славянские языки: международный справочник по их истории, структуре и исследованию . Нью-Йорк: Уолтер де Грюйтер.
- ^ Признательность, Юрий (1990). «Типы лексикографической информации о означающем лексемы». Типология I Грамматика . Москва: Наука: 91–108.
- ^ Апресян, Юрж (1988). Караулов, Юрий (ред.). «Морфологическая информация в одноязычном словаре». Словарные категории . Москва: Наука: 31–59.