Справочный корпус немецкого языка
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Немецкий справочный корпус (оригинал: Deutsches Referenzkorpus ; сокращенно: DeReKo ) — это электронный архив текстовых корпусов современного письменного немецкого языка . Впервые он был создан в 1964 году и размещается в Институте немецкого языка (Институт немецкого языка Лейбница, сокращенно : IDS ) в Мангейме , Германия . Архив корпуса постоянно обновляется и расширяется. В настоящее время он включает более 4,0 миллиардов словесных токенов (по состоянию на август 2010 г.) и представляет собой крупнейшую лингвистически мотивированную коллекцию современных немецких текстов. Сегодня это один из крупнейших мировых ресурсов по изучению письменного немецкого языка.
Альтернативные названия
[ редактировать ]Немецкий справочный корпус часто называют другими названиями, такими как Mannheim corpora , IDS corpora , COSMAS corpora и соответствующими немецкими переводами. Название Deutsches Referenzkorpus (DeReKo) первоначально использовалось для определенной части текущего архива, который был собран в период с 1999 по 2002 год рядом учреждений в рамках совместного проекта под тем же названием. С 2004 года Deutsches Referenzkorpus (DeReKo) является официальным названием полного корпуса архива.
Концепция и композиция
[ редактировать ]Справочный корпус немецкого языка включает художественные и академические тексты, большое количество газетных текстов и несколько других типов текстов. Тексты охватывают временной диапазон примерно с 1950 года по настоящее время.
Однако, в отличие от других известных корпусов и корпусных архивов (таких как Британский национальный корпус ), немецкий справочный корпус явно не спроектирован как сбалансированный корпус : распределение текстов DeReKo по времени или типам текста не соответствует некоторым заранее определенным проценты.
Эта концепция согласуется с тем фактом, что то, представляет ли данный корпус сбалансированную или даже репрезентативную языковую выборку , может быть оценено только по отношению к конкретной языковой области (т. е. статистической совокупности ). Поскольку различные лингвистические исследования обычно направлены на разные языковые области, заявленная цель Справочного корпуса немецкого языка состоит в том, чтобы служить универсальным вышестоящим образцом или изначальным образцом (нем. Ur-Stichprobe ) современного письменного немецкого языка, из которого пользователи корпуса могут извлечь специализированная подвыборка (так называемый виртуальный корпус ), представляющая языковую область, которую они хотят исследовать.
Доступ
[ редактировать ]Из-за ограничений авторских прав и лицензий архив DeReKo нельзя копировать или предлагать для загрузки. Их можно бесплатно запрашивать и анализировать через систему COSMAS II — конечные пользователи должны зарегистрироваться по имени и дать согласие на использование корпусных данных исключительно в некоммерческих академических целях. COSMAS II позволяет пользователям составлять из DeReKo виртуальный корпус, подходящий для их конкретных исследовательских вопросов.
См. также
[ редактировать ]- Текстовый корпус
- Корпусная лингвистика
- Американский национальный корпус (АНК)
- Банк английского языка (BoE)
- Британский национальный корпус (BNC)
- Корпус современного американского английского (COCA)
- Оксфордский корпус английского языка (OEC)
Ссылки
[ редактировать ]- Купиц, М. и К. Белика, Х. Кейбель и А. Витт (2010): Немецкий справочный корпус DeReKo: первоначальный образец лингвистических исследований . В: Кальцолари, Н. и др. (ред.): Материалы 7-й конференции по международным языковым ресурсам и оценке (LREC 2010) (стр. 1848–1854). Валлетта, Мальта: Европейская ассоциация языковых ресурсов (ELRA).
- Купиц, М. и Х. Кейбель (2009): Мангеймский справочный корпус немецкого языка (DeReKo) как основа для эмпирических лингвистических исследований . В: Рабочие документы по корпусной лингвистике и языковому образованию, № 3 (стр. 53–59). Токио: Токийский университет иностранных языков (TUFS).
Внешние ссылки
[ редактировать ]- Сайт DeReKo (немецкий)
- COSMAS II - бесплатный интерфейс DeReKo (сайт на немецком языке)