Jump to content

Справочный корпус немецкого языка

Немецкий справочный корпус (оригинал: Deutsches Referenzkorpus ; сокращенно: DeReKo ) — это электронный архив текстовых корпусов современного письменного немецкого языка . Впервые он был создан в 1964 году и размещается в Институте немецкого языка (Институт немецкого языка Лейбница, сокращенно : IDS ) в Мангейме , Германия . Архив корпуса постоянно обновляется и расширяется. В настоящее время он включает более 4,0 миллиардов словесных токенов (по состоянию на август 2010 г.) и представляет собой крупнейшую лингвистически мотивированную коллекцию современных немецких текстов. Сегодня это один из крупнейших мировых ресурсов по изучению письменного немецкого языка.

Альтернативные названия

[ редактировать ]

Немецкий справочный корпус часто называют другими названиями, такими как Mannheim corpora , IDS corpora , COSMAS corpora и соответствующими немецкими переводами. Название Deutsches Referenzkorpus (DeReKo) первоначально использовалось для определенной части текущего архива, который был собран в период с 1999 по 2002 год рядом учреждений в рамках совместного проекта под тем же названием. С 2004 года Deutsches Referenzkorpus (DeReKo) является официальным названием полного корпуса архива.

Концепция и композиция

[ редактировать ]

Справочный корпус немецкого языка включает художественные и академические тексты, большое количество газетных текстов и несколько других типов текстов. Тексты охватывают временной диапазон примерно с 1950 года по настоящее время.

Однако, в отличие от других известных корпусов и корпусных архивов (таких как Британский национальный корпус ), немецкий справочный корпус явно не спроектирован как сбалансированный корпус : распределение текстов DeReKo по времени или типам текста не соответствует некоторым заранее определенным проценты.

Эта концепция согласуется с тем фактом, что то, представляет ли данный корпус сбалансированную или даже репрезентативную языковую выборку , может быть оценено только по отношению к конкретной языковой области (т. е. статистической совокупности ). Поскольку различные лингвистические исследования обычно направлены на разные языковые области, заявленная цель Справочного корпуса немецкого языка состоит в том, чтобы служить универсальным вышестоящим образцом или изначальным образцом (нем. Ur-Stichprobe ) современного письменного немецкого языка, из которого пользователи корпуса могут извлечь специализированная подвыборка (так называемый виртуальный корпус ), представляющая языковую область, которую они хотят исследовать.

Из-за ограничений авторских прав и лицензий архив DeReKo нельзя копировать или предлагать для загрузки. Их можно бесплатно запрашивать и анализировать через систему COSMAS II — конечные пользователи должны зарегистрироваться по имени и дать согласие на использование корпусных данных исключительно в некоммерческих академических целях. COSMAS II позволяет пользователям составлять из DeReKo виртуальный корпус, подходящий для их конкретных исследовательских вопросов.

См. также

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a8577e984857e8872d84b3253133d230__1674841740
URL1:https://arc.ask3.ru/arc/aa/a8/30/a8577e984857e8872d84b3253133d230.html
Заголовок, (Title) документа по адресу, URL1:
German Reference Corpus - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)