Jump to content

Исследование использования английского языка

Исследование использования английского языка было первым исследовательским центром в Европе, который проводил исследования с использованием корпусов . Исследование проводится на факультете английского языка и литературы Университетского колледжа Лондона .

Исследование использования английского языка было основано как Исследование разговорного английского языка в Даремском университете в 1959 году Рэндольфом Квирком , переехавшим с ним в Университетский колледж Лондона в 1960 году. [1] Многие известные лингвисты проводили исследования в рамках Обзора, в том числе Бас Аартс, Валери Адамс, Джон Алджео, Дуайт Болинджер, Ноэль Бертон-Робертс, Дэвид Кристал , Дерек Дэви, Ян Фирбас, Сидни Гринбаум , Лилиан Хегеман, Роберт Илсон, Рут Кемпсон, Джеффри Лич , Ян Русецки, Ян Свартвик и Джо Таглихт. Нынешний директор - Бас Аартс. [2]

Оригинальный Survey Corpus предшествовал современным вычислениям. Его записывали на катушечные ленты, переписывали на бумагу, хранили в картотечных шкафах и индексировали на бумажных карточках. Транскрипции сопровождались подробными просодическими и паралингвистическими аннотациями, разработанными Кристалом и Квирком (1964). [3] Наборы бумажных карточек вручную размечались по грамматическим структурам и архивировались так, что, например, все существительные фразы можно было найти в картотеке именной фразы в Обзоре. Естественно, корпусные поиски требовали посещения Обзора.

Этот корпус теперь более широко известен как Лондон-Лундский корпус (LLC), поскольку компьютеризация корпуса была обязанностью коллег из Лунда, Швеция. Тридцать четыре устных текста были опубликованы в виде книг под названием «Свартвик и Квирк» (1980). [4] и корпус был использован в качестве основы для знаменитой книги «Комплексная грамматика английского языка» (Quirk et al. 1985). [5]

Текущие исследования

[ редактировать ]

Построение корпусов

[ редактировать ]

В 1988 году Сидни Гринбаум предложил новый проект — ICE Международный корпус английского языка . ICE должен был стать международным проектом, осуществляемым в исследовательских центрах по всему миру, по составлению корпусов разновидностей английского языка, где английский был первым или вторым официальным языком. Тексты ICE будут содержать устный и письменный английский в сбалансированной выборке из одного миллиона слов на каждый компонент, чтобы эти образцы можно было сравнивать самыми разными способами. Проект ICE продолжается по всему миру и по сей день.

ICE-GB , британский компонент ICE, был составлен в ходе Обзора. ICE-GB был аннотирован на очень подробном уровне, включая построение полного грамматического анализа (разбора) каждого предложения в корпусе. Первый выпуск ICE-GB состоялся в 1998 году. ICE-GB распространялся вместе с программным обеспечением для поиска и изучения анализируемого корпуса под названием ICECUP. Вторая версия ICE-GB уже выпущена и доступна на компакт-диске.

Помимо контрастных разновидностей английского языка, многие исследователи интересуются развитием языка и его изменением с течением времени. Недавний проект Survey предпринял анализ большой (400 000 слов) выборки разговорной части LLC способом, непосредственно сопоставимым с ICE-GB, сформировав новый диахронический корпус из 800 000 слов, названный Диахроническим корпусом настоящего времени. Дневной разговорный английский ( DCPSE ). DCPSE уже выпущен и доступен на компакт-диске в журнале Survey.

Эти два корпуса содержат самую большую в мире коллекцию проанализированных и исправленных орфографически транскрибированных данных разговорного английского языка, содержащую более миллиона слов разговорного английского языка в этой форме.

Изучение корпусов

[ редактировать ]

Разобранные корпуса представляют собой большие базы данных, содержащие подробные грамматические древовидные структуры. Одним из последствий формирования больших коллекций ценных лингвистических данных является острая потребность в методах и инструментах, которые помогут исследователям и другим пользователям максимально эффективно использовать их. Поэтому параллельно с анализом данных естественного языка команда исследования провела исследование и разработку программных инструментов, которые помогут лингвистам использовать эти корпуса. Исследовательская платформа ICECUP использует интуитивно понятное грамматическое представление запроса под названием «Фрагменты нечеткого дерева» (FTF) для поиска в проанализированных корпусах.

Лингвистические исследования с корпусами

[ редактировать ]

Помимо распространения корпусов и инструментов среди исследовательского сообщества корпусной лингвистики , SEU проводит исследования английского языка. Недавние проекты включают исследование английской именной фразы, подчинения в разговорном и письменном английском языке, а также английской глагольной фразы. Исследование также оказывает поддержку аспирантам, которые проводят исследования в области корпусов английского языка.

  1. ^ Негли Харт; Джон Норт; Джорджина Брюис (2018). Мир UCL (PDF) . УКЛ Пресс. стр. 239–240. дои : 10.14324/111.9781787352933 . ISBN  9781787352933 .
  2. ^ «Обзорный штаб» . Университетский колледж Лондона . Проверено 14 ноября 2016 г.
  3. ^ Кристал, Дэвид и Квирк, Рэндольф (1964). Системы просодических и паралингвистических признаков английского языка . Гаага: Мутон.
  4. ^ Свартвик, Ян и Квирк, Рэндольф (1980) (ред.). Корпус разговорного английского языка Лунд: CWK Gleerup.
  5. ^ Квирк, Рэндольф, Гринбаум, Сидни, Лич, Джеффри и Свартвик, Январь (1985). Комплексная грамматика английского языка Лондон: Лонгман.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 33f041e9692db2baacb15b32cfdae705__1683478740
URL1:https://arc.ask3.ru/arc/aa/33/05/33f041e9692db2baacb15b32cfdae705.html
Заголовок, (Title) документа по адресу, URL1:
Survey of English Usage - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)