Исследование использования английского языка
Исследование использования английского языка было первым исследовательским центром в Европе, который проводил исследования с использованием корпусов . Исследование проводится на факультете английского языка и литературы Университетского колледжа Лондона .
История
[ редактировать ]Исследование использования английского языка было основано как Исследование разговорного английского языка в Даремском университете в 1959 году Рэндольфом Квирком , переехавшим с ним в Университетский колледж Лондона в 1960 году. [1] Многие известные лингвисты проводили исследования в рамках Обзора, в том числе Бас Аартс, Валери Адамс, Джон Алджео, Дуайт Болинджер, Ноэль Бертон-Робертс, Дэвид Кристал , Дерек Дэви, Ян Фирбас, Сидни Гринбаум , Лилиан Хегеман, Роберт Илсон, Рут Кемпсон, Джеффри Лич , Ян Русецки, Ян Свартвик и Джо Таглихт. Нынешний директор - Бас Аартс. [2]
Оригинальный Survey Corpus предшествовал современным вычислениям. Его записывали на катушечные ленты, переписывали на бумагу, хранили в картотечных шкафах и индексировали на бумажных карточках. Транскрипции сопровождались подробными просодическими и паралингвистическими аннотациями, разработанными Кристалом и Квирком (1964). [3] Наборы бумажных карточек вручную размечались по грамматическим структурам и архивировались так, что, например, все существительные фразы можно было найти в картотеке именной фразы в Обзоре. Естественно, корпусные поиски требовали посещения Обзора.
Этот корпус теперь более широко известен как Лондон-Лундский корпус (LLC), поскольку компьютеризация корпуса была обязанностью коллег из Лунда, Швеция. Тридцать четыре устных текста были опубликованы в виде книг под названием «Свартвик и Квирк» (1980). [4] и корпус был использован в качестве основы для знаменитой книги «Комплексная грамматика английского языка» (Quirk et al. 1985). [5]
Текущие исследования
[ редактировать ]Построение корпусов
[ редактировать ]В 1988 году Сидни Гринбаум предложил новый проект — ICE — Международный корпус английского языка . ICE должен был стать международным проектом, осуществляемым в исследовательских центрах по всему миру, по составлению корпусов разновидностей английского языка, где английский был первым или вторым официальным языком. Тексты ICE будут содержать устный и письменный английский в сбалансированной выборке из одного миллиона слов на каждый компонент, чтобы эти образцы можно было сравнивать самыми разными способами. Проект ICE продолжается по всему миру и по сей день.
ICE-GB , британский компонент ICE, был составлен в ходе Обзора. ICE-GB был аннотирован на очень подробном уровне, включая построение полного грамматического анализа (разбора) каждого предложения в корпусе. Первый выпуск ICE-GB состоялся в 1998 году. ICE-GB распространялся вместе с программным обеспечением для поиска и изучения анализируемого корпуса под названием ICECUP. Вторая версия ICE-GB уже выпущена и доступна на компакт-диске.
Помимо контрастных разновидностей английского языка, многие исследователи интересуются развитием языка и его изменением с течением времени. Недавний проект Survey предпринял анализ большой (400 000 слов) выборки разговорной части LLC способом, непосредственно сопоставимым с ICE-GB, сформировав новый диахронический корпус из 800 000 слов, названный Диахроническим корпусом настоящего времени. Дневной разговорный английский ( DCPSE ). DCPSE уже выпущен и доступен на компакт-диске в журнале Survey.
Эти два корпуса содержат самую большую в мире коллекцию проанализированных и исправленных орфографически транскрибированных данных разговорного английского языка, содержащую более миллиона слов разговорного английского языка в этой форме.
Изучение корпусов
[ редактировать ]Разобранные корпуса представляют собой большие базы данных, содержащие подробные грамматические древовидные структуры. Одним из последствий формирования больших коллекций ценных лингвистических данных является острая потребность в методах и инструментах, которые помогут исследователям и другим пользователям максимально эффективно использовать их. Поэтому параллельно с анализом данных естественного языка команда исследования провела исследование и разработку программных инструментов, которые помогут лингвистам использовать эти корпуса. Исследовательская платформа ICECUP использует интуитивно понятное грамматическое представление запроса под названием «Фрагменты нечеткого дерева» (FTF) для поиска в проанализированных корпусах.
Лингвистические исследования с корпусами
[ редактировать ]Помимо распространения корпусов и инструментов среди исследовательского сообщества корпусной лингвистики , SEU проводит исследования английского языка. Недавние проекты включают исследование английской именной фразы, подчинения в разговорном и письменном английском языке, а также английской глагольной фразы. Исследование также оказывает поддержку аспирантам, которые проводят исследования в области корпусов английского языка.
Ссылки
[ редактировать ]- ^ Негли Харт; Джон Норт; Джорджина Брюис (2018). Мир UCL (PDF) . УКЛ Пресс. стр. 239–240. дои : 10.14324/111.9781787352933 . ISBN 9781787352933 .
- ^ «Обзорный штаб» . Университетский колледж Лондона . Проверено 14 ноября 2016 г.
- ^ Кристал, Дэвид и Квирк, Рэндольф (1964). Системы просодических и паралингвистических признаков английского языка . Гаага: Мутон.
- ^ Свартвик, Ян и Квирк, Рэндольф (1980) (ред.). Корпус разговорного английского языка Лунд: CWK Gleerup.
- ^ Квирк, Рэндольф, Гринбаум, Сидни, Лич, Джеффри и Свартвик, Январь (1985). Комплексная грамматика английского языка Лондон: Лонгман.