Коллекция Панглосс
Коллекция Панглосса — это цифровая библиотека , целью которой является хранение и облегчение доступа к аудиозаписям на исчезающих языках мира. разработанная центром CNRS LACITO в Париже , Коллекция, обеспечивает бесплатный онлайн-доступ к документам связной , спонтанной речи на малодокументированных языках всех континентов. [1]
Принципы
[ редактировать ]Звуковой архив с синхронизированными транскрипциями.
[ редактировать ]Для науки языкознания язык – это прежде всего устная речь. Средством разговорной речи является звук. Коллекция Панглосса предоставляет доступ к оригинальным записям одновременно с транскрипциями и переводами в качестве ресурса для дальнейших исследований. После записи в культурном контексте тексты расшифровываются в сотрудничестве с носителями языка .
Структурированная открытая архитектура
[ редактировать ]Архивированные данные структурированы в соответствии с новейшими стандартами обработки данных, имеют открытую архитектуру , открытый формат и могут быть загружены по лицензии Creative Commons . Программное обеспечение, используемое для его подготовки и распространения, имеет открытый исходный код . Коллекция Панглосса является членом сети архивных хранилищ OLAC и Сети цифровых архивов языков и музыки, находящихся под угрозой исчезновения (DELAMAN).
История
[ редактировать ]Первоначально коллекция называлась « Архив ЛАСИТО» . [2] [3] Проект зародился в 1996 году в результате сотрудничества Бойда Михайловского, лингвиста LACITO, и Джона Б. Лоу, инженера; [4] : 15 Позже к ним присоединился инженер Мишель Джейкобсон, который разработал некоторые инструменты для проекта и вывел его в эксплуатацию. [1] : 124 [4]
Целью архива было « сохранить и сделать доступными для исследования записанные и расшифрованные устные традиции и другие лингвистические материалы на (в основном) бесписьменных языках, предоставив одновременный доступ к звукозаписям и текстовым аннотациям ». [4] Самыми ранними архивными корпусами в коллекции были языки из Непала , Новой Каледонии , Восточной Африки и Французской Гвианы . [5]
Архив неуклонно рос с начала 2000-х годов. [6] включение корпусов от различных лингвистов, независимо от того, являются ли они членами LACITO или нет. В 2009 году в архиве насчитывалось 200 записей на 45 языках. [7] (недавно переименованной) В 2014 году в коллекции Pangloss Collection было 1400 записей на 70 языках. [1] : 121
По состоянию на апрель 2021 года в архиве Панглосса содержится 5038 записей. [8] на 196 языках, [9] Всего 780 часов аудио- и видеозаписей. [6]
Языки в коллекции Панглосса включают Мвотлап ( австронезийский ; Вануату ), [10] Джапхуг ( Китайско-Тибетский ; Юго-Западный Китай ), [11] Эрсу ( Китайско-Тибетский ; Юго-Западный Китай ), [12] Наси (или Юннин На : китайско-тибетский ; Юго-Западный Китай ), [13] и Семухи ( Австронезия ; Новая Каледония ). [14]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Михайловский, Бойд, Мартин Мазодон, Алексис Мишо, Северин Гийом, Александр Франсуа и Евангелия Адаму . 2014. Документирование и исследование языков, находящихся под угрозой исчезновения: Коллекция Панглоса . Языковая документация и сохранение 8, стр. 119–135.
- ^ Джейкобсон, Мишель; Михайловский, Бойд (2002). Архив LACITO: его цель и реализация . Международный семинар по ресурсам и инструментам полевой лингвистики. Лас-Пальмас, Канарские острова, Испания.
- ↑ Скриншот домашней страницы архива LACITO — 27 февраля 2001 г.
- ^ Перейти обратно: а б с Джейкобсон, Мишель; Михайловский, Бойд; Лоу, Джон Б. (2001). «Лингвистические документы, синхронизирующие звук и текст» . Речевое общение . Специальный выпуск: «Речевая аннотация и корпусные инструменты». 33 (1–2): 79–96. CiteSeerX 10.1.1.467.490 . дои : 10.1016/S0167-6393(00)00070-4 .
- ↑ Скриншот содержимого архива LACITO — 22 апреля 2002 г.
- ^ Перейти обратно: а б Раздел «О нас» коллекции Панглосса (по состоянию на 24 апреля 2021 г.)
- ↑ Скриншот содержимого архива LACITO — 26 ноября 2009 г.
- ^ Источник: список всех ресурсов Pangloss на домашней странице Cocoon (получено 10 января 2022 г.).
- ^ Источник: количество языковых записей в списке корпусов (получено 24 апреля 2021 г.).
- ^ Корпус Mwotlap : 564 ресурса .
- ^ Корпус Japhug : 551 ресурс .
- ^ Корпус Ersu : 363 ресурса .
- ^ Корпус Юннин На : 301 ресурс .
- ^ Корпус Cèmuhî : 230 ресурсов .
Внешние ссылки
[ редактировать ]- Домашняя страница коллекции Панглосса
- Пример текста из сборника: «Огр Канайонгба» , рассказ на языке лимбу Непала . , представленный в двуязычном формате
- Доступ к коллекции Панглосса через языковую карту.
- Доступ к коллекции Pangloss через поисковый интерфейс CoCoON .
- Доступ к коллекции Pangloss Collection через поисковый интерфейс OLAC . Архивировано 24 апреля 2021 г. в Wayback Machine.