Jump to content

Коллекция Панглосс

Коллекция Панглосса — это цифровая библиотека , целью которой является хранение и облегчение доступа к аудиозаписям на исчезающих языках мира. разработанная центром CNRS LACITO в Париже , Коллекция, обеспечивает бесплатный онлайн-доступ к документам связной , спонтанной речи на малодокументированных языках всех континентов. [1]

Принципы

[ редактировать ]

Звуковой архив с синхронизированными транскрипциями.

[ редактировать ]

Для науки языкознания язык – это прежде всего устная речь. Средством разговорной речи является звук. Коллекция Панглосса предоставляет доступ к оригинальным записям одновременно с транскрипциями и переводами в качестве ресурса для дальнейших исследований. После записи в культурном контексте тексты расшифровываются в сотрудничестве с носителями языка .

Структурированная открытая архитектура

[ редактировать ]

Архивированные данные структурированы в соответствии с новейшими стандартами обработки данных, имеют открытую архитектуру , открытый формат и могут быть загружены по лицензии Creative Commons . Программное обеспечение, используемое для его подготовки и распространения, имеет открытый исходный код . Коллекция Панглосса является членом сети архивных хранилищ OLAC и Сети цифровых архивов языков и музыки, находящихся под угрозой исчезновения (DELAMAN).

Первоначально коллекция называлась « Архив ЛАСИТО» . [2] [3] Проект зародился в 1996 году в результате сотрудничества Бойда Михайловского, лингвиста LACITO, и Джона Б. Лоу, инженера; [4] : 15  Позже к ним присоединился инженер Мишель Джейкобсон, который разработал некоторые инструменты для проекта и вывел его в эксплуатацию. [1] : 124  [4]

Целью архива было « сохранить и сделать доступными для исследования записанные и расшифрованные устные традиции и другие лингвистические материалы на (в основном) бесписьменных языках, предоставив одновременный доступ к звукозаписям и текстовым аннотациям ». [4] Самыми ранними архивными корпусами в коллекции были языки из Непала , Новой Каледонии , Восточной Африки и Французской Гвианы . [5]

Архив неуклонно рос с начала 2000-х годов. [6] включение корпусов от различных лингвистов, независимо от того, являются ли они членами LACITO или нет. В 2009 году в архиве насчитывалось 200 записей на 45 языках. [7] (недавно переименованной) В 2014 году в коллекции Pangloss Collection было 1400 записей на 70 языках. [1] : 121 

По состоянию на апрель 2021 года в архиве Панглосса содержится 5038 записей. [8] на 196 языках, [9] Всего 780 часов аудио- и видеозаписей. [6]

Языки в коллекции Панглосса включают Мвотлап ( австронезийский ; Вануату ), [10] Джапхуг ( Китайско-Тибетский ; Юго-Западный Китай ), [11] Эрсу ( Китайско-Тибетский ; Юго-Западный Китай ), [12] Наси (или Юннин На : китайско-тибетский ; Юго-Западный Китай ), [13] и Семухи ( Австронезия ; Новая Каледония ). [14]

  1. ^ Перейти обратно: а б с Михайловский, Бойд, Мартин Мазодон, Алексис Мишо, Северин Гийом, Александр Франсуа и Евангелия Адаму . 2014. Документирование и исследование языков, находящихся под угрозой исчезновения: Коллекция Панглоса . Языковая документация и сохранение 8, стр. 119–135.
  2. ^ Джейкобсон, Мишель; Михайловский, Бойд (2002). Архив LACITO: его цель и реализация . Международный семинар по ресурсам и инструментам полевой лингвистики. Лас-Пальмас, Канарские острова, Испания.
  3. Скриншот домашней страницы архива LACITO — 27 февраля 2001 г.
  4. ^ Перейти обратно: а б с Джейкобсон, Мишель; Михайловский, Бойд; Лоу, Джон Б. (2001). «Лингвистические документы, синхронизирующие звук и текст» . Речевое общение . Специальный выпуск: «Речевая аннотация и корпусные инструменты». 33 (1–2): 79–96. CiteSeerX   10.1.1.467.490 . дои : 10.1016/S0167-6393(00)00070-4 .
  5. Скриншот содержимого архива LACITO — 22 апреля 2002 г.
  6. ^ Перейти обратно: а б Раздел «О нас» коллекции Панглосса (по состоянию на 24 апреля 2021 г.)
  7. Скриншот содержимого архива LACITO — 26 ноября 2009 г.
  8. ^ Источник: список всех ресурсов Pangloss на домашней странице Cocoon (получено 10 января 2022 г.).
  9. ^ Источник: количество языковых записей в списке корпусов (получено 24 апреля 2021 г.).
  10. ^ Корпус Mwotlap : 564 ресурса .
  11. ^ Корпус Japhug : 551 ресурс .
  12. ^ Корпус Ersu : 363 ресурса .
  13. ^ Корпус Юннин На : 301 ресурс .
  14. ^ Корпус Cèmuhî : 230 ресурсов .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 37a60d4f62b22143b3a4a684d40d5b4d__1703040540
URL1:https://arc.ask3.ru/arc/aa/37/4d/37a60d4f62b22143b3a4a684d40d5b4d.html
Заголовок, (Title) документа по адресу, URL1:
Pangloss Collection - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)