Тезаурус греческого языка
Thesaurus Linguae Graecae ( TLG ) — исследовательский центр Калифорнийского университета в Ирвине . TLG была основана в 1972 году Марианной Макдональд (в то время аспиранткой, а ныне профессором театра и классики Калифорнийского университета в Сан-Диего ) с целью создать всеобъемлющую цифровую коллекцию всех сохранившихся текстов, написанных на греческом языке с древности до настоящего времени. С 1972 года TLG собрала и оцифровала большинство сохранившихся литературных текстов, написанных на греческом языке, от Гомера до падения Константинополя в 1453 году нашей эры и далее. Теодор Бруннер (1934–2007) руководил проектом с 1972 года до своего выхода на пенсию из Калифорнийского университета в 1998 году. Мария Пантелия , также профессор классической литературы в Калифорнийском университете в Ирвайне, сменила Теодора Бруннера в 1998 году и с тех пор руководит TLG. Название TLG используется в его онлайн-базе данных, полное название которой — Thesaurus Linguae Graecae: Цифровая библиотека греческой литературы ( для краткости TLG , курсив). [1]
Задача этого огромного предприятия изначально была решена с помощью нескольких классиков и экспертов по технологиям, но в первую очередь благодаря усилиям Дэвида В. Паккарда и его команды, которые создали систему Ibycus, аппаратное и программное обеспечение, первоначально использовавшееся для корректуры и поиска в корпусе. . Компания Packard также разработала бета-код , соглашение о кодировании символов и форматирования, используемое для кодирования политонического греческого языка . Первоначально сборник распространялся на компакт-диске . Первый компакт-диск был выпущен в 1985 году и стал первым компакт-диском, не содержащим музыки. Последующие версии были выпущены в 1988 и 1992 годах благодаря технической поддержке Packard.
К концу 1990-х годов стало очевидно, что старая технология Ibycus устарела. Под руководством профессора Марии Пантелии был реализован ряд новых проектов, в том числе массовый перенос из Ибикуса, разработка новой системы для оцифровки, корректуры и управления текстовой коллекцией, нового компакт-диска (TLG E) , выпущенный в 1999 году, и, в конечном итоге, перемещение корпуса в веб-среду в 2001 году. В то же время TLG начала работать с Техническим комитетом Unicode над включением всех символов, необходимых для кодирования и отображения греческого языка, в стандарт Unicode. Корпус продолжает значительно расширяться и включает в себя византийские , средневековые и, в конечном итоге, новогреческие тексты. Более поздние проекты включают лемматизацию греческого корпуса (2006 г.) – важное мероприятие, учитывая сильно изменчивую природу греческого языка и сложность корпуса, охватывающее более двух тысячелетий литературного развития – и онлайн- греческий сайт Лидделла-Скотта-Джонса. –Английский лексикон (обычно называемый LSJ), выпущенный в феврале 2011 года.
С 2001 года корпус TLG доступен для поиска в Интернете членами организаций-подписчиков, которых по всему миру насчитывается около 1500. Вся библиографическая информация и часть текстов доступны для широкой публики.
Количество греческих слов в корпусе составляет 110 миллионов, [2] при этом количество уникальных словоформ составляет 1,6 миллиона, а количество уникальных лемм - 250 000. [3]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «ТЛГ – Дом» . Тезаурус греческих языков: цифровая библиотека греческой литературы . Калифорнийский университет в Ирвине: Тезаурус греческого языка. 2017 Проверено 10 декабря 2017 г.
- ^ "О" . Тезаурус греческих языков: цифровая библиотека греческой литературы . Калифорнийский университет в Ирвине: Тезаурус греческого языка. 2017 Проверено 10 декабря 2017 г.
- ^ «Статистика» (PDF) . Тезаурус греческих языков: цифровая библиотека греческой литературы . Калифорнийский университет в Ирвине: Тезаурус греческого языка. 2017 Проверено 10 декабря 2017 г.