Бета-код
Бета-код — это метод представления с использованием только символов ASCII символов, акцентов и форматирования, встречающихся в древнегреческих текстах (и других древних языках). Его целью было не просто латинизировать греческий алфавит , но и достоверно представить широкий спектр исходных текстов, включая форматирование, а также редкие или уникальные символы. Для большинства приложений он устарел благодаря Unicode.
Бета-код был разработан Дэвидом Паккардом в конце 1970-х годов и принят Thesaurus Linguae Graecae в 1981 году. Он стал стандартом для кодирования политонического греческого языка , а также использовался в ряде других проектов, таких как проект Персей , Гуманитарный институт Паккарда. , коллекцию документальных папирусов Дьюка и проект греческой эпиграфики в Корнеллском университете и Университете штата Огайо . Бета-код можно легко преобразовать в различные системы отображения, особенно в Unicode . [1] Большинство этих проектов с тех пор преобразовали свои данные в Unicode. Например, Персей изначально закодировал все свои древнегреческие тексты с помощью бета-кода. [2] но теперь выпускает их как Unicode.
Кодирование
[ редактировать ]Греческий алфавит
[ редактировать ]Верхний регистр | Бета-код | Имя персонажа | Нижний регистр | Бета-код |
---|---|---|---|---|
А | *А | Альфа | а | А |
Б | *Б | Бета | б | Б |
С | *Г | Гамма | с | Г |
Д | *Д | Дельта | д | Д |
Э | *И | Эпсилон | е | И |
Ф | *V | Дигамма | ϝ | V |
Г | *С | Зета | г | С |
ИЛИ | *ЧАС | И | или | ЧАС |
че | *В | Тета | я | вопрос |
я | *Я | Йота | я | я |
К | *К | Каппа | Мистер | К |
л | *Л | Лямбда | л | л |
М | *М | В | м | М |
Н | *Н | Нет | н | Н |
Х | *С | Си | х | С |
ТО | *ТОТ | Омикрон | тот | ТО |
П | *П | Пи | п | П |
Р | *Р | Ро | р | Р |
С | *С | Медиальная сигма | п | С, С1 |
Последняя Сигма | с | С, С2, Дж | ||
С | *S3 | Лунативная Сигма | ϲ | S3 |
Т | *Т | Да | т | Т |
Да | *В | Ипсилон | ты | В |
Ф | *Ф | Фи | ж | Ф |
Х | *Х | Тратить | час | Х |
P.S. | *И | Пси | п | И |
Ой | *В | Омега | ой | В |
Примечания
[ редактировать ]- Вместо прописных латинских букв также можно использовать строчные латинские буквы (например, a для α и *a для Α).
- В руководстве по бета-коду TLG для обозначения греческих букв используются заглавные буквы ASCII. В варианте (используемом проектом «Персей» ) вместо этого используются строчные буквы ASCII. В обоих случаях буква ASCII без украшений представляет собой строчную греческую букву, а для обозначения прописной греческой буквы необходимо добавить звездочку.
- В общем, одного кодирующего символа S для греческой сигмы достаточно; он интерпретируется как конечная сигма в конце слов или когда за ним следует знак препинания, а также как медиальная сигма в других позициях. В тех случаях, когда это автоматическое устранение неоднозначности неверно, специальные коды S1 и S2 . доступны
- используется В некоторых представлениях J для последней сигмы, а S — для средней сигмы. Однако J не поддерживается/не выводится многими приложениями, такими как Morpheus и uni2beta.
Пунктуация
[ редактировать ]Пунктуация | Бета-код | Имя |
---|---|---|
. | . | Период |
, | , | Запятая |
· | : | Колон ( Ано Стигме ) |
; | ; | Знак вопроса |
’ | ' | Апостроф |
‐ | - | Дефис |
— | _ | Бросаться |
' | # | Цифра ( Керайя ) |
Символ ' используется как для кодирования апострофа, так и для добавления метрического бреве к гласной. Намерение неоднозначно, поскольку апостроф используется в греческом языке только для обозначения исключения, которое обычно происходит после согласного.
Акценты и диакритические знаки
[ редактировать ]Диакритический знак | Бета-код | Имя | Примеры | Кодируется как |
---|---|---|---|---|
̓ | ) | Ровное дыхание | в | Д) Нет |
̔ | ( | Грубое дыхание | то, то | О(, ОИ( |
́ | / | Острый акцент | к | ПРО/С |
͂ | = | Циркумфлексный акцент | из | ТВ=Н |
̀ | \ | Могильный акцент | к | ЗА\С |
̈ | + | Диэрезис | доходы | ПРОИ+Э/НАИ |
ͅ | | | Индекс Йоты | к | ТВ=| |
̄ | & | Макрон | махаирс | МАКСАЙ/РА&С |
̆ | ' | Краткий | нож | МА/ХАЙРА' |
Обычно это постфиксные операторы, как в примерах выше, но в словах, написанных с заглавной буквы, между * и буквой ставится ударение. Документация иначе не определяет обязательный или канонический порядок акцентов. В некоторых источниках данных дыхание обычно предшествует тональному акценту. [3] и одна реализация определяет канонический порядок дыхания, акцента и нижнего индекса йоты. [4] В некоторых реализациях порядок акцентов может определять расположение объединяемых символов после преобразования в Юникод. [5] Многие реализации не реализуют макронизацию.
Ссылки
[ редактировать ]- ^ Справочное руководство по бета-версии Unicode было разработано проектом TLG ( http://www.tlg.uci.edu/encoding/quickbeta.pdf ).
- ^ «Справочно-информационный центр Персей» . www.perseus.tufts.edu . Проверено 26 декабря 2022 г.
- ^ Крейн, библиотека стеблей Morpheus, https://github.com/perseusdl/morpheus
- ^ https://github.com/perseids-tools/beta-code-rb/tree/master/vendor/beta-code-json
- ^ Пол Харди, утилита beta2uni