Jump to content

Транслитерация Баквальтера

(Перенаправлено из транслитерации Баквальтера )

Баквальтера . Арабская транслитерация была разработана в рамках арабского проекта ALPNET, которым руководил Кен Бисли в 1988 году

Начинать

[ редактировать ]

Первым аналитиком по арабскому языку для проекта был студент бакалавриата УБЯ по имени Дерек Фоксли, нанятый на неполный рабочий день. Фоксли в то время учился на 4-м курсе арабского языка в УБЯ. [ 1 ] Через несколько месяцев Тим Баквалтер стал штатным сотрудником ALPNET. Баквалтер в то время также был кандидатом наук по арабскому языку. Одной из его задач в проекте было сотрудничать и давать задания по арабскому языку сотруднику, работающему неполный рабочий день, Фоксли.

Бисли обучал Баквальтера и Фоксли некоторым тонким деталям лингвистики, и однажды у доски Бисли подтолкнул Фоксли и Баквальтера придумать схему транслитерации в тот момент. Фоксли уже вводил большую часть данных на тот момент проекта, поэтому был готов заняться этой проблемой. Тем не менее, в тесном сотрудничестве с Баквальтером он придумал почти все символы, используемые в таблице транслитерации. Баквальтер курировал задачи Фоксли по арабскому языку и внес последние коррективы и уточнения в таблицу транслитерации. В то время у него не было названия, однако Баквальтер за несколько лет после проекта ввел тысячи текстовых элементов, используя схему транслитерации, представил ее и также много раз отстаивал ее. Поэтому он был назван в его честь.

В то время такая транслитерация букв «один к одному» не использовалась, или, по крайней мере, команда не знала о ней.

Позже Бисли перешел в Xerox, которая в 1990-х годах купила права на данные ALPNET. Это задокументировано в нескольких других статьях, которые Бисли представил на протяжении многих лет.

Комментарий к системе

[ редактировать ]

Транслитерация Баквальтера — это схема транслитерации только ASCII , представляющая арабскую орфографию строго один к одному, в отличие от более распространенных схем латинизации , которые добавляют морфологическую информацию, не выраженную арабским шрифтом. Так, например, wāw будет транслитерироваться как w независимо от того, реализуется ли он как гласная /uː/ или согласная /w/ . Только когда вав заменяется хамзой ( ؤ ) , транслитерация меняется на & . Это позволяет пользователю вводить или преобразовывать текст точно так, как он видит.

Однако схема транслитерации подверглась некоторой критике. Некоторые пользователи утверждают, что немодифицированные буквы легко читаются (за исключением * =dhaal и E =ayin, v =thaa), но транслитерация букв с диакритическими знаками и харакатом требует некоторого времени, чтобы привыкнуть, например, к нунативному - un, -an, -in появляются как N, F, K , а сукун («без гласной») — как o . Та' марбута ة - это п . Трудность, вероятно, возникла потому, что обычно транслитерация Баквальтера используется и/или представлена ​​без объяснения букв. Хотя эти конкретные буквы кажутся случайными, на самом деле они мнемонически связаны с исходной буквой.

Более того, с тех пор, как была разработана первоначальная схема Баквальтера, появилось несколько других вариантов, хотя не все они стандартизированы. Транслитерация Баквальтера несовместима с XML, поэтому «безопасные для XML» версии часто изменяют следующие символы: < > & (أ إ и ؤ соответственно; Баквальтер предлагает транслитерировать их как IOW соответственно). Полностью «безопасные» схемы транслитерации заменяют все небуквенно-цифровые символы (например, $';*) буквенно-цифровыми символами. [ 2 ]

При транслитерации арабского текста может возникнуть ряд других проблем. Во-первых, некоторые арабские символы не указаны в таблице транслитерации, включая неалфавитные символы, такие как ۞ и ۝ , знаки препинания, такие как ؛ ؟ и восточно-арабские цифры . Точно так же иногда арабские предложения заимствуют неарабские буквы из персидского языка, некоторые из которых определены в полной таблице Баквальтера. [ 3 ] Символы, не определенные в таблице транслитерации, можно удалить, сохранить как нелатинские символы, встроенные в транслитерируемый текст, или транслитерировать в другие (неконфликтные) латинские символы. (Например, преобразовать цифры хинди в арабские цифры несложно.) Другая возникающая проблема заключается в том, как обрабатывать транслитерированный арабский текст со встроенным текстом ASCII; например, арабское предложение, в котором упоминается «IBM», или арабское предложение, содержащее цитату на английском языке. Если латинский текст не отмечен явно, отличить транслитерированный арабский язык от латыни будет сложно. Если транслитерированный текст со встроенной латиницей позже транслитерируется обратно на арабский язык, латинский текст будет транслитерирован на мусорный арабский язык. Наконец, еще одно важное решение, которое необходимо принять, — насколько нормализовать арабский текст во время транслитерации. Это может включать в себя удаление кашиды , удаление кратких гласных и/или других диакритических знаков и/или нормализацию правописания. [ 2 ]

С другой стороны, все типичные обозначения, которые можно было бы использовать при написании - !@#%?.,;:()[]+= не использовались, поскольку они также используются в арабском тексте. Таким образом, если английская IBM действительно появилась на английском языке, в арабском тексте в исходной концепции она должна была быть отмечена двойными кавычками: «IBM». Этот механизм позволяет выполнять автоматическую языковую обработку, оставляя неарабский текст как есть, необработанным, когда он видит двойные кавычки. Первоначально даже < > & также не использовались, особенно < >, которые являются кавычками, заимствованными из французского языка, поскольку они иногда используются в арабском тексте. Они были добавлены позже по мере необходимости. Их XML-безопасные версии соответствуют мнемоническому устройству, разработанному (и обсуждаемому ниже), поскольку IOW соответствует (хотя и неточно) каждому из издаваемых звуков.

Ключевые понятия при разработке таблицы

[ редактировать ]

В схеме транслитерации использовались три ключевых понятия:

Во-первых, каждая арабская буква (звук) может соответствовать только одному символу английского языка. Некоторые арабские буквы при написании издают звук, соответствующий двум английским буквам. Следовательно, для них придется использовать одну букву или общий символ.

Вторая концепция заключалась в том, чтобы по возможности использовать знакомое. Если бы арабская буква всегда ассоциировалась, например, с буквой «s» в английском языке, то ее было бы легче запомнить, если бы ее можно было сохранить в таком виде.

Третья ключевая концепция заключалась в том, что таблица должна была быть полностью мнемонической. Таким образом, каждый отдельный элемент соотносится в следующем порядке предпочтения: а) со звучанием арабской буквы, или б) с физическим аспектом исходной арабской буквы, или в) с именем, которым она называется.

Механика

[ редактировать ]

Предпочтение отдавалось строчным буквам. Однако, когда есть несколько арабских букв, которые имеют схожие звуки, тогда для более открытых звуков использовалась строчная буква, а для более близких/ограниченных звуков использовалась прописная буква. Например, в арабском языке есть 2 буквы, похожие на звук [d] в английском языке. Простому звуку была присвоена маленькая буква «d», а выразительному звуку [dˤ] — заглавная буква «D».

Другими словами, прописная буква указывает на то, что буква похожа на строчную, но имеет какое-то качественное отличие.

Таблица транслитерации Баквальтера

[ редактировать ]
арабские буквы А для Т че С ЧАС Х принадлежащий З Р З вопрос Ш п З я З А г Ф вопрос твой к М Н е и Да یДа [ 4 ]
ОТ 31635 ʾ / ā б т ٧ час час д р С с с ш ʿ с ж д к л м н час с грудью и я
Баквалтер А v дж ЧАС х * $ С Д Т С И г В и И
Ручка ' / аа й х д ш ` хх и
БАТР А/аа с К С' х И г с тобой и ii
МПА ( МСА ) ʔ , аː б т я дʒ
ɡ
ʒ
час х д д р С с ʃ дˤ тˤ ðˤ
ʕ ɣ ж д к л м н час ш , ты j , я
Хамза
  • одинокий Хамза: '
  • Хамза на Алифе: >
  • Хамза ниже Алифа: <
  • Хамза он ва: &
  • hamza on ya: }
алиф
  • статья на Алифе: |
  • алиф аль-прибытие: {
  • кинжал алиф : `
  • Алиф Максура: Да
движение
  • фата: а
  • дамма: и
  • Касра: я
  • фататайн: Ф
  • дамматайн: Н
  • Касратайн К
  • шадда: ~
  • сукун:о
та марбута: п
татвил: _

Мнемоника

[ редактировать ]
А А Эта буква обычно произносится как [aː] . Это не строчная буква «а», потому что это противоречило бы диакритическому знаку фатха , который произносится короче, [а]
для б Произносится как [б] .
Ой п Это тах марбута , и буква «р» очень похожа на то, как она пишется, когда соединена с предыдущей буквой.
Т т Произносится как [т] .
че v Произносится как [θ] . Над ним есть 3 точки, которые при написании выглядят как перевернутая буква «v» — поэтому и использовалась «v».
С дж Произносится [дʒ]
ЧАС ЧАС Эта буква произносится как [ħ] и конфликтует со звуком [h] другой буквы, поэтому используется прописная буква «H».
Х х Произносится как [х] .
принадлежащий д Произносится как [д] .
З * Произносится как [ð] . Над ним стоит точка, поэтому была использована единственная звездочка, похожая на точку над линией.
Р р Произносится как [р] .
З С Произносится как [з] .
вопрос с Произносится как [с] .
Ш $ Произносится [ʃ] . Знак доллара был использован потому, что он выглядит как «s», но у него также есть дополнительное свойство — перечеркнутая линия. Заглавную букву «S» использовать нельзя, поскольку она используется для другой буквы.
п С Произносится как [сˤ] .
З Д Произносится как [дˤ] .
я Т Произносится [тˤ]
З С Произносится [ðˤ~zˤ]
А И Произносится как [ʕ] — звук, не встречающийся в английском языке, поэтому использовалась чисто визуальная мнемоника: эта буква и буква Е выглядят одинаково.
г г Произносится [ɣ~ʁ] , звуки не встречаются в английском языке. Его часто писали как «gh», поэтому букву «g» сохраняли и использовали также визуальную мнемонику. По внешнему виду он похож на строчную букву «g».
Ф ж Произносится как [ф] .
вопрос д Произносится как [к] .
твой к Произносится как [к] .
к л Произносится как [л] .
М м Произносится как [м] .
Н н Произносится как [н] .
е час Произносится как [ч] .
и В Обычно произносится как [w] .
Да И Произносится как [аː] . Использовалась визуальная мнемоника, так как она выглядит как следующая буква, но под ней нет точек.
Да и Произносится как [дж] .
ً Ф Произносится как [ан] . По-арабски это называется фатхатан , двойная фатха . Заглавная буква «F», потому что строчная буква уже используется.
ٌ Н Произносится [ун] . Нижний регистр «n» уже используется, а для согласованности с «F» для нумерованного [an] используется верхний регистр «N».
ٍ К Произносится [в] . Это Касратан , бесплодная Касра . Нижний регистр «k» уже используется, а для согласованности с «F» для нумерованного [an] используется верхний регистр «K».
َ а Произносится как [а] .
ُ в Произносится как [у] .
ِ я Произносится как [и] .
ّ ~ Это шадда , представляющая собой удвоение расположенной выше согласной. Тильда — это также знак, расположенный над буквой и встречающийся на большинстве английских клавиатур. Это «физическая мнемоника».
ْ тот Это «сукун» и означает, что в этой букве нет гласного звука. Использовалась близкая визуальная мнемоника со строчной буквой «о».

Первоначальная команда ALPNET быстро приняла эту схему. Несмотря на то, что Бисли не знал арабского языка, он быстро смог его понять и использовать. Сила транслитерации Баквальтера в том, что каждая арабская буква представлена ​​отчетливо. Тем не менее, использование традиционной транслитерации или мнемонических приемов для всего нетрадиционного делает его очень простым в изучении.

Первая статья Всеобщей декларации прав человека :

арабский текст

[ редактировать ]

Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать по отношению друг к другу в духе братства. [ 5 ]

Транслитерация Баквальтера

[ редактировать ]

yuwladu jamey {ln~aAsi >aHoraArFA mutasaAwiyna fiy {lokaraAmapi wa{loHuquwqi. Ясное откровение EaqolFA из DamiyrFA из Ealayohimo >ano yuEaAmila baEoDuhumo baEoDFA biruwHi {lo<ixaA'i.

Юладу Хамиу н-Наси Шахраран мутасавина фи л-карамати ва-ль-Хукук. Это откровение разума божественного и божественного.

английский текст

[ редактировать ]

Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать по отношению друг к другу в духе братства. [ 6 ]

Примечания

[ редактировать ]
  1. ^ (см. первую страницу одной из первых презентаций, сделанных доктором Бисли в 1989 году в Университете Юты, в сносках перечислены участники по порядку до этого момента) . [1]
  2. ^ Jump up to: а б Полное описание различных схем Баквальтера, а также более подробное обсуждение компромиссов между различными схемами см. в Habash, Nizar. Введение в обработку арабского естественного языка . Морган и Клейпул, 2010.
  3. ^ Баквальтер, Тим. Таблица арабской транслитерации Баквальтера .
  4. ^ В Египте, Судане и иногда в других регионах окончательная форма иногда бывает ی (без точек).
  5. ^ «Всеобщая декларация прав человека – арабский язык » ohchr.org . УВКПЧ. 2016 . Получено 22 , октября
  6. ^ «Всеобщая декларация прав человека – английский» . ohchr.org . УВКПЧ. 2016 . Проверено 22 октября 2016 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 238f6be85dea7f1b5d10a0aebc39ae14__1705941960
URL1:https://arc.ask3.ru/arc/aa/23/14/238f6be85dea7f1b5d10a0aebc39ae14.html
Заголовок, (Title) документа по адресу, URL1:
Buckwalter transliteration - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)