Jump to content

Арабские диакритические знаки

(Перенаправлено из Касры )
В раннем письменном арабском языке использовался только расм (черный шрифт). Позже были добавлены иджам (красного цвета), чтобы такие буквы, как сад ( ص ) и ад ( ض можно было различать ). Харакат (синий цвет) — который используется в Коране, но не в большинстве письменных арабских языков — обозначает короткие гласные, длинные согласные и некоторые другие вокализации.

В арабском письме есть многочисленные диакритические знаки , в том числе указывающие на согласные, известные как и иджам , дополнительные диакритические знаки ташкил , известные как . К последним относятся знаки гласных, называемые харакат ( харакат ; ср. харакат , харака ).

Арабское письмо представляет собой модифицированный абджад , в котором короткие согласные и долгие гласные представлены буквами, а короткие гласные и длина согласного обычно не указываются в письменной форме. Ташкил не является обязательным для обозначения отсутствующих гласных и длины согласного. В современном арабском языке всегда используется иджам — указание на согласную, но только религиозные тексты, детские книги и произведения для учащихся пишутся с полным ташкилом — указателем гласных и длиной согласной. Однако авторы нередко добавляют диакритические знаки к слову или букве, когда грамматический падеж или значение в противном случае считаются неоднозначными. Кроме того, классические произведения и исторические документы, представляемые широкой публике, часто передаются с полным ташкилом , чтобы компенсировать пробел в понимании, возникший в результате стилистических изменений на протяжении веков.

Организация

[ редактировать ]

Буквальное значение слова تَشْكِيل ташкил — «вариация». Поскольку обычный арабский текст не предоставляет достаточно информации о правильном произношении, основная цель ташкила хараката ) — предоставить фонетическое руководство или фонетическую помощь; т.е. показывать правильное произношение детям, которые учатся читать, или изучающим иностранные языки.

Большая часть арабского письма написана без хараката (или кратких гласных). Однако они обычно используются в текстах, требующих строгого соблюдения точного произношения. Это справедливо, прежде всего, в отношении Корана ٱلْقُرْآن ( аль-Коран ) и поэзии . Также довольно распространено добавление хараката к хадисам ٱلْحَدِيث ( аль-хадис ; множественное число: аль-хадис ) и Библии . Другое применение - в детской литературе. Более того, харакат используется в обычных текстах отдельными словами, когда двусмысленность произношения не может быть легко разрешена только на основе контекста. Словари арабского языка со знаками гласных предоставляют информацию о правильном произношении как носителям арабского языка, так и иностранцам. В искусстве и харакат каллиграфии можно использовать просто потому, что его написание считается эстетически приятным.

Пример полностью огласованного ( огласованного или огласованного ) арабского языка из Бисмиллы :

Во имя Бога Милостивого, Милосердного
бисм Аллах ар-Рахман ар-Рахим
Во имя Бога Всемилостивого, Особенномилостивого.

В некоторых учебниках арабского языка для иностранцев харакат теперь используется в качестве фонетического руководства, чтобы облегчить изучение арабского языка. Другой метод, используемый в учебниках, - это фонетическая латинизация неозвученных текстов. Полностью озвученные арабские тексты (т.е. арабские тексты с харакатом /диакритическими знаками) востребованы изучающими арабский язык. Некоторые двуязычные онлайн-словари также предоставляют харакат в качестве фонетического руководства, аналогично английским словарям, обеспечивающим транскрипцию.

Харакат (краткие гласные знаки)

[ редактировать ]

Харакат حَرَكَات , что буквально означает « движения », представляет собой краткие гласные знаки. Существует некоторая неясность относительно того, какие ташкилы также являются харакатом ; Танвин . , например, являются маркерами как гласных, так и согласных

ـَ

Фатха — это فَتْحَة небольшая диагональная линия, расположенная над буквой и обозначающая короткий звук /a/ (как звук /a/ в английском слове «кошка»). Само слово фатха ( فَتْحَة ) означает «открытие» и относится к открытию рта при произнесении звука /а/ . Например, с dāl (далее – основная согласная в следующих примерах): دَ /da/ .

Когда фетха ставится перед простой буквой ا ( алиф ) (т. е. буквой, не имеющей собственной хамзы или гласной), она представляет собой длинный /aː/ (близкий к звуку «а» в английском слове «папа»). ", с открытой гласной переднего ряда /æː/, а не задней /ɑː/, как в "отец"). Например: دَا /daː/ . В таких случаях фетха обычно не пишется. Когда фатх ставится перед буквой ⟨ ⟩ (йа'), образуется /aj/ (как в «l ie »); а если поставить перед буквой ⟨ و ⟩ (wāw), то образуется /aw/ (как в «cow » ).

Хотя в сочетании с простой буквой образуется открытая гласная переднего ряда (/a/), часто реализуемая как почти открытая (/ æ /), стандарт также допускает вариации, особенно в определенных окружающих условиях. Обычно, чтобы иметь более центральное (/ ä /) или заднее (/ ɑ /) произношение, в слове присутствует ближайший задний согласный, такой как эмфатические знаки, а также qāf или rā' . Аналогичному «заднему» качеству подвергаются и другие гласные в присутствии таких согласных, однако это не так резко проявляется, как в случае с фатхой . [1] [2] [3]

ـِ

Подобная диагональная линия под буквой называется касра كَسْرَة и обозначает короткий /i/ (как в «мне», «быть») и его аллофоны [i, ɪ, e, e̞, ɛ] (как в « Тим», «сидеть»). Например: دِ /ди/ . [4]

Когда касра ставится перед простой буквой ( yā' ), она представляет собой длинный /iː/ (как в английском слове «конь»). Например: دِي /diː/ . Касра то в таких случаях обычно не пишется, но если йа произносится как дифтонг /адж/ , фатха следует писать на предшествующей согласной, чтобы избежать неправильного произношения. Слово Касра означает «ломка». [1]

ـُ

Камма ( ضَمَّة — небольшой диакритический знак в виде завитка, помещенный над буквой для обозначения короткого / u / (как в «герцог», более короткого «вы») и его аллофонов [u, ʊ, o, o̞, ɔ] как в «путе» или «быке»). Например: دُ /du/ . [4]

Когда хамма ставится перед простой буквой و ( вав ), она представляет собой длинный звук /uː/ (как звук «оо» в английском слове «swoop»). Например: دُو /duː/ . В таких случаях дамма то обычно не пишется, но если wāw произносится как дифтонг /aw/ , фатха следует писать на предшествующей согласной, чтобы избежать неправильного произношения. [1]

Слово Хамма (ضَمَّة) в данном контексте означает округление , поскольку это единственная округленная гласная в списке гласных арабского языка.

Алиф Ханджария

[ редактировать ]
ــٰ

Надстрочный индекс (или кинжал) алиф Алиф Ханджария ( алиф ханджария ) пишется как короткая вертикальная черта поверх согласной. Он указывает на длинный звук /aː/, для которого алиф обычно не пишется. Например: Этот ( хадха ) или Милосердный ( рахман ).

Кинжал алиф встречается всего в нескольких словах, но среди них есть и распространенные; однако его редко пишут, даже в полностью озвученных текстах. Большинство клавиатур не имеют Dagger Alif . Слово «Аллах» الله ( Аллах ) обычно создается автоматически при вводе «alif lām lām hāʾ» . Слово состоит из алиф + лигатуры двойного лам с шаддой и кинжалом алиф над лам , за которым следует ха' .

ـٓ
ну давай же

Мадда / مَدَّة — это диакритический знак в форме тильды , который может появляться только поверх алифа ( آ) и указывает на гортанную точку ʔ/, за которой следует длинный /aː/ .

Теоретически, одна и та же последовательность /ʔaː/ также может быть представлена ​​двумя алифами , как в * أَا , где хамза над первым алифом представляет /ʔ/, а второй алиф представляет /aː/ . Однако последовательные алифы никогда не используются в арабской орфографии. Вместо этого эта последовательность всегда должна быть записана как один алиф с маддой над ним, комбинация, известная как алиф мадда . Например: قُرْآن /qurˈʔaːn/ .

Алиф волнуется

[ редактировать ]
ٱ

Ваалл وَصْلَة , алиф ваалл أَلِف وَصْلَة или хамзат вауль هَمْزَة وَصْل выглядит как маленькая буква ṣād поверх алифа ٱ (также обозначается алифом ا без хамзы ) . Это означает, что алиф не произносится, если его слово не начинает предложение. Например: بِٱسْمِ ( бисми ), но ٱمْشُوا۟ ( имшу, а не мшу ). Это связано с тем, что ни одно арабское слово не может начинаться с согласной без гласной: если вторая буква слова «васла» имеет касару, то «алиф-васлах» дает звук /i/. Однако когда во второй букве есть дамма, получается звук /у/.

Встречается только в начале слов, но может встречаться и после предлогов и определенного артикля. Обычно он встречается в повелительных глаголах, в глагольных основах с VII по X и в их отглагольных существительных ( maṣdar ). Алиф . определенного артикля васлахом считается

Встречается во словосочетаниях и предложениях (связная речь, а не изолированные/словарные формы):

  • Заменить исключенную хамзу, место алифа которой было ассимилировано с предыдущей гласной. Например: فِي ٱلْيَمَن или في اليمن ( фи л-Яман ) «в Йемене».
  • В хамзе начальные формы повелительного наклонения следуют за гласной, особенно после союза و ( ва- ) 'и'. Например: َ قُمْ وَٱشْرَبِ ٱلْمَاءَ ( кум ва-шраб-и л-ма' ) 'встань и выпей воды'.

Как и надстрочный индекс алиф, он не пишется полностью озвученными буквами, за исключением священных текстов, таких как Коран и арабизированная Библия.

Водить машину

[ редактировать ]
ـْـ

Сукун — диакритический знак в форме круга , سُكُونْ помещенный над буквой ( ْ ). Это указывает на то, что за согласной, к которой она присоединяется, не следует гласная, т. е. нулевая гласная.

Это необходимый символ для написания согласных-гласных-согласных слогов, которые очень распространены в арабском языке. Например: دَدْ ( папа ).

Сукун также может использоваться для обозначения дифтонга. Фатха , за которой следует буква ( йа ' ) с сукуном над ней ( ـَيْ ), указывает на дифтонг ай ( IPA /aj/ ). Фетха ( , за которой следует буква ( вав ) с сукуном , ـَوْ ) указывает на /aw/ .

ـۡـ

Сукун также может иметь альтернативную форму маленькой высокой головы хаха ( U+06E1 ۡ МАЛЕНЬКАЯ АРАБСКАЯ ВЫСОКАЯ ГОЛОВКА ХАХ БЕЗ ТОЧЕК ), особенно в некоторых Коранах. Могут существовать и другие формы (например, маленькая запятая над ⟨ʼ⟩ или циркумфлекс ⟨ˆ⟩ в насталик ). [5]

ـٌ
ـٍ
ـً

Три диакритических знака гласных могут быть удвоены в конце слова, чтобы указать, что за гласной следует согласная n . Они могут считаться или не считаться харакатами и известны как танвин تَنْوِين , или нунация. Знаки обозначают слева направо -un, -in, -an .

Эти окончания используются как непаузальные грамматические окончания неопределенного падежа в литературном арабском языке или классическом арабском языке ( только триптоты ). В озвученном тексте они могут быть написаны, даже если они не произносятся (см. пауза ). См . Ираб для более подробной информации. Во многих разговорных арабских диалектах окончания отсутствуют. Во многих учебниках арабского языка стандартный арабский язык представлен без этих окончаний. Грамматические окончания могут не записываться в некоторых озвученных арабских текстах, поскольку знание ираба варьируется от страны к стране, и существует тенденция к упрощению арабской грамматики.

Знак ـً чаще всего пишется в сочетании с ـًا ( алиф ), ةً ( та' марбута ), أً (алиф хамза) или отдельно стоящим ءً ( хамза ). Алиф всегда следует писать (за исключением слов, оканчивающихся на та'марбута, хамза или диптот), даже если ан нет. Грамматические падежи и окончания танвин в неопределенных триптотных формах:

ـّـ

Шадда или шадда شَدَّة ( шадда ), или ташдид تَشْدِيد . ( ташдид ), представляет собой диакритический знак, имеющий форму маленькой письменной латинской буквы « w »

Он используется для обозначения геминации (удвоения согласных или дополнительной длины), что в арабском языке является фонематическим. Оно пишется над согласной, которую нужно удвоить. Это единственная хараката , которая обычно используется в обычном написании во избежание двусмысленности . Например: دّ /dd/ ; медресе مَدْرَسَة («школа») против мударриса مُدَرِّسَة («учитель», женщина).

письмо VII века Куфическое без каких-либо хараката или иджама .

Иджам называемый ( иджам ; иногда также нукат ) [6] — это диакритические точки, которые различают различные согласные, имеющие одинаковую форму ( rasm ), например ص /sˤ/ , ض /dˤ/ . Обычно иджам считаются не диакритическими знаками, а частью буквы.

Ранние рукописи Корана не использовали диакритические знаки ни для гласных, ни для различения различных значений расма . Сначала было введено указание на гласные в виде красной точки, расположенной над, под или рядом с развилкой , а позже было введено указание на согласные в виде тонких, коротких черных одиночных или нескольких черточек, помещенных над или под развилкой . Эти иджамы стали черными точками примерно в то же время, когда харакат превратился в маленькие черные буквы или штрихи.

Как правило, египтяне не используют точки после конечной буквы йа ( ي ), которая выглядит точно так же, как алиф максура ( ى в рукописном и печатном виде ). Эта практика также используется в копиях мусхафа ( Корана ) , написанных Усманом Таха . Такое же объединение слов йа и алиф максура произошло в персидском языке , что привело к тому, что стандарт Unicode называет « Арабская буква фарси йе », которая выглядит точно так же, как йа в начальной и средней формах, но точно так же, как алиф максура в конечной и изолированной формах.

Изолированный каф с аламату-ль-ихмалом и без верхнего штриха рядом с начальным кафом с верхним штрихом.
سۜ سۜ سۣ سٚ ڛ

В то время, когда иджам был необязательным, буквы без точек были двусмысленными. Чтобы уточнить, что буква не будет иджам в выделенном тексте, буква может быть отмечена небольшим диакритическим знаком в форме буквы V или чайки выше, а также надстрочным полукругом (полумесяцем), подстрочной точкой (за исключением случая ح ; три точки использовались с س ) или миниатюрным индексом самой буквы. Надстрочная черта, известная как джарра , напоминающая длинную фатху , использовалась для обозначения сокращенного (ассимилированного) греха . Таким образом, все ⟨ ڛ سۣ سۡ سٚ использовались для обозначения того, что рассматриваемая буква действительно была س , а не ش . [7] Эти знаки, известные под общим названием «аламату-ль-ихмал» , до сих пор иногда используются в современной арабской каллиграфии либо по своей первоначальной цели (т. е. для обозначения букв без иджама ), либо часто как чисто декоративные заполнители пространства. Маленький ک над кафом в его окончательных и изолированных формах ك ـك изначально был «аламату-ль-ихмалом» , который стал постоянной частью буквы. Раньше этот знак мог также появляться над средней формой каф , когда эта буква писалась без черточки на ее восходящей стрелке . Когда каф писался без этой черты, его можно было принять за лам , поэтому каф отличался надстрочным индексом каф или маленьким надстрочным индексом хамза ( набра ), а лам — надстрочным индексом лам ( лам-алиф-мим ). [8]

Аааааааааааааааааааааа

Хотя обычно хамза иногда не считается буквой алфавита, хамза هَمْزة ( хамза , гортанная остановка ) на письме часто выступает как отдельная буква, пишется в текстах без точек и не считается ташкилом . Оно может выглядеть как отдельная буква или как диакритический знак над или под алифом , вау или йа .

Какая буква будет использоваться для поддержки хамзы, зависит от качества соседних гласных;

  • Если гортанная остановка находится в начале слова, она всегда обозначается хамзой на алифе : вверху, если следующая гласная — /a/ или /u/, и внизу, если это /i/ .
  • Если гортанная остановка находится в середине слова, хамза над алифом используется только в том случае, если ей не предшествует и не следует /i/ или /u/ :
    • Если /i/ находится до или после гортанной остановки, yāʼ с хамзой используется (в этом случае две точки, которые обычно находятся под yāʾ, исчезают): ئ .
    • В противном случае, если /u/ стоит до или после гортанной смычки, вав с хамзой используется : ⟨ ؤ .
  • Если голосовая остановка находится в конце слова (игнорируя любые грамматические суффиксы), если она следует за короткой гласной, она пишется над alif , wāw или yā, так же, как и для среднего падежа; в противном случае — в строке (т. е. если она следует за долгой гласной, дифтонгом или согласной).
  • Два алифа подряд никогда не допускаются: /ʔaː/ записывается с помощью алиф мадда آ и /aːʔ/ записывается со свободной хамзой на строке اء .

Рассмотрим следующие слова: أَخ /ʔax/ («брат»), إسْماعِيل /ʔismaːʕiːl/ («Исмаил»), أُمّ /ʔumm/ («мать»). Все три приведенных выше слова «начинаются» с гласной, открывающей слог, и в каждом случае алиф используется для обозначения начальной голосовой остановки ( фактического начала). Но если мы рассмотрим средние слоги, «начинающиеся» с гласной: نَشْأة /naʃʔa/ («происхождение»), أَفْئِدة /ʔafʔida/ («сердечки» — обратите внимание на слог /ʔi/ ; единственное число فُؤاد /фуаад/ ), رُؤُوس /ruʔuːs/ («головы», единственное число رَأْس /raʔs/ ), ситуация иная, как отмечалось выше. можно найти в подробной статье о Хамзе Более подробную информацию .

Диакритические знаки не используются в современном стандартном арабском языке.

[ редактировать ]

Диакритические знаки, не используемые в современном стандартном арабском языке, но в других языках, использующих арабское письмо, а иногда и для написания арабских диалектов, включают (список не является исчерпывающим):

Описание Юникод Пример Язык(и) Примечания
Бары и линии
диагональная полоса выше Г Арабский (Ирак), Бельцы , Бурушаски ,
Кашмирский , казахский ,
Ховар , курдский ,
киргизский , персидский ,
Синдхи , урду ,
уйгурский
  • Диагональная полоса над кафом для создания гафа : g (IPA g )
  • При написании арабского языка часто используется в Ираке для обозначения звука / ɡ / . Часто используется в Ираке для обозначения звука /g/ при написании иностранных слов арабским шрифтом, а в Марокко встречается вариант ^. [9]
горизонтальная полоса выше пушту
вертикальная линия выше ты уйгурский
  • буква ئۈ (IPA / y / ) содержит вертикальную черту над вав
Точки
2 точки (вертикальные) ݭ ۭ ݙ ڙ
4 точки ڐ ‎ ڐ ڐ د Синдхи, старый хиндустани
точка ниже U + 065C ٜ ЗНАК АРАБСКОЙ ГЛАСНОЙ ТОЧКИ НИЖЕ ٜ бٜ африканские языки [10]
  • также используется в тексте Корана в африканской и других орфографиях. [10]
Варианты стандартных арабских диакритических знаков
волнистый хамза ٲ аа Кашмири
  • Кашмирский язык, написанный арабским шрифтом, включает диакритический знак или «волнистую хамзу».
  • В Кашмире диакритический знак называется āmālü mad , когда он используется над алифом: ٲ для образования гласной / əː / . [11]
  • Кашмирцы называют волнистую хамзу саш, когда она находится ниже алифа: اٟ, чтобы создать звук / ɨː / . [12]
фигурная касра выше ◌ࣥ Рохинджа
  • Латинское «оу»
Рохинджа
  • Латинское «онь»
двойная Касра выше ◌ࣱ Рохинджа
  • Латинское «ун»
перевернутая и правильная фигурная касра выше ◌ࣨ Рохинджа
  • Латинское «оу»
Тильды
диагональная форма тильды выше ◌ࣤ Рохинджа
  • Латинское «о»
диагональная тильда внизу ◌ࣦ Рохинджа
  • Латинское «е»
арабские буквы
миниатюрная арабская буква ха (начальная форма) ﺣ выше ◌ۡ Рохинджа
  • Слово (нулевая гласная)
миниатюрная арабская буква тах ط выше ڲ урду
Восточные арабские цифры [13]
Восточно-арабская цифра 2: ٢ выше U+0775 , U+0778 , U+077A ݵ۵  ݸ۸  ݺۺ Бурушаски
  • Присутствует в письмах Бурушаски. ^ ‎ и ݺۺ
Восточно-арабская цифра 3: ٣ выше U+0776 , U+0779 , U+077B ݶڶ  ݹ۹  ݻۻ Бурушаски
  • Присутствует в письмах Бурушаски. ڶ ‎, и ݻۻ
Число 4 на урду: ۴ выше или ниже. U+0777 , U+077C , U+077D ݷڷ  ݼۼ  ݽڽ Бурушаски
  • Присутствует в письмах Бурушаски. ^ ‎ и ݽڽ
Формы, похожие на латинские буквы
Нун Джунна , форма буквы «u» выше Н урду
  • Назализация гласных представлена ​​с помощью nun ghunn , которая записывается как nun с диакритическим знаком maghnoona также называемым ulta jazm , Unicode U+0658) выше: ن٘ (
буква «v» выше ۆ ویٛ азербайджанский
  • используется только поверх vav: ۆ эквивалентно латинице ü , кириллице ү , IPA / / y / /
перевернутая буква "v" выше О  азербайджанский , уйгурский
  • в азербайджанском языке используется только поверх ye: یٛ эквивалентно латинице ı , кириллице ы , IPA / / ɯ / /
  • в уйгурском языке буква ئۆ (IPA / ø / ) содержит букву v над вав.
пунктирная фатха ◌ࣵ Волоф Латынь для
круг с фатхой ◌ࣴ‎ Волоф латинский
знак меньше - ниже ◌ࣹ‎ Волоф Может
знак больше - ниже ◌ࣺ‎ Волоф латынь это
знак меньше - выше ◌ࣷ‎ Волоф латынь о
знак больше - выше ◌ࣸ‎ Волоф Латынь от
кольцо г пушту
  • каф с кольцом (ګ) используется для IPA / ɡ /
Другие формы
фигура «рыба» выше ࣤ࣬ ࣥ࣬ ࣦ࣯ Рохинджа Тана , например دࣤ࣬ / دࣥ࣬ / دࣦ࣯ ‎ пишется над или под другими диакритическими знаками, чтобы отметить долгий восходящий тон ( / ˨˦ / ). [14] [15]
Различный урду
  • Специальные диакритические знаки, обычно встречающиеся только в словарях для разъяснения неправильного произношения, включают kasrah-e-majhool , Fathah-e-majhool , dammah-e-majhool и alif-e-wavi . [16]

Маркеры тона рохинджа

[ редактировать ]

Исторически арабское письмо было принято и использовалось во многих тональных языках, примеры включают Сяоэрцзин для китайского языка , а также сценарий Аджами , принятый для письма на различных языках Западной Африки. Однако арабское письмо никогда не имело собственного способа передачи тонов, пока оно не было адаптировано для языка рохинджа . Фонна рохинджа — это три тональных маркера, которые являются частью стандартизированной и принятой орфографической конвенции рохинджа. Это единственный известный экземпляр тональных маркеров в арабском письме . [14] [15]

Маркеры тона действуют как «модификаторы» диакритических знаков гласных. Проще говоря, это «диакритика для диакритики». Они пишутся «вне» слова, что означает, что они пишутся над диакритическим знаком гласной, если диакритический знак написан над словом, и они пишутся под диакритическим знаком, если диакритический знак написан под словом. Они пишутся только там, где есть диакритические знаки гласных. Это важно отметить, поскольку без присутствия диакритического знака невозможно отличить маркеры тона от иджама , то есть точек, которые используются для фонетического различения согласных.

Харбай

◌࣪ / ◌࣭

Харбай ( диакритические , как его называют в рохинджа, представляет собой одну точку, которая ставится поверх слов Фатха и Хамма , или фигурная Фатха и курчавая Хамма знаки гласных, уникальные для рохинхья), или их соответствующие версии Фатхатан и Хамматан , и она помещается под Касра или фигурная Касра или их соответствующая Касратанская версия. (например دَ࣪ / دِ࣪ / دࣨ࣪ / دِ࣭ ‎) Этот маркер тона обозначает короткий высокий тон ( /˥/ ). [14] [15]

Тела

◌࣫ / ◌࣮

Тела , как ее называют в рохинджа, представляет собой две точки, которые помещаются поверх Фатхи и Хаммы , или фигурной Фатхи и курчавой Хаммы , или их соответствующих версий Фатхатан и Хамматан , и помещаются под Касра или курчавую Касра , или их соответствующий Касратан. версия. (например دَ࣫ / دُ࣫ / دِ࣮ ‎) Этот маркер тона указывает на длинный нисходящий тон ( /˥˩/ ). [14] [15]

Тана

◌࣬ / ◌࣯

Тана , как ее называют в рохинджа, представляет собой рыбоподобную петлеобразную линию, которая помещается поверх Фатхи и Хаммы , или вьющейся Фатхи и вьющейся Хаммы , или их соответствующих версий Фатхатана и Хамматана , и помещается под Касрой или курчавой Касрой . или их соответствующую версию Касратана . (например دࣤ࣬ / دࣥ࣬ / دࣦ࣯ ‎) Этот маркер тона указывает на длинный восходящий тон ( /˨˦/ ). [14] [15]

Эволюция ранней арабской каллиграфии (9–11 века). из басмала В качестве примера была взята рукописей куфического Корана .
(1) Начало 9 века, письмо без точек и диакритических знаков (см. изображение раннего басмальского куфического текста );
(2) и (3) 9–10 века при династии Аббасидов, система Абу аль-Асвада установила красные точки, каждое расположение или позиция обозначают разные короткие гласные; позже была использована вторая система черных точек, чтобы различать такие буквы, как фа и каф ;
(4) 11 век, в системе аль-Фарахиди (системе, которую мы знаем сегодня) точки были преобразованы в формы, напоминающие буквы, для транскрипции соответствующих долгих гласных.

Согласно традиции, первым, кто ввел систему хараката , был Али , который назначил Абу аль-Асвада ад-Дуали для этой задачи . Абу аль-Асвад разработал систему точек для обозначения трех коротких гласных (вместе с соответствующими аллофонами) арабского языка. Эта система точек предшествовала иджаму , точкам, используемым для различения разных согласных.

Система Абу аль-Асвада

[ редактировать ]

Система Хараката Абу аль-Асвада отличалась от системы, которую мы знаем сегодня. В системе использовались красные точки, где каждое расположение или позиция обозначали разные короткие гласные.

Точка над буквой обозначала гласную а , точка внизу обозначала гласную i , точка сбоку от буквы обозначала гласную u , а две точки обозначали танвин .

Однако в ранних рукописях Корана знаки гласных использовались не для каждой буквы, требующей их использования, а только для тех букв, где они были необходимы для правильного чтения.

Система Аль Фарахиди

[ редактировать ]

Предшественником системы, которую мы знаем сегодня, является система Аль Фарахиди. аль-Фарахиди обнаружил, что задача письма двумя разными цветами была утомительной и непрактичной. Еще одна сложность заключалась в том, что к тому времени был введен иджам , который, хотя и представлял собой короткие штрихи, а не круглые точки, наблюдаемые сегодня, означал, что без различия цвета их можно было спутать.

Соответственно, он заменил харакат маленькими надстрочными буквами: малый алиф, йа и вав для коротких гласных, соответствующих долгим гласным, написанным этими буквами, маленький с(х)ин для шадда (близнецов), маленький ха' для хафифа (короткий согласный; больше не используется). Его система, по сути, та, которую мы знаем сегодня. [17]

Автоматическая диакритизация

[ редактировать ]

Процесс автоматического восстановления диакритических знаков называется диакритизацией или диакритическим восстановлением. Полезно избегать двусмысленности в таких приложениях, как машинный перевод на арабский язык , преобразование текста в речь и поиск информации . Разработаны алгоритмы автоматической диакритизации. [18] [19] Для современного стандартного арабского языка современный алгоритм имеет коэффициент ошибок в словах (WER) 4,79%. Наиболее распространенными ошибками являются имена собственные и падежные окончания . [20] Подобные алгоритмы существуют и для других разновидностей арабского языка . [21]

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с Карин К. Райдинг, «Справочная грамматика современного стандартного арабского языка», Cambridge University Press, 2005, стр. 25–34, а именно «Глава 2, Раздел 4: Гласные»
  2. ^ Анатоль Лёвин, Бретт Кесслер, Уильям Рональд Лебен, «Введение в языки мира», «5.6 Очерк современного стандартного арабского языка», Oxford University Press, 2017, стр. 255, издание 2, а именно «5.6.2.2 Гласные».
  3. ^ Амин Бушентуф, Арабский язык для чайников®, John Wiley & Sons, 2018, 3-е издание, особенно раздел «Все о гласных»
  4. ^ Перейти обратно: а б «Введение в письменный арабский язык» . Университет Виктории, Канада .
  5. ^ «Заметки арабских символов» . р12а .
  6. ^ Ибн Варрак (2002). Ибн Варрак (ред.). Что на самом деле говорит Коран: язык, текст и комментарии . Перевод Ибн Варрака. Нью-Йорк: Прометей. п. 64. ИСБН  1-57392-945-Х . Архивировано из оригинала 11 апреля 2019 года . Проверено 9 апреля 2019 г.
  7. ^ Гацек, Адам (2009). «Неострые буквы» . Арабские рукописи: Путеводитель для читателей . БРИЛЛ. п. 286. ИСБН  978-90-04-17036-0 .
  8. ^ Гацек, Адам (1989). «Технические практики и рекомендации, записанные классическими и постклассическими арабскими учеными относительно копирования и исправления рукописей» (PDF) . В Дероше, Франсуа (ред.). Рукописи с Ближнего Востока: очерки по кодикологии и палеографии. Материалы Стамбульской конференции (Стамбул, 26–29 мая 1986 г.) . п. 57 (§ 8. Диакритические знаки и огласовки).
  9. ^ Алкалеси, Ясин М. (2001) «Современный иракский арабский язык: учебник». Издательство Джорджтаунского университета. ISBN   978-0878407880
  10. ^ Перейти обратно: а б «Арабский диапазон: 0600–06FF. Стандарт Unicode, версия 15.1» (PDF) . Юникод . Проверено 10 июля 2024 г.
  11. ^ «Гласная 04: ٲ/ä – (aae)» . Кашмирский словарь . 31 января 2021 г. Проверено 11 июля 2024 г.
  12. ^ «Гласная07: اٟ / ü (ι)» . Кашмирский словарь . 6 февраля 2021 г. Проверено 11 июля 2024 г.
  13. ^ Мирза, Умайр (2006). Словарь Брушского на урду [ Словарь Бурушаски-урду ] (на урду и бурушаски). стр. 28–29. ISBN  969-404-66-0 . Проверено 13 июля 2024 г. {{cite book}}: CS1 maint: игнорируются ошибки ISBN ( ссылка )
  14. ^ Перейти обратно: а б с д и Священник Лорна А.; Хоскен, Мартин (10 августа 2010 г.). «Предложение о добавлении символов арабского письма для африканских и азиатских языков» (PDF) . Консорциум Юникод . Архивировано (PDF) из оригинала 8 октября 2022 года . Проверено 5 мая 2023 г.
  15. ^ Перейти обратно: а б с д и Панди, Аншуман (27 октября 2015 г.). «Предложение закодировать сценарий ханифи рохинджа в Юникод» (PDF) . Консорциум Юникод . Архивировано (PDF) из оригинала 12 декабря 2019 года . Проверено 5 мая 2023 г.
  16. ^ «Предложение о включении определенных символов в Юникод» (PDF) .
  17. ^ Верстег, CHM (1997). Арабский язык . Издательство Колумбийского университета. стр. 56 и далее. ISBN  978-0-231-11152-2 .
  18. ^ Азми, Акил М.; Альмаджед, Рехам С. (10 октября 2013 г.). «Обзор автоматических техник арабской диакритизации» . Инженерия естественного языка . 21 (3): 477–495. дои : 10.1017/S1351324913000284 . ISSN   1351-3249 . S2CID   31560671 .
  19. ^ Алманеа, Манар (2021). «Автоматические методы и нейронные сети в диакритизации арабских текстов: комплексное исследование» . Доступ IEEE . 9 : 145012–145032. Бибкод : 2021IEEA...9n5012A . дои : 10.1109/ACCESS.2021.3122977 . ISSN   2169-3536 . S2CID   240011970 .
  20. ^ Томпсон, Брайан; Альшехри, Али (28 сентября 2021 г.). «Улучшение диакритизации арабского языка путем обучения диакритизации и переводу». arXiv : 2109.14150 [ cs.CL ].
  21. ^ Масмуди, Абир; Алулу, Чафик; Абделлахи, Абдель Гадер Сиди; Белгит, Ламия Хадрич (8 августа 2021 г.). «Автоматическая диакритизация текста тунисского диалекта с использованием модели SMT » Международный журнал речевых технологий . 25 : 89–104. дои : 10.1007/ s10772-021-09864-6 ISSN   1572-8110 . S2CID   238782966 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3e8157bbbd371b9126baa490a8fc3742__1721319180
URL1:https://arc.ask3.ru/arc/aa/3e/42/3e8157bbbd371b9126baa490a8fc3742.html
Заголовок, (Title) документа по адресу, URL1:
Arabic diacritics - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)