Арабские диакритические знаки
Эту статью необходимо отредактировать, чтобы Википедии она соответствовала Руководству по стилю . ( июнь 2024 г. ) |
арабский алфавит |
---|
арабская письменность |
В арабском письме имеется множество диакритических знаков , в том числе указывающие на согласные, известные как иджам ( إِعْجَام ), и дополнительные диакритические знаки, известные как ташкил ( تَشْكِيل ). К последним относятся знаки гласных, называемые харакат ( حَرَكَات ; сг. حَرَكَة , харака ).
Арабское письмо представляет собой модифицированный абджад , в котором короткие согласные и долгие гласные представлены буквами, а короткие гласные и длина согласного обычно не указываются в письменной форме. Ташкил не является обязательным для обозначения отсутствующих гласных и длины согласного. В современном арабском языке всегда используется иджам — указание на согласную, но только религиозные тексты, детские книги и произведения для учащихся пишутся с полным ташкилом — указателем гласных и длиной согласной. Однако авторы нередко добавляют диакритические знаки к слову или букве, когда грамматический падеж или значение в противном случае считаются неоднозначными. Кроме того, классические произведения и исторические документы, представляемые широкой публике, часто передаются с полным ташкилом , чтобы компенсировать пробел в понимании, возникший в результате стилистических изменений на протяжении веков.
Ташкил
[ редактировать ]Буквальное значение слова تَشْكِيل ташкил — «вариация». Поскольку обычный арабский текст не дает достаточно информации о правильном произношении, основная цель ташкила (и хараката ) — предоставить фонетическое руководство или фонетическую помощь; т.е. показывать правильное произношение детям, которые учатся читать, или изучающим иностранные языки.
Большая часть арабского письма написана без хараката (или кратких гласных). Однако они обычно используются в текстах, требующих строгого соблюдения точного произношения. Это справедливо, прежде всего, в отношении Корана ⟨ ٱلْقُرْآن ⟩ ( аль-Коран ) и поэзии . Также довольно распространено добавление хараката к хадисам ⟨ ٱلْحَدِيث ⟩ ( аль-хадис ; множественное число: аль-хадис ) и Библии . Другое применение - в детской литературе. Более того, харакат используется в обычных текстах отдельными словами, когда двусмысленность произношения не может быть легко разрешена только на основе контекста. Словари арабского языка со знаками гласных предоставляют информацию о правильном произношении как носителям арабского языка, так и иностранцам. В искусстве и харакат каллиграфии можно использовать просто потому, что их написание считается эстетически приятным.
Пример полностью огласованного ( огласованного или огласованного ) арабского языка из Бисмиллы :
Во имя Бога Милостивого, Милосердного
бисм Аллах ар-Рахман ар-Рахим
Во имя Бога Всемилостивого, Особенномилостивого.
В некоторых учебниках арабского языка для иностранцев харакат теперь используется в качестве фонетического руководства, чтобы облегчить изучение арабского языка. Другой метод, используемый в учебниках, - это фонетическая латинизация неозвученных текстов. Полностью озвученные арабские тексты (т.е. арабские тексты с харакатом /диакритическими знаками) востребованы изучающими арабский язык. Некоторые двуязычные онлайн-словари также предоставляют харакат в качестве фонетического руководства, аналогично английским словарям, обеспечивающим транскрипцию.
Харакат (краткие гласные знаки)
[ редактировать ]Харакат حَرَكَات , что буквально означает « движения », представляет собой краткие гласные знаки. Существует некоторая неясность относительно того, какие ташкилы также являются харакатом ; Танвин . , например, являются маркерами как гласных, так и согласных
Фатх
[ редактировать ]Фатха — это ⟨ فَتْحَة ⟩ небольшая диагональная линия, расположенная над буквой и обозначающая короткий звук /a/ (как звук /a/ в английском слове «кошка»). Само слово фатха ( فَتْحَة ) означает «открытие» и относится к открытию рта при произнесении звука /а/ . Например, с dāl (далее – основная согласная в следующих примерах): ⟨ دَ ⟩ /da/ .
Когда фетха ставится перед простой буквой ⟨ ا ⟩ ( алиф ) (т. е. буквой, не имеющей собственной хамзы или гласной), она представляет собой длинный /aː/ (близкий к звуку «а» в английском слове «папа»). ", с открытой гласной переднего ряда /æː/, а не задней /ɑː/, как в "отец"). Например: ⟨ دَا ⟩ /daː/ . В таких случаях фетха обычно не пишется. Когда фатх ставится перед буквой ⟨ ﻱ ⟩ (йа'), образуется /aj/ (как в «l ie »); а если поставить его перед буквой ⟨ و ⟩ (wāw), то образуется /aw/ (как в «cow » ).
Хотя в сочетании с простой буквой образуется открытая гласная переднего ряда (/a/), часто реализуемая как почти открытая (/ æ /), стандарт также допускает вариации, особенно в определенных окружающих условиях. Обычно, чтобы иметь более центральное (/ ä /) или заднее (/ ɑ /) произношение, слово включает ближайший задний согласный, такой как эмфатические знаки, а также qāf или rā' . Аналогичному «заднему» качеству подвергаются и другие гласные в присутствии таких согласных, однако это не так резко проявляется, как в случае с фатхой . [1] [2] [3]
Касра
[ редактировать ]Подобная диагональная линия под буквой называется касра ⟨ كَسْرَة ⟩ и обозначает короткий /i/ (как в «мне», «быть») и его аллофоны [i, ɪ, e, e̞, ɛ] (как в « Тим», «сидеть»). Например: ⟨ دِ ⟩ /ди/ . [4]
Когда касра ставится перед простой буквой ⟨ ﻱ ⟩ ( yā' ), она представляет собой длинный /iː/ (как в английском слове «конь»). Например: ⟨ دِي ⟩ /diː/ . Касра то в таких случаях обычно не пишется, но если йа произносится как дифтонг /адж/ , фатха следует писать над предшествующей согласной, чтобы избежать неправильного произношения. Слово Касра означает «ломка». [1]
Хамма
[ редактировать ]Камма ( ⟨ ضَمَّة ⟩ — небольшой диакритический знак в виде завитка, помещенный над буквой для обозначения короткого / u / (как в «герцог», более короткого «вы») и его аллофонов [u, ʊ, o, o̞, ɔ] как в «путе» или «быке»). Например: ⟨ دُ ⟩ /du/ . [4]
Когда хамма ставится перед простой буквой ⟨ و ⟩ ( вав ), она представляет собой длинный звук /uː/ (как звук «оо» в английском слове «swoop»). Например: ⟨ دُو ⟩ /duː/ . Хамма то в таких случаях обычно не пишется, но если wāw произносится как дифтонг /aw/ , фатха следует писать над предшествующей согласной, чтобы избежать неправильного произношения. [1]
Слово Хамма (ضَمَّة) в данном контексте означает округление , поскольку это единственная округленная гласная в списке гласных арабского языка.
Алиф Ханджария
[ редактировать ]( или кинжал) Надстрочный индекс короткая пишется . согласной как вертикальная черта над Он указывает на длинный звук /aː/, для которого алиф обычно не пишется. Например: ⟨ هَٰذَا ⟩ ( хадха ) или ⟨ رَحْمَٰن ⟩ ( рахман ).
Кинжал алиф встречается всего в нескольких словах, но среди них есть и распространенные; однако его редко пишут, даже в полностью озвученных текстах. Большинство клавиатур не имеют Dagger Alif . Слово Аллах ⟨ الله ⟩ ( Аллах ) обычно создается автоматически при вводе алиф лам лам ха' . Слово состоит из алиф + лигатуры двойного лам с шаддой и кинжалом алиф над лам , за которым следует ха' .
Мадда
[ редактировать ]Мадда / ⟨ مَدَّة ⟩ — это диакритический знак в форме тильды , который может появляться только поверх алифа ( آ) и указывает на гортанную точку ʔ/, за которой следует длинный /aː/ .
Теоретически одна и та же последовательность /ʔaː/ также может быть представлена двумя алифами , как в * ⟨ أَا ⟩ , где хамза над первым алифом представляет /ʔ/, а второй алиф представляет /aː/ . Однако последовательные алифы никогда не используются в арабской орфографии. Вместо этого эта последовательность всегда должна быть записана как один алиф с маддой над ним, комбинация, известная как алиф мадда . Например: ⟨ قُرْآن ⟩ /qurˈʔaːn/ .
Алиф Васлах
[ редактировать ]Ваалл ⟩ ⟨ وَصْلَة ⟩ , алиф ваалл ⟨ أَلِف وَصْلَة или хамзат вауль ⟨ هَمْزَة وَصْل ⟩ выглядит как маленькая буква ṣād поверх алифа ⟨ ٱ ⟩ (также обозначается алифом ⟨ ا ⟩ без хамзы ) . Это означает, что алиф не произносится, если его слово не начинает предложение. Например: ⟨ بِٱسْمِ ⟩ ( бисми ), но ⟨ ٱمْشُوا۟ ⟩ ( имшу, а не мшу ). Это связано с тем, что ни одно арабское слово не может начинаться с согласной без гласной: если вторая буква слова «васла» имеет касару, то «алиф-васлах» дает звук /i/. Однако когда во второй букве есть дамма, получается звук /у/.
Встречается только в начале слов, но может встречаться и после предлогов и определенного артикля. Обычно он встречается в повелительных глаголах, в глагольных основах с VII по X и в их отглагольных существительных ( maṣdar ). Алиф . определенного артикля васлахом считается
Встречается во словосочетаниях и предложениях (связная речь, а не изолированные/словарные формы):
- Заменить исключенную хамзу, место алифа которой ассимилировалось с предыдущей гласной. Например: فِي ٱلْيَمَن или في اليمن ( фи л-Яман ) «в Йемене».
- В хамзе начальные формы повелительного наклонения следуют за гласной, особенно после союза ⟨ و ⟩ ( ва- ) 'и'. Например: َ قُمْ وَٱشْرَبِ ٱلْمَاءَ ( кум ва-шраб-и л-ма' ) 'встань и выпей воды'.
Как и надстрочный индекс алиф, он не пишется полностью озвученными буквами, за исключением священных текстов, таких как Коран и арабизированная Библия.
Водить машину
[ редактировать ]Сукун — диакритический знак в форме круга , ⟨ سُكُونْ ⟩ помещенный над буквой ( ْ ). Это указывает на то, что за согласной, к которой она присоединяется, не следует гласная, т. е. нулевая гласная.
Это необходимый символ для написания согласных-гласных-согласных слогов, которые очень распространены в арабском языке. Например: ⟨ دَدْ ⟩ ( папа ).
Сукун также может использоваться для обозначения дифтонга. Фатха , за которой следует буква ⟨ ﻱ ⟩ ( йа ' ) с сукуном над ней ( ـَيْ ), указывает на дифтонг ай ( IPA /aj/ ). Фетха ( , за которой следует буква ⟨ ﻭ ⟩ ( вав ) с сукуном , ـَوْ ) указывает на /aw/ .
Сукун также может иметь альтернативную форму маленькой высокой головы хаха ( U+06E1 ۡ МАЛЕНЬКАЯ АРАБСКАЯ ВЫСОКАЯ ГОЛОВКА ХАХ БЕЗ ТОЧЕК ), особенно в некоторых Коранах. Могут существовать и другие формы (например, маленькая запятая над ⟨ʼ⟩ или циркумфлекс ⟨ˆ⟩ в насталик ). [5]
Танвин
[ редактировать ]Три диакритических знака гласных могут быть удвоены в конце слова, чтобы указать, что за гласной следует согласная n . Они могут считаться или не считаться харакатами и известны как танвин ⟨ تَنْوِين ⟩ , или нунация. Знаки обозначают слева направо -un, -in, -an .
Эти окончания используются как непаузальные грамматические окончания неопределенного падежа в литературном арабском языке или классическом арабском языке ( только триптоты ). В озвученном тексте они могут быть написаны, даже если они не произносятся (см. пауза ). См . Ираб для более подробной информации. Во многих разговорных арабских диалектах окончания отсутствуют. Во многих учебниках арабского языка стандартный арабский язык представлен без этих окончаний. Грамматические окончания могут не записываться в некоторых озвученных арабских текстах, поскольку знание ираба варьируется от страны к стране, и существует тенденция к упрощению арабской грамматики.
Знак ⟨ ـً ⟩ чаще всего пишется в сочетании с ⟨ ـًا ⟩ ( алиф ), ⟨ ةً ⟩ ( та' марбута ), ⟨ أً ⟩ (алиф хамза) или отдельно стоящим ⟨ ءً ⟩ ( хамза ). Алиф всегда следует писать (за исключением слов, оканчивающихся на та'марбута, хамза или диптот), даже если ан нет. Грамматические падежи и окончания танвин в неопределенных триптотных формах:
- -un : именительный падеж ;
- -an : винительный падеж , также служит наречием;
- -в : родительный падеж .
Шадда
[ редактировать ]Шадда ⟩ или шадда ⟨ شَدَّة ⟩ ( шадда ), или ташдид ⟨ تَشْدِيد ), представляет собой диакритический знак , ( ташдид имеющий форму маленькой письменной латинской буквы « w ».
Он используется для обозначения геминации (удвоения согласных или дополнительной длины), что в арабском языке является фонематическим. Оно пишется над согласной, которую нужно удвоить. Это единственная хараката , которая обычно используется в обычном написании во избежание двусмысленности . Например: ⟨ دّ ⟩ /dd/ ; медресе ⟨ مَدْرَسَة ⟩ («школа») против мударриса ⟨ مُدَرِّسَة ⟩ («учитель», женщина).
Пойдем
[ редактировать ]Иджам называемый ( иджам ; иногда также нукат ) [6] — это диакритические точки, которые различают различные согласные, имеющие одинаковую форму ( rasm ), например ⟨ ص ⟩ /sˤ/ , ⟨ ض ⟩ /dˤ/ . Обычно иджам считаются не диакритическими знаками, а частью буквы.
Ранние рукописи Корана не использовали диакритические знаки ни для гласных, ни для различения различных значений расма . Сначала было введено указание на гласные в виде красной точки, расположенной над, под или рядом с развилкой , а позже было введено указание на согласные в виде тонких, коротких черных одиночных или нескольких черточек, помещенных над или под развилкой . Эти иджамы стали черными точками примерно в то же время, когда харакат превратился в маленькие черные буквы или штрихи.
Как правило, египтяне не используют точки после конечной буквы йа ( ي ), которая выглядит точно так же, как алиф максура ( ى в рукописном и печатном виде ). Эта практика также используется в копиях мусхафа ( Корана ) , написанных Усманом Таха . Такое же объединение слов йа и алиф максура произошло в персидском языке , что привело к тому, что стандарт Unicode называет « Арабская буква фарси «Йе », которая выглядит точно так же, как йа в начальной и средней формах, но точно так же, как алиф максура в конечной и изолированной формах.
В то время, когда иджам был необязательным, буквы без точек были двусмысленными. Чтобы уточнить, что буква не будет иджам в выделенном тексте, буква может быть отмечена небольшим диакритическим знаком в форме буквы V или чайки выше, а также надстрочным полукругом (полумесяцем), подстрочной точкой (за исключением случая ⟨ ح ⟩ ; три точки использовались с ⟨ س ⟩ ) или миниатюрным индексом самой буквы. Надстрочная черта, известная как джарра , напоминающая длинную фатху , использовалась для обозначения сокращенного (ассимилированного) греха . Таким образом, все ⟨ ڛ سۣ سۡ سٚ ⟩ использовались для обозначения того, что рассматриваемая буква действительно была ⟨ س ⟩ , а не ⟨ ش ⟩ . [7] Эти знаки, известные под общим названием «аламату-ль-ихмал» , до сих пор иногда используются в современной арабской каллиграфии либо по своей первоначальной цели (т. е. для обозначения букв без иджама ), либо часто как чисто декоративные заполнители пространства. Маленький ک над кафом в его окончательных и изолированных формах ⟨ ك ـك ⟩ изначально был «аламату-ль-ихмалом» , который стал постоянной частью буквы. Раньше этот знак мог также появляться над средней формой каф , когда эта буква писалась без черточки на ее восходящей букве . Когда каф писался без этой черты, его можно было принять за лам , поэтому каф отличался надстрочным индексом каф или маленьким надстрочным индексом хамза ( набра ), а лам — надстрочным индексом лам ( лам-алиф-мим ). [8]
Хамза
[ редактировать ]Хотя обычно хамза иногда не считается буквой алфавита, хамза هَمْزة ( хамза , гортанная остановка ) на письме часто выступает как отдельная буква, пишется в текстах без точек и не считается ташкилом . Оно может выглядеть как отдельная буква или как диакритический знак над или под алифом , вау или йа .
Какая буква будет использоваться для поддержки хамзы, зависит от качества соседних гласных;
- Если гортанная остановка находится в начале слова, она всегда обозначается хамзой на алифе : вверху, если следующая гласная — /a/ или /u/, и внизу, если это /i/ .
- Если гортанная остановка находится в середине слова, хамза над алифом используется только в том случае, если ей не предшествует и не следует /i/ или /u/ :
- Если голосовая остановка находится в конце слова (игнорируя любые грамматические суффиксы), если она следует за короткой гласной, она пишется над alif , wāw или yā, так же, как и для среднего падежа; в противном случае — в строке (т. е. если она следует за долгой гласной, дифтонгом или согласной).
- Два алифа подряд никогда не допускаются: /ʔaː/ записывается с помощью алиф мадда ⟨ آ ⟩ и /aːʔ/ записывается со свободной хамзой на строке ⟨ اء ⟩ .
Рассмотрим следующие слова: ⟨ أَخ ⟩ /ʔax/ («брат»), ⟨ إسْماعِيل ⟩ /ʔismaːʕiːl/ («Исмаил»), ⟨ أُمّ ⟩ /ʔumm/ («мать»). Все три приведенных выше слова «начинаются» с гласной, открывающей слог, и в каждом случае алиф используется для обозначения начальной голосовой остановки ( фактического начала). Но если мы рассмотрим средние слоги, «начинающиеся» с гласной: ⟨ نَشْأة ⟩ /naʃʔa/ («происхождение»), ⟨ أَفْئِدة ⟩ /ʔafʔida/ («сердечки» — обратите внимание на слог /ʔi/ ; единственное число ⟨ فُؤاد ⟩ /фуаад/ ), ⟨ رُؤُوس ⟩ /ruʔuːs/ («головы», единственное число ⟨ رَأْس ⟩ /raʔs/ ), ситуация иная, как отмечалось выше. можно найти в подробной статье о Хамзе Более подробную информацию .
Диакритические знаки не используются в современном стандартном арабском языке.
[ редактировать ]Диакритические знаки, не используемые в современном стандартном арабском языке, но в других языках, использующих арабское письмо, а иногда и для написания арабских диалектов, включают (список не является исчерпывающим):
Описание | Юникод | Пример | Язык(и) | Примечания |
---|---|---|---|---|
Бары и линии | ||||
диагональная полоса выше | Г | Арабский (Ирак), Бельцы , Бурушаски , Кашмирский , казахский , Ховар , курдский , киргизский , персидский , Синдхи , урду , уйгурский | ||
горизонтальная полоса выше | пушту | |||
вертикальная линия выше | ты | уйгурский |
| |
Точки | ||||
2 точки (вертикальные) | ݭ ڭ ݙ ڙ | |||
4 точки | ڐ ڐ ڐ د | Синдхи, старый хиндустани | ||
точка ниже | U + 065C ٜ ЗНАК АРАБСКОЙ ГЛАСНОЙ ТОЧКИ НИЖЕ | ٜ бٜ | африканские языки [10] |
|
Варианты стандартных арабских диакритических знаков | ||||
волнистый хамза | ٲ аа | Кашмири |
| |
фигурная касра выше | ◌ࣥ | Рохинджа |
| |
Рохинджа |
| |||
двойная Касра выше | ◌ࣱ | Рохинджа |
| |
перевернутая и правильная фигурная касра выше | ◌ࣨ | Рохинджа |
| |
Тильды | ||||
диагональная форма тильды выше | ◌ࣤ | Рохинджа |
| |
диагональная тильда внизу | ◌ࣦ | Рохинджа |
| |
арабские буквы | ||||
миниатюрная арабская буква ха (начальная форма) ﺣ выше | ◌ۡ | Рохинджа |
| |
миниатюрная арабская буква тах ط выше | ۲ | Урду | ||
Восточные арабские цифры [13] | ||||
Восточно-арабская цифра 2: ٢ выше | U+0775 , U+0778 , U+077A | ݵ۵ ݸ۸ ݺۺ | Бурушаски |
|
Восточно-арабская цифра 3: ٣ выше | U+0776 , U+0779 , U+077B | ݶڶ ݹ۹ ݻۻ | Бурушаски |
|
Число 4 на урду: ۴ выше или ниже. | U+0777 , U+077C , U+077D | ݷڷ ݼۼ ݽ√ | Бурушаски |
|
Формы, похожие на латинские буквы | ||||
Нун Джунна , форма буквы «u» выше | Н | Урду |
| |
буква «v» выше | ۆ ویٛ | азербайджанский | ||
перевернутая буква "v" выше | О | азербайджанский , уйгурский | ||
еще пунктир | ◌ࣵ | Волоф | Латынь для | |
круг с фатхой | ◌ࣴ | Волоф | Латынь | |
знак меньше - ниже | ◌ࣹ | Волоф | латынь и | |
знак больше - ниже | ◌ࣺ | Волоф | латынь это | |
знак меньше - выше | ◌ࣷ | Волоф | латынь о | |
знак больше - выше | ◌ࣸ | Волоф | Латынь от | |
кольцо | г | пушту |
| |
Другие формы | ||||
фигура «рыба» выше | ࣤ࣬ ࣥ࣬ ࣦ࣯ | Рохинджа | Тана , например دࣤ࣬ / دࣥ࣬ / دࣦ࣯ пишется над или под другими диакритическими знаками, чтобы отметить долгий восходящий тон ( / ˨˦ / ). [14] [15] | |
Различный | Урду |
|
Маркеры тона рохинджа
[ редактировать ]Исторически арабское письмо было принято и использовалось во многих тональных языках, примеры включают Сяоэрцзин для китайского языка , а также сценарий Аджами , принятый для письма на различных языках Западной Африки. Однако арабское письмо никогда не имело собственного способа передачи тонов, пока оно не было адаптировано для языка рохинджа . Фонна рохинджа — это три тональных маркера, которые являются частью стандартизированной и принятой орфографической конвенции рохинджа. Это остается единственным известным примером тональных маркеров в арабском письме . [14] [15]
Маркеры тона действуют как «модификаторы» диакритических знаков гласных. Проще говоря, это «диакритика для диакритики». Они пишутся «вне» слова, то есть пишутся над диакритическим знаком гласной, если диакритический знак написан над словом, и пишутся под диакритическим знаком, если диакритический знак написан под словом. Они пишутся только там, где есть диакритические знаки гласных. Это важно отметить, поскольку без присутствия диакритического знака невозможно отличить маркеры тона от иджама , то есть точек, которые используются для фонетического различения согласных.
Харбай
Харбай ( диакритические , как его называют в рохинджа, представляет собой одну точку, которая ставится поверх слов Фатха и Хамма , или фигурная Фатха и курчавая Хамма знаки гласных, уникальные для рохинхья), или их соответствующие версии Фатхатан и Хамматан , и она помещается под Касра или фигурная Касра или их соответствующая Касратанская версия. (например دً࣪ / دٌ࣪ / دࣨ࣪ / دٍ࣭ ) Этот маркер тона обозначает короткий высокий тон ( /˥/ ). [14] [15]
Тела
Тела , как ее называют в рохинджа, представляет собой две точки, которые помещаются поверх Фатхи и Хаммы , или фигурной Фатхи и курчавой Хаммы , или их соответствующих версий Фатхатан и Хамматан , и помещаются под Касра или курчавую Касра , или их соответствующий Касратан. версия. (например دَ࣫ / دُ࣫ / دِ࣮ ) Этот маркер тона указывает на длинный нисходящий тон ( /˥˩/ ). [14] [15]
Тана
Тана , как ее называют в рохинджа, представляет собой петлеобразную линию, напоминающую рыбу, которая помещается поверх Фатхи и Хаммы , или вьющейся Фатхи и вьющейся Хаммы , или их соответствующих версий Фатхатана и Хамматана , и помещается под Касрой или курчавой Касрой . или их соответствующую версию Касратана . (например دࣤ࣬ / دࣥ࣬ / دࣦ࣯ ) Этот маркер тона указывает на длинный восходящий тон ( /˨˦/ ). [14] [15]
История
[ редактировать ]Согласно традиции, первым, кто ввел систему хараката , был Али , который назначил Абу аль-Асвада ад-Дуали для этой задачи . Абу аль-Асвад разработал систему точек для обозначения трех коротких гласных (вместе с соответствующими аллофонами) арабского языка. Эта система точек предшествовала иджаму , точкам, используемым для различения разных согласных.
- Ранний басмала куфический
- Средний куфический
- Современный куфический текст в Коране
Система Абу аль-Асвада
[ редактировать ]Система Хараката Абу аль-Асвада отличалась от системы, которую мы знаем сегодня. В системе использовались красные точки, где каждое расположение или позиция обозначали разные короткие гласные.
Точка над буквой обозначала гласную а , точка внизу обозначала гласную i , точка сбоку от буквы обозначала гласную u , а две точки обозначали танвин .
Однако в ранних рукописях Корана знаки гласных использовались не для каждой буквы, требующей их использования, а только для тех букв, где они были необходимы для правильного чтения.
Система Аль Фарахиди
[ редактировать ]Предшественником системы, которую мы знаем сегодня, является система Аль Фарахиди. аль-Фарахиди обнаружил, что задача письма двумя разными цветами была утомительной и непрактичной. Еще одна сложность заключалась в том, что к тому времени был введен иджам , который, хотя и представлял собой короткие штрихи, а не круглые точки, наблюдаемые сегодня, означал, что без различия цвета их можно было спутать.
Соответственно, он заменил харакат маленькими надстрочными буквами: малый алиф, йа и вав для коротких гласных, соответствующих долгим гласным, написанным этими буквами, маленький с(х)ин для шадда (близнецов), маленький ха' для хафифа (короткий согласный; больше не используется). Его система, по сути, та, которую мы знаем сегодня. [17]
Автоматическая диакритизация
[ редактировать ]Процесс автоматического восстановления диакритических знаков называется диакритизацией или диакритическим восстановлением. Полезно избегать двусмысленности в таких приложениях, как машинный перевод на арабский язык , преобразование текста в речь и поиск информации . Разработаны алгоритмы автоматической диакритизации. [18] [19] Для современного стандартного арабского языка современный ( алгоритм имеет коэффициент ошибок в словах WER) 4,79%. Наиболее распространенными ошибками являются имена собственные и падежные окончания . [20] Подобные алгоритмы существуют и для других разновидностей арабского языка . [21]
См. также
[ редактировать ]- Арабский алфавит :
- Иврит :
- Еврейские диакритические знаки , еврейский эквивалент
- Никкуд , еврейский эквивалент слова «харакат».
- Дагеш , еврейский диакритический знак, похожий на арабские иджам и шадда.
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Карин К. Райдинг, «Справочная грамматика современного стандартного арабского языка», Cambridge University Press, 2005, стр. 25-34, а именно «Глава 2, Раздел 4: Гласные»
- ^ Анатоль Лёвин, Бретт Кесслер, Уильям Рональд Лебен, «Введение в языки мира», «5.6 Очерк современного стандартного арабского языка», Oxford University Press, 2017, стр. 255, издание 2, а именно «5.6.2.2 Гласные».
- ^ Амин Бушентуф, Арабский язык для чайников®, John Wiley & Sons, 2018, 3-е издание, особенно раздел «Все о гласных»
- ^ Перейти обратно: а б «Введение в письменный арабский язык» . Университет Виктории, Канада .
- ^ «Заметки арабских символов» . р12а .
- ^ Ибн Варрак (2002). Ибн Варрак (ред.). Что на самом деле говорит Коран: язык, текст и комментарии . Перевод Ибн Варрака. Нью-Йорк: Прометей. п. 64. ИСБН 1-57392-945-Х . Архивировано из оригинала 11 апреля 2019 года . Проверено 9 апреля 2019 г.
- ^ Гацек, Адам (2009). «Неострые буквы» . Арабские рукописи: Путеводитель для читателей . БРИЛЛ. п. 286. ИСБН 978-90-04-17036-0 .
- ^ Гацек, Адам (1989). «Технические практики и рекомендации, записанные классическими и постклассическими арабскими учеными относительно копирования и исправления рукописей» (PDF) . В Дероше, Франсуа (ред.). Рукописи с Ближнего Востока: очерки по кодикологии и палеографии. Материалы Стамбульской конференции (Стамбул, 26–29 мая 1986 г.) . п. 57 (§ 8. Диакритические знаки и огласовки).
- ^ Алкалеси, Ясин М. (2001) «Современный иракский арабский язык: учебник». Издательство Джорджтаунского университета. ISBN 978-0878407880
- ^ Перейти обратно: а б «Арабский диапазон: 0600–06FF Стандарт Unicode, версия 15.1» (PDF) . Юникод . Проверено 10 июля 2024 г.
- ^ «Гласная 04: ٲ/ä – (aae)» . Кашмирский словарь . 31 января 2021 г. Проверено 11 июля 2024 г.
- ^ «Гласная07: اٟ / ü (ι)» . Кашмирский словарь . 6 февраля 2021 г. Проверено 11 июля 2024 г.
- ^ Мирза, Умайр (2006). Словарь Брушского на урду [ Словарь Бурушаски-урду ] (на урду и бурушаски). стр. 100-1 28–29. ISBN 969-404-66-0 . Проверено 13 июля 2024 г.
{{cite book}}
: CS1 maint: игнорируются ошибки ISBN ( ссылка ) - ^ Перейти обратно: а б с д и Священник Лорна А.; Хоскен, Мартин (10 августа 2010 г.). «Предложение о добавлении символов арабского письма для африканских и азиатских языков» (PDF) . Консорциум Юникод . Архивировано (PDF) из оригинала 8 октября 2022 года . Проверено 5 мая 2023 г.
- ^ Перейти обратно: а б с д и Панди, Аншуман (27 октября 2015 г.). «Предложение закодировать сценарий ханифи рохинджа в Юникод» (PDF) . Консорциум Юникод . Архивировано (PDF) из оригинала 12 декабря 2019 года . Проверено 5 мая 2023 г.
- ^ «Предложение о включении определенных символов в Юникод» (PDF) .
- ^ Верстег, CHM (1997). Арабский язык . Издательство Колумбийского университета. стр. 56 и далее. ISBN 978-0-231-11152-2 .
- ^ Азми, Акил М.; Альмаджед, Рехам С. (10 октября 2013 г.). «Обзор автоматических методов арабской диакритизации» . Инженерия естественного языка . 21 (3): 477–495. дои : 10.1017/S1351324913000284 . ISSN 1351-3249 . S2CID 31560671 .
- ^ Алманеа, Манар (2021). «Автоматические методы и нейронные сети в диакритизации арабских текстов: комплексное исследование» . Доступ IEEE . 9 : 145012–145032. Бибкод : 2021IEEA...9n5012A . дои : 10.1109/ACCESS.2021.3122977 . ISSN 2169-3536 . S2CID 240011970 .
- ^ Томпсон, Брайан; Альшехри, Али (28 сентября 2021 г.). «Улучшение диакритизации арабского языка путем обучения диакритике и переводу». arXiv : 2109.14150 [ cs.CL ].
- ^ Масмуди, Абир; Алулу, Чафик; Абделлахи, Абдель Гадер Сиди; Белгит, Ламия Хадрич (8 августа 2021 г.). «Автоматическая диакритизация текста тунисского диалекта с использованием модели SMT» . Международный журнал речевых технологий . 25 : 89–104. дои : 10.1007/s10772-021-09864-6 . ISSN 1572-8110 . S2CID 238782966 .