~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ D1FCCB1C312DA52103A3E13F6D749AC7__1718116560 ✰
Заголовок документа оригинал.:
✰ Arabic diacritics - Wikipedia ✰
Заголовок документа перевод.:
✰ Арабские диакритические знаки — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Arabic_diacritics ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/d1/c7/d1fccb1c312da52103a3e13f6d749ac7.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/d1/c7/d1fccb1c312da52103a3e13f6d749ac7__translat.html ✰
Дата и время сохранения документа:
✰ 16.06.2024 01:38:35 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 11 June 2024, at 17:36 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Арабские диакритические знаки — Википедия Jump to content

арабские диакритические знаки

Из Википедии, бесплатной энциклопедии
В раннем письменном арабском языке использовался только расм (черный шрифт). Позже в арабский язык были добавлены диакритические знаки иджам такие буквы, как эти две ص, ض (примеры выделены красным), чтобы можно было различать (ṣ, ḍ). Диакритические знаки Харакат (примеры выделены синим цветом), которые используются в Коране, но не в большинстве письменных арабских языков, обозначают короткие гласные, длинные согласные и некоторые другие вокализации.

В арабском письме есть множество диакритических знаков , в том числе указывающие на согласные, известные как иджам ( إِعْجَام ), и дополнительные диакритические знаки, известные как ташкил ( تَشْكِيل ). Последние включают в себя знаки гласных, называемые харакат ( حَرَكَات ; единственное число: حَرَكَة , харака ).

Арабское письмо представляет собой модифицированный абджад , в котором короткие согласные и долгие гласные обозначаются буквами, а короткие гласные и длина согласного обычно не указываются в письменном виде. Ташкил не является обязательным для обозначения отсутствующих гласных и длины согласного. В современном арабском языке всегда используется иджам указание на согласную, но только религиозные тексты, детские книги и произведения для учащихся пишутся с полным ташкилом — указателем гласных и длиной согласной. Однако авторы нередко добавляют диакритические знаки к слову или букве, когда грамматический падеж или значение в противном случае считаются неоднозначными. Кроме того, классические произведения и исторические документы, представляемые широкой публике, часто передаются с полным ташкилом , чтобы компенсировать пробел в понимании, возникший в результате стилистических изменений на протяжении веков.

Ташкил (знаки, используемые в качестве фонетических ориентиров) [ править ]

Буквальное значение слова تَشْكِيل ташкил — «вариация». Поскольку обычный арабский текст не предоставляет достаточно информации о правильном произношении, основная цель ташкила хараката ) — предоставить фонетическое руководство или фонетическую помощь; т.е. показывать правильное произношение детям, которые учатся читать, или изучающим иностранные языки.

Большая часть арабского письма написана без хараката (или кратких гласных). Однако они обычно используются в текстах, требующих строгого соблюдения точного произношения. Это справедливо, прежде всего, в отношении Корана ٱلْقُرْآن ( аль-Коран ) и поэзии . Также довольно распространено добавление хараката к хадисам ٱلْحَدِيث ( аль-хадис ; множественное число: аль-хадис ) и Библии . Другое применение - в детской литературе. Более того, харакат используется в обычных текстах отдельными словами, когда двусмысленность произношения не может быть легко разрешена только на основе контекста. Словари арабского языка со знаками гласных предоставляют информацию о правильном произношении как носителям арабского языка, так и иностранцам. В искусстве и каллиграфии харакат можно использовать просто потому , что его написание считается эстетически приятным.

Пример полностью огласованного ( огласованного или огласованного ) арабского языка из Бисмиллы :

Во имя Бога Милостивого, Милосердного


бисми-ллахи р-рахмани р-рахим я
Или, точнее, соответствие диакритическим знакам:
бисм Аллах ар-Рахман ар-Рахим


Во имя Бога Всемилостивого, Особенно Милосердного.

В некоторых учебниках арабского языка для иностранцев харакат теперь используется в качестве фонетического руководства, чтобы облегчить изучение арабского языка. Другой метод, используемый в учебниках, - это фонетическая латинизация неозвученных текстов. Полностью озвученные арабские тексты (т.е. арабские тексты с харакатом /диакритическими знаками) востребованы изучающими арабский язык. Некоторые двуязычные онлайн-словари также предоставляют харакат в качестве фонетического руководства, аналогично английским словарям, обеспечивающим транскрипцию.

Харакат (краткие знаки гласных) [ править ]

Харакат حَرَكَات , что буквально означает «движения», представляет собой краткие гласные знаки. Существует некоторая неясность относительно того, какие ташкилы также являются харакатами ; Танвин . , например, являются маркерами как гласных, так и согласных

Фатха [ править ]

ـَ

Фатха فَتْحَة над — это небольшая диагональная линия, расположенная буквой и обозначающая короткий звук /a/ (как звук /a/ в английском слове «кошка»). Само слово фатха ( فَتْحَة ) означает «открытие» и относится к открытию рта при произнесении /а/ . Например, с dāl (далее – основная согласная в следующих примерах): دَ /da/ .

Когда фетха ставится перед простой буквой ا ( алиф ) (т. е. буквой, не имеющей собственной хамзы или гласной), она представляет собой длинный /aː/ (близкий к звуку «а» в английском слове «папа»). ", с открытой гласной переднего ряда /æː/, а не задней /ɑː/, как в "отец"). Например: دَا /daː/ . В таких случаях фетха обычно не пишется. Когда фатх ставится перед буквой ⟨ ⟩ (йа'), образуется /aj/ (как в «l ie »); а если поставить перед буквой ⟨ و ⟩ (wāw), то образуется /aw/ (как в «cow » ).

Хотя в сочетании с простой буквой образуется открытая гласная переднего ряда (/a/), часто реализуемая как почти открытая (/ æ /), стандарт также допускает вариации, особенно в определенных окружающих условиях. Обычно, чтобы иметь более центральное (/ ä /) или заднее (/ ɑ /) произношение, слово включает ближайший задний согласный, такой как эмфатические знаки, а также qāf или rā' . Аналогичному «заднему» качеству подвергаются и другие гласные в присутствии таких согласных, однако это не так резко проявляется, как в случае с фатхой . [1] [2] [3]

Касра [ править ]

ـِ

Подобная диагональная линия под буквой называется касра كَسْرَة и обозначает короткий /i/ (как в «мне», «быть») и его аллофоны [i, ɪ, e, e̞, ɛ] (как в « Тим», «сидеть»). Например: دِ /ди/ . [4]

Когда касра ставится перед простой буквой ( yā' ), она представляет собой длинный /iː/ (как в английском слове «конь»). Например: دِي /diː/ . Касра . в таких случаях обычно не пишется, но если йа произносится как дифтонг /адж/ , то фатха следует писать над предшествующей согласной, чтобы избежать неправильного произношения Слово Касра означает «ломка». [1]

Хамма [ править ]

ـُ

Камма ( ضَمَّة — небольшой диакритический знак в виде завитка, помещенный над буквой для обозначения короткого / u / (как в «герцог», более короткого «вы») и его аллофонов [u, ʊ, o, o̞, ɔ] как в «путе» или «быке»). Например: دُ /du/ . [4]

Когда хамма ставится перед простой буквой و ( вав ), она представляет собой длинный звук /uː/ (как звук «оо» в английском слове «swoop»). Например: دُو /duː/ . В таких случаях дамма . обычно не пишется, но если wāw произносится как дифтонг /aw/ , то фатха следует писать на предшествующей согласной, чтобы избежать неправильного произношения [1]

Слово Хамма (ضَمَّة) в данном контексте означает округление , поскольку это единственная округленная гласная в списке гласных арабского языка.

Алиф Ханджария [ править ]

ــٰ

Надстрочный индекс (или кинжал) как короткая вертикальная пишется . над черта согласной Он указывает на длинный звук /aː/ , для которого алиф обычно не пишется. Например: هَٰذَا ( хадха ) или رَحْمَٰن ( рахман ).

Кинжал алиф встречается всего в нескольких словах, но среди них есть и распространенные; однако его редко пишут, даже в полностью озвученных текстах. Большинство клавиатур не имеют Dagger Alif . Слово Аллах الله ( Аллах ) обычно создается автоматически при вводе алиф лам лам ха' . Слово состоит из алиф + лигатуры двойного лам с шаддой и кинжалом алиф над лам .

Мадда [ править ]

ـٓ آ ну давай же

Мадда , مَدَّة — это диакритический знак в форме тильды , который может появляться только поверх алифа ( آ) и указывает на гортанную точку /ʔ/ за которой следует длинный /aː/ .

Теоретически, одна и та же последовательность /ʔaː/ также может быть представлена ​​двумя алифами , как в * أَا , где хамза над первым алифом представляет /ʔ/ , а второй алиф представляет /aː/ . Однако последовательные алифы никогда не используются в арабской орфографии. Вместо этого эта последовательность всегда должна быть записана как один алиф с маддой над ним, комбинация, известная как алиф мадда . Например: قُرْآن /qurˈʔaːn/ .

Алиф Васлах [ править ]

ٱٱ

Ваалл وَصْلَة , алиф ваалл وَصْلَة или хамзат вауль ٱ هَمْزَة وَصْل выглядит как маленькая буква ṣād поверх алифа ا ( также обозначается алифом أَلِف без хамзы ) . Это означает, что алиф не произносится, если его слово не начинает предложение. Например: بِٱسْمِ ( бисми ), но ٱمْشُوا۟ ( имшу , а не мшу ). Это связано с тем, что ни одно арабское слово не может начинаться с согласной без гласной: если вторая буква слова «васла» имеет касару, то «алиф-васлах» дает звук /i/. Однако когда во второй букве есть дамма, получается звук /у/.

Встречается только в начале слов, но может встречаться и после предлогов и определенного артикля. Обычно он встречается в повелительных глаголах, в глагольных основах с VII по X и в их отглагольных существительных ( maṣdar ). Алиф считается определенного артикля васлахом .

Встречается во словосочетаниях и предложениях (связная речь, а не изолированные/словарные формы):

  • Заменить исключенную хамзу, место алифа которой ассимилировалось с предыдущей гласной. Например: فِي ٱلْيَمَن или في اليمن ( фи л-Яман ) «в Йемене».
  • В хамзе начальные формы повелительного наклонения следуют за гласной, особенно после союза و ( ва- ) 'и'. Например: َ قُمْ وَٱشْرَبِ ٱلْمَاءَ ( кум ва-шраб-и л-ма' ) 'встань и выпей воды'.

Как и надстрочный индекс алиф, он не пишется полностью озвученными буквами, за исключением священных текстов, таких как Коран и арабизированная Библия.

Сукун [ править ]

ـْـ

Сукун — это диакритический знак в форме круга , سُكُونْ помещенный над буквой ( ْ ). Это указывает на то, что за согласной, к которой она присоединяется, не следует гласная, т. е. нулевая гласная.

Это необходимый символ для написания согласных-гласных-согласных слогов, которые очень распространены в арабском языке. Например: دَدْ ( папа ).

Сукун также может использоваться для обозначения дифтонга. Фатха , за которой следует буква ( йа ' ) с сукуном над ней ( ـَيْ ), указывает на дифтонг ай ( IPA /aj/ ). Фетха , за которой следует буква ( вав ) с сукуном ( ـَوْ ), указывает на /aw/ .

ـۡـ

Сукун также может иметь альтернативную форму маленькой высокой головы хаха ( U+06E1 ۡ МАЛЕНЬКАЯ АРАБСКАЯ ВЫСОКАЯ ГОЛОВКА ХАХ БЕЗ ТОЧЕК ), особенно в некоторых Коранах. Могут существовать и другие формы (например, маленькая запятая над ⟨ʼ⟩ или циркумфлекс ⟨ˆ⟩ в насталик ). [5]

Танвин (конечные постназализованные или долгие гласные) [ править ]

ـٌ ‎   ـٍ ‎   ـً

Три диакритических знака гласных могут быть удвоены в конце слова, чтобы указать, что за гласной следует согласная n . Они могут считаться или не считаться харакатами и известны как танвин تَنْوِين , или нунация. Знаки обозначают слева направо -un, -in, -an .

Эти окончания используются как непаузальные грамматические окончания неопределенного падежа в литературном арабском или классическом арабском языке ( только триптоты ). В озвученном тексте они могут быть написаны, даже если они не произносятся (см. пауза ). См. Ираб для более подробной информации. Во многих разговорных арабских диалектах окончания отсутствуют. Во многих учебниках арабского языка стандартный арабский язык представлен без этих окончаний. Грамматические окончания могут не записываться в некоторых озвученных арабских текстах, поскольку знание ираба варьируется от страны к стране, и существует тенденция к упрощению арабской грамматики.

Знак ـً чаще всего пишется в сочетании с ـًا ( алиф ), ةً ( та' марбута ), أً (алиф хамза) или отдельно стоящим ءً ( хамза ). Алиф всегда следует писать (за исключением слов, оканчивающихся на та'марбута, хамза или диптот), даже если ан нет. Грамматические падежи и окончания танвин в неопределенных триптотных формах:

Шадда (знак удвоения согласной) [ править ]

ـّـ

Шадда ), представляет собой диакритический знак , или шадда شَدَّة ( шадда ), или ташдид تَشْدِيد ( ташдид имеющий форму маленькой письменной латинской буквы « w ».

Он используется для обозначения геминации (удвоения согласных или дополнительной длины), что в арабском языке является фонематическим. Оно пишется над согласной, которую нужно удвоить. Это единственная хараката , которая обычно используется в обычном написании во избежание двусмысленности . Например: دّ /dd/ ; медресе مَدْرَسَة («школа») против мударриса مُدَرِّسَة («учитель», женщина).

Иджам (фонетические различия согласных) [ править ]

письмо VII века Куфическое без каких-либо хараката или иджама .

Иджам Иджам ( иногда также называемый нукат ) [6] — это диакритические точки, которые различают различные согласные, имеющие одинаковую форму ( rasm ), например ص /sˤ/ , ض /dˤ/ . Обычно иджам считаются не диакритическими знаками, а частью буквы.

Ранние рукописи Корана не использовали диакритические знаки ни для гласных, ни для различения различных значений расма . Сначала было введено указание на гласные в виде красной точки, расположенной над, под или рядом с развилкой , а позже было введено указание на согласные в виде тонких, коротких черных одиночных или нескольких черточек, помещенных над или под развилкой ( изображение ) . Эти иджамы стали черными точками примерно в то же время, когда харакат превратился в маленькие черные буквы или штрихи.

Обычно египтяне не используют точки в конце yā' ي выглядит точно так же, как алиф макура ى , которое в рукописном и печатном виде . Эта практика также используется в копиях мусхафа ( Корана ) , написанных Усманом Таха . Такое же объединение слов йа и алиф максура произошло в персидском языке , что привело к тому, что стандарт Unicode называет « Арабская буква фарси йе », которая выглядит точно так же, как йа в начальной и средней формах, но точно так же, как алиф максура в конечной и изолированной формах یـ ـیـ ـی .

Изолированный каф с аламату-ль-ихмалом и без верхнего штриха рядом с начальным кафом с верхним штрихом.
سۡ سۜ سۣ سٚ ڛسۜ سۜ سۣ سٚ ڛ
Несколько способов написания /s/ .

В то время, когда иджам был необязательным, буквы без точек были двусмысленными. букве не будет i'jām Чтобы уточнить, что в выделенном тексте (т. е. ⟨ ح /ħ/ , د /d/ , ر /r/ , س /s/ , ص /sˤ/ , ط /tˤ/ , ع /ʕ/ , ل /l/ , ه /h/ ), буква может быть отмечена небольшим диакритическим знаком в форме буквы V или чайки выше, а также надстрочным полукругом (полумесяц), подстрочная точка (кроме случая ح использовались три точки ; с ⟨ س ) или миниатюрная подстрочная буква самой буквы. Надстрочная черта, известная как джарра , напоминающая длинную фатху , использовалась для обозначения сокращенного (ассимилированного) греха . Таким образом, все ⟨ ڛ سۣ سۡ سٚ использовались для обозначения того, что рассматриваемая буква действительно была س , а не ش . [7] Эти знаки, известные под общим названием «аламату-ль-ихмал» , до сих пор иногда используются в современной арабской каллиграфии либо по своей первоначальной цели (т. е. для обозначения букв без иджама ), либо часто как чисто декоративные заполнители пространства. Маленький ک над кафом в его окончательных и изолированных формах ك ـك изначально был «аламату-ль-ихмалом» , который стал постоянной частью буквы. Раньше этот знак мог также появляться над средней формой каф , когда эта буква была написана без черточки на ее восходящей букве . Когда каф писался без этой черты, его можно было принять за лам , поэтому каф отличался надстрочным индексом каф или маленьким надстрочным индексом хамза ( набра ), а лам — надстрочным индексом лам ( лам-алиф-мим ). [8]

Хамза (полусогласная гортанная остановка) [ править ]

ئ  ؤ  إ  أ ءАаааааааааааааааа

Хотя обычно хамза иногда не считается буквой алфавита, хамза هَمْزة ( хамза , гортанная остановка ) на письме часто выступает как отдельная буква, пишется в текстах без точек и не считается ташкилом . Оно может выглядеть как отдельная буква или как диакритический знак над или под алифом , вау или йа .

Какая буква будет использоваться для поддержки хамзы , зависит от качества соседних гласных;

  • Если гортанная остановка находится в начале слова, она всегда обозначается хамзой на алифе : вверху, если следующая гласная — /a/ или /u/ , и внизу, если это /i/ .
  • Если гортанная остановка находится в середине слова, хамза над алифом используется только в том случае, если ей не предшествует и не следует /i/ или /u/ :
    • Если /i/ находится до или после гортанной остановки, yāʼ с хамзой используется две точки, которые обычно находятся под yāʾ, ( в этом случае исчезают): ⟨ ئ .
    • В противном случае, если /u/ стоит до или после гортанной смычки, вав с хамзой используется : ⟨ ؤ .
  • Если голосовая остановка находится в конце слова (игнорируя любые грамматические суффиксы), если она следует за короткой гласной, она пишется над alif , wāw или , так же, как и для среднего падежа; в противном случае — в строке (т. е. если она следует за долгой гласной, дифтонгом или согласной).
  • Два алифа подряд никогда не допускаются: /ʔaː/ записывается с помощью алиф мадда آ и /aːʔ/ записывается со свободной хамзой на строке اء .

Рассмотрим следующие слова: أَخ /ʔax/ («брат»), إسْماعِيل /ʔismaːʕiːl/ («Исмаил»), أُمّ /ʔumm/ («мать»). Все три приведенных выше слова «начинаются» с гласной, открывающей слог, и в каждом случае алиф используется для обозначения начальной голосовой остановки ( фактического начала). Но если мы рассмотрим средние слоги, «начинающиеся» с гласной: نَشْأة /naʃʔa/ («происхождение»), أَفْئِدة /ʔafʔida/ («сердечки» — обратите внимание на слог /ʔi/ ; единственное число فُؤاد /фуаад/ ), رُؤُوس /ruʔuːs/ («головы», единственное число رَأْس /raʔs/ ), ситуация иная, как отмечалось выше. можно найти в подробной статье о Хамзе Более подробную информацию .

Маркеры тонов [ править ]

Исторически арабское письмо было принято и использовалось во многих тональных языках, примеры включают Сяоэрцзин для китайского языка , а также сценарий Аджами , принятый для письма на различных языках Западной Африки. Однако одним из недостатков арабского языка, особенно по сравнению с латинскими алфавитами или другими местными системами письменности, было то, что в арабском языке не было способа обозначения тонов.

Однако с принятием арабской письменности для языка рохинджа , известной как рохинджа фонна , были разработаны и используются в рукописях 3 тональных маркера. Эти маркеры тона являются частью стандартизированной и принятой орфографической конвенции рохинджа. Это единственный известный пример тональных маркеров в арабском письме . [9] [10]

Маркеры тона действуют как «модификаторы» диакритических знаков гласных. Проще говоря, это «диакритика для диакритики». Они пишутся «вне» слова, что означает, что они пишутся над диакритическим знаком гласной, если диакритический знак написан над словом, и они пишутся под диакритическим знаком, если диакритический знак написан под словом. Они пишутся только там, где есть диакритические знаки гласных. Это важно отметить, поскольку без присутствия диакритического знака невозможно отличить маркеры тона от иджама , то есть точек, которые используются для фонетического различения согласных.

◌࣪ / ◌࣭

Харбай , как его называют в рохинджа, представляет собой одну точку, которая ставится поверх слов Фатха и Хамма , или фигурная Фатха и курчавая Хамма (диакритические знаки гласных, уникальные для рохинхья), или их соответствующие версии Фатхатан и Хамматан , и она помещается под Касра или фигурная Касра или их соответствующая Касратанская версия. (например دً࣪ / دٌ࣪ / دࣨ࣪ / دٍ࣭ ‎ ) Этот маркер тона обозначает короткий высокий тон ( /˥/ ). [9] [10]

◌࣫ / ◌࣮

Тела , как ее называют в рохинджа, представляет собой две точки, которые помещаются поверх Фатхи и Хаммы , или фигурной Фатхи и курчавой Хаммы , или их соответствующих версий Фатхатан и Хамматан , и помещаются под Касра или курчавую Касра , или их соответствующие Касратаны. версия. (например دَ࣫ / دُ࣫ / دِ࣮ ‎ ) Этот маркер тона указывает на длинный нисходящий тон ( /˥˩/ ). [9] [10]

◌࣬ / ◌࣯

Тана , как ее называют в рохинджа, представляет собой петлеобразную линию, напоминающую рыбу, которая помещается поверх Фатхи и Хаммы , или вьющейся Фатхи и вьющейся Хаммы , или их соответствующих версий Фатхатана и Хамматана , и помещается под Касрой или вьющейся Касрой . или их соответствующую версию Касратана . (например دࣤ࣬ / دࣥ࣬ / دࣦ࣯ ‎ ) Этот маркер тона указывает на длинный восходящий тон ( /˨˦/ ). [9] [10]

История [ править ]

Эволюция ранней арабской каллиграфии (9–11 века). из басмала В качестве примера была взята куфических рукописей Корана . (1) Начало IX века, письмо без точек и диакритических знаков (см. изображение раннего басмальского куфического текста );
(2) и (3) 9–10 века при династии Аббасидов, система Абу аль-Асвада установила красные точки, каждое расположение или позиция обозначают разные короткие гласные; позже была использована вторая система черных точек, чтобы различать такие буквы, как фа и каф (см. изображение среднего куфического письма );
(4) 11 век, в системе аль-Фарахиди (системе, которую мы знаем сегодня) точки были преобразованы в формы, напоминающие буквы, для транскрипции соответствующих долгих гласных (см. изображение современного куфического текста в Коране ).

Согласно традиции, первым, кто ввел систему хараката, был Али , который назначил Абу аль-Асвада ад-Дуали для этой задачи . Абу аль-Асвад разработал систему точек для обозначения трех коротких гласных (вместе с соответствующими аллофонами) арабского языка. Эта система точек предшествовала иджаму , точкам, используемым для различения разных согласных.

Система Абу аль-Асвада [ править ]

Система Хараката Абу аль-Асвада отличалась от системы, которую мы знаем сегодня. В системе использовались красные точки, где каждое расположение или позиция обозначали разные короткие гласные.

Точка над буквой обозначала гласную а , точка внизу обозначала гласную i , точка сбоку от буквы обозначала гласную u , а две точки обозначали танвин .

Однако в ранних рукописях Корана знаки гласных использовались не для каждой буквы, требующей их использования, а только для тех букв, где они были необходимы для правильного чтения.

Система Аль Фарахиди [ править ]

Предшественником системы, которую мы знаем сегодня, является система Аль Фарахиди. аль-Фарахиди обнаружил, что задача письма двумя разными цветами была утомительной и непрактичной. Еще одна сложность заключалась в том, что к тому времени был введен иджам , который, хотя и представлял собой короткие штрихи, а не круглые точки, наблюдаемые сегодня, означал, что без различия цвета их можно было спутать.

Соответственно, он заменил харакат маленькими надстрочными буквами: маленький алиф, йа и вав для коротких гласных, соответствующих долгим гласным, написанным этими буквами, маленький с(х)ин для шадда (близнецов), маленький ха' для хафифа (короткий согласный; больше не используется). Его система, по сути, та, которую мы знаем сегодня. [11]

Автоматическая диакритизация

Процесс автоматического восстановления диакритических знаков называется диакритизацией или диакритическим восстановлением. Полезно избегать двусмысленности в таких приложениях, как машинный перевод на арабский язык , преобразование текста в речь и поиск информации . Разработаны алгоритмы автоматической диакритизации. [12] [13] Для современного стандартного арабского языка современный алгоритм имеет коэффициент ошибок в словах (WER) 4,79%. Наиболее распространенными ошибками являются имена собственные и падежные окончания . [14] Подобные алгоритмы существуют и для других разновидностей арабского языка . [15]

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б с Карин К. Райдинг, «Справочная грамматика современного стандартного арабского языка», Cambridge University Press, 2005, стр. 25-34, а именно «Глава 2, Раздел 4: Гласные»
  2. ^ Анатоль Лёвин, Бретт Кесслер, Уильям Рональд Лебен, «Введение в языки мира», «5.6 Очерк современного стандартного арабского языка», Oxford University Press, 2017, стр. 255, издание 2, в частности «5.6.2.2 Гласные».
  3. ^ Амин Бушентуф, Арабский язык для чайников®, John Wiley & Sons, 2018, 3-е издание, особенно раздел «Все о гласных»
  4. ^ Перейти обратно: а б «Введение в письменный арабский язык» . Университет Виктории, Канада .
  5. ^ «Заметки арабских символов» . р12а .
  6. ^ Ибн Варрак (2002). Ибн Варрак (ред.). Что на самом деле говорит Коран: язык, текст и комментарии . Перевод Ибн Варрака. Нью-Йорк: Прометей. п. 64. ИСБН  1-57392-945-Х . Архивировано из оригинала 11 апреля 2019 года . Проверено 9 апреля 2019 г.
  7. ^ Гацек, Адам (2009). «Неострые буквы» . Арабские рукописи: Путеводитель для читателей . БРИЛЛ. п. 286. ИСБН  978-90-04-17036-0 .
  8. ^ Гацек, Адам (1989). «Технические практики и рекомендации, записанные классическими и постклассическими арабскими учеными относительно копирования и исправления рукописей» (PDF) . В Дероше, Франсуа (ред.). Рукописи с Ближнего Востока: очерки по кодикологии и палеографии. Материалы Стамбульской конференции (Стамбул, 26–29 мая 1986 г.) . п. 57 (§ 8. Диакритические знаки и огласовки).
  9. ^ Перейти обратно: а б с д Священник Лорна А.; Хоскен, Мартин (10 августа 2010 г.). «Предложение о добавлении символов арабского письма для африканских и азиатских языков» (PDF) . Консорциум Юникод . Архивировано (PDF) из оригинала 8 октября 2022 года . Проверено 5 мая 2023 г.
  10. ^ Перейти обратно: а б с д Панди, Аншуман (27 октября 2015 г.). «Предложение закодировать сценарий ханифи рохинджа в Юникод» (PDF) . Консорциум Юникод . Архивировано (PDF) из оригинала 12 декабря 2019 года . Проверено 5 мая 2023 г.
  11. ^ Верстег, CHM (1997). Арабский язык . Издательство Колумбийского университета. стр. 56 и далее. ISBN  978-0-231-11152-2 .
  12. ^ Азми, Акил М.; Альмаджед, Рехам С. (10 октября 2013 г.). «Обзор автоматических техник арабской диакритизации» . Инженерия естественного языка . 21 (3): 477–495. дои : 10.1017/S1351324913000284 . ISSN   1351-3249 . S2CID   31560671 .
  13. ^ Алманеа, Манар (2021). «Автоматические методы и нейронные сети в диакритизации арабских текстов: комплексное исследование» . Доступ IEEE . 9 : 145012–145032. дои : 10.1109/ACCESS.2021.3122977 . ISSN   2169-3536 . S2CID   240011970 .
  14. ^ Томпсон, Брайан; Альшехри, Али (28 сентября 2021 г.). «Улучшение диакритизации арабского языка путем обучения диакритизации и переводу». arXiv : 2109.14150 [ cs.CL ].
  15. ^ Масмуди, Абир; Алулу, Чафик; Абделлахи, Абдель Гадер Сиди; Белгит, Ламия Хадрич (8 августа 2021 г.). «Автоматическая диакритизация текста тунисского диалекта с использованием модели SMT» . Международный журнал речевых технологий . 25 : 89–104. дои : 10.1007/s10772-021-09864-6 . ISSN   1572-8110 . S2CID   238782966 .
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: D1FCCB1C312DA52103A3E13F6D749AC7__1718116560
URL1:https://en.wikipedia.org/wiki/Arabic_diacritics
Заголовок, (Title) документа по адресу, URL1:
Arabic diacritics - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)