Диграф (орфография)

В валлийском языке диграф ⟨ll⟩ на время слился в лигатуру .

Диграф диграмма или либо (от древнегреческого : δίς dis , «двойной» и γράφω gráphō , «писать») — это пара символов, используемых в для написания орфографии языка одной фонемы (отдельного звука), либо последовательность фонем, которая не соответствует нормальным значениям двух объединенных символов.

Некоторые диграфы представляют фонемы, которые не могут быть представлены одним символом в системе письма языка, например sh в английском языке Ship и Fish . Другие диграфы представляют фонемы, которые также могут быть представлены отдельными символами. Диграф, произношение которого совпадает с одним символом, может быть пережитком более раннего периода языка, когда диграф имел другое произношение, или может представлять собой различие, которое проводится только в определенных диалектах , например английском wh . Некоторые такие орграфы используются чисто по этимологическим причинам, например rh в английском языке.

В некоторых орфографиях орграфы (а иногда и триграфы ) считаются отдельными буквами , а это означает, что они имеют собственное место в алфавите и не могут быть разделены на составляющие их места графемы при сортировке , сокращении или расстановке переносов слов. Диграфы используются в некоторых латинизации схемах , например, ⟨ zh как латинизация русского ж .

Заглавные буквы орграфов могут различаться, например, ⟨ch⟩ на английском языке пишется с заглавной буквы ⟨Ch⟩ , а ⟨kj⟩ на норвежском языке пишется с заглавной буквы ⟨Kj⟩ , а ij на голландском языке пишется с заглавной буквы ⟨IJ⟩ , а начальная буква слова ⟨dt⟩ на ирландском языке с заглавной буквы ⟨dT⟩ .

Диграфы могут превращаться в лигатуры , но это отдельная концепция: лигатура предполагает графическое слияние двух символов в один, например, когда ⟨o⟩ и ⟨e⟩ становятся ⟨œ⟩ , например, как во французском cœur «сердце».

Двойные буквы [ править ]

Орграфы могут состоять из двух разных символов (неоднородные орграфы) или двух экземпляров одного и того же символа (однородные орграфы). В последнем случае их обычно называют двойными (или сдвоенными ) буквами .

Двойные гласные буквы обычно используются для обозначения долгого гласного звука. Так обстоит дело в финском и эстонском языках , например, , где ⟨uu⟩ представляет собой более длинную версию гласной, обозначаемой ⟨u⟩ , ⟨ää⟩ представляет собой более длинную версию гласной, обозначаемой ⟨ä⟩ , и так далее. В среднеанглийском языке последовательности ⟨ee⟩ и ⟨oo⟩ использовались аналогичным образом для обозначения удлиненных звуков «e» и «o» соответственно; оба написания были сохранены в современной английской орфографии , но Большой сдвиг гласных и другие исторические звуковые изменения означают, что современное произношение сильно отличается от оригинального.

Двойные согласные буквы также могут использоваться для обозначения долгого или удвоенного согласного звука. В итальянском языке , например, согласные, написанные двойно, произносятся дольше, чем одиночные. Это было первоначальное использование удвоенных согласных букв в древнеанглийском языке , но в период среднеанглийского и раннего современного английского длина фонематических согласных была потеряна, и было разработано соглашение о написании, в котором удвоенная согласная служит для обозначения того, что должна произноситься предыдущая гласная. короткий. Например, в современном английском языке звук ⟨pp⟩ при постукивании отличает первый гласный звук от звука при постукивании . В редких случаях удвоенные согласные буквы представляют собой настоящую близнецовую согласную в современном английском языке; это может произойти, когда два экземпляра одной и той же согласной происходят от разных морфем , например, ⟨nn⟩ в неестественном ( un + natural ) или ⟨tt⟩ в рогозе ( cat + Tail ).

В некоторых случаях звук, представленный двойной согласной буквой, отличается от звука соответствующей одинарной согласной буквы не только по длине:

В нескольких европейских системах письма, включая английскую, удвоение буквы ⟨c⟩ или ⟨k⟩ представлено как гетерогенный диграф ⟨ck⟩ вместо ⟨cc⟩ или ⟨kk⟩ соответственно. В родных немецких словах удвоение ⟨z⟩ , соответствующее /ts/ , заменяется орграфом ⟨tz⟩ .

Пандиалектические орграфы [ править ]

Некоторые языки имеют единую орфографию с диграфами, которые представляют собой разные произношения на разных диалектах ( диафонемы ). Например, в бретонском языке есть орграф ⟨zh⟩ , который обозначает [z] в большинстве диалектов, но [h] в Ваннетаисе. Точно так же в диалекте французского языка Сентонге есть орграф ⟨jh⟩ , который представляет [h] в словах, которые соответствуют [ʒ] в стандартном французском языке. Точно так же в каталонском языке есть диграф ⟨ix⟩ , который представляет [ʃ] в восточно-каталонском языке , но [jʃ] или [js] в западно-каталанском валенсийском языке .

Разделить орграфы [ править ]

Пара букв, составляющих фонему, не всегда находится рядом. Так обстоит дело с английским молчаливым e . Например, последовательность a_e имеет звук /eɪ/ в английском торте . Это результат трех исторических звуковых изменений: торт изначально назывался /kakə/ , открытый слог /ka/ стал произноситься с долгой гласной , а позже конечная шва исчезла, оставив /kaːk/ . Еще позже гласная /aː/ стала /eɪ/ . В английском языке таких орграфов шесть: ⟨a_e, e_e, i_e, o_e, u_e, y_e⟩ . [1]

Однако алфавиты также могут быть разработаны с прерывистыми орграфами. В татарской кириллице , например, буква ю используется для написания как /ju/, так и /jy/ . Обычно разница очевидна по остальной части слова, но когда это не так, последовательность ю...ь используется для /jy/ , как в юнь /jyn/ «дешево».

Индийские алфавиты отличаются прерывистыми гласными, например, тайский เ...อ /ɤː/ в เกอ /kɤː/ . Однако технически их можно считать диакритическими знаками , а не полными буквами; Таким образом, вопрос о том, являются ли они орграфами, является вопросом определения.

Неоднозначные последовательности букв [ править ]

Некоторые пары букв не следует интерпретировать как орграфы, а появляются из- соединения : hogshead исотрудничество за . Они часто никак не помечаются, поэтому их следует запомнить как исключения. Некоторые авторы, однако, указывают на это либо разбивая диграф дефисом , как в hogs-head , сотрудничать , либо знаком тремы , как в сотрудничать , но использование диаэрезиса в английском языке в последнее время сократилось. век. Когда оно встречается в таких именах, как Клэпхэм , Тауншенд и Хартсхорн, оно никогда не отмечается каким-либо образом. Позиционные альтернативные глифы могут помочь устранить неоднозначность в определенных случаях: когда округлый, ⟨s⟩ использовался как окончательный вариант длинного ⟨ſ⟩ , а английский диграф для /ʃ/ всегда будет ⟨ſh⟩ .

При латинизации японского языка составляющие звуки ( мораэ ) обычно обозначаются диграфами, но некоторые обозначаются одной буквой, а некоторые — триграфом. Случай двусмысленности — это слоговое письмо , которое пишется как n (или иногда m ), за исключением гласных или y , где за ним следует апостроф как n' . Например, имя じゅんいちろう латинизируется как Дзюнъитиро, так что оно анализируется как «Дзюн-и-чи-ру», а не как «Дзю-ни-чи-ру». Аналогичное использование апострофа наблюдается в пиньинь , где 嫦娥 пишется Чанъэ, ​​потому что g принадлежит последнему (-анг) первому слогу, а не началу второго слога. Без апострофа «Изменение» можно было бы понимать как слог чан (конечный -ан), за которым следует слог ге (начальный г-).

В алфавитном порядке [ править ]

В некоторых языках определенные орграфы и триграфы сами по себе считаются отдельными буквами и присваиваются определенному месту в алфавите , отдельному от последовательности символов, из которых они состоят, в целях орфографии и сопоставления . Например:

В большинстве других языков, включая английский, французский, немецкий, польский и т. д., орграфы рассматриваются как комбинации отдельных букв для целей алфавитизации.

Примеры [ править ]

Латинская письменность [ править ]

английский [ править ]

В английском языке есть как однородные орграфы (двойные буквы), так и гетерогенные орграфы (орграфы, состоящие из двух разных букв). К последнему типу относятся следующие:

Диграфы также могут состоять из гласных. Некоторые буквы ⟨a, e, o⟩ предпочтительны для первой позиции, другие — для второй ⟨i, u⟩ . Последние имеют аллографы ⟨y, w⟩ в английской орфографии .

Английские вокальные диграфы
вторая буква →
первая буква ↓
⟨...и⟩ ⟨...я⟩ ¦ ⟨...й⟩ ⟨...u⟩ ¦ ⟨...w⟩ ⟨...а⟩ ⟨...the⟩
⟨...⟩ ⟨oe¦œ⟩ > ⟨e⟩ /i/ ⟨oi¦oy⟩ /ɔɪ/ ⟨ou¦ow⟩ /aʊ¦uː¦oʊ/ ⟨oa⟩ /oʊ¦ɔː/ ⟨oo⟩ /uː¦ʊ(¦ʌ)/
⟨а...⟩ ⟨ae¦æ⟩ > ⟨e⟩ /i/ ⟨ai¦ay⟩ /eɪ¦ɛ/ ⟨au¦aw⟩ /ɔː/
(в заимствованиях: /aʊ/ )
(заимствованные слова и имена собственные: ⟨aa⟩ /ə¦ɔː¦ɔl/ ) (заимствования из китайского: ⟨ao⟩ /aʊ/ )
⟨и...⟩ ⟨ee⟩ - /iː/ ⟨ei¦ey⟩ /aɪ¦eɪ¦(iː)/ ⟨eu¦ew⟩ /juː¦uː/ ⟨ea⟩ /iː¦ɛ¦(eɪ¦ɪə)/
⟨в...⟩ ⟨ue⟩ /uː¦u/ ⟨ui⟩ /ɪ¦uː/
⟨я...⟩ ⟨ie⟩ /iː(¦aɪ)/

Другие языки, использующие латинский алфавит [ править ]

На сербско-хорватском языке :

Обратите внимание, что в кириллической орфографии эти звуки представлены одиночными буквами (љ, њ, џ).

На чешском и словацком языках :

На датском и норвежском :

  • Диграф aa представлял /ɔ/ до 1917 года в Норвегии и 1948 года в Дании, но сегодня пишется å . Диграф по-прежнему используется в старых именах, но сортируется так, как если бы это была буква с диакритическим знаком.

В норвежском языке некоторые звуки могут быть представлены только орграфом или сочетанием букв. Это наиболее распространенные комбинации, но существуют крайние региональные различия, особенно в восточных диалектах . Примечательным отличием является ⟨rs⟩ в ⟨skj⟩ восточных диалектах, где оно соответствует ⟨sj⟩ и стремление . Среди многих молодых людей, особенно в западных регионах Норвегии, а также в крупных городах или вокруг них, разница между / ç / и / ʃ / полностью стерта, и теперь они произносятся одинаково.

  • ⟨kj⟩ представляет собой /ç/
  • ⟨tj⟩ представляет собой /ç/ .
  • ⟨skj⟩ представляет собой /ʃ/ .
  • ⟨sj⟩ представляет /ʃ/ .
  • ⟨sk⟩ представляет собой /ʃ/ (перед i или y).
  • ng представляет собой /ŋ/, в языке английском ng . как

На каталанском :

На голландском :

По -французски :

Французские вокальные диграфы
⟨...я⟩ ⟨...в⟩
⟨а...⟩ ⟨ai⟩ /ɛ¦e/ ⟨au⟩ /о/
⟨и...⟩ ⟨ei⟩ /ɛ/ ⟨eu⟩ /œ¦ø/
⟨...⟩ ⟨oi⟩ /ва/ ⟨ou⟩ /u(¦w)/

См. также французскую фонологию .

По -немецки :

На венгерском :

По -итальянски :

В мэнском гэльском языке ⟨ch⟩ представляет / χ/ , а ⟨çh⟩ представляет /tʃ/ .

По -польски :

На португальском :

На испанском :

  • ⟨ll⟩ традиционно (но сейчас обычно нет) произносится /ʎ/
  • ⟨ch⟩ представляет собой /tʃ/ ( глухой постальвеолярный аффрикат ). С 2010 года ни один из них не считается частью алфавита. Раньше они сортировались как отдельные буквы, но реформа, проведенная в 1994 году Испанской королевской академией, позволила разделить их на составляющие буквы для сопоставления. Диграф rr , произносимый как отдельная альвеолярная трель , никогда официально не считался буквой испанского алфавита, и то же самое верно для ⟨gu⟩ и ⟨qu⟩ (для /ɡ/ и /k/ соответственно до ⟨ е⟩ или ⟨i⟩ ).

На валлийском :

Перечисленные выше орграфы представляют собой отдельные фонемы и для целей сопоставления рассматриваются как отдельные буквы. С другой стороны, диграфы mh , nh и триграф ngh , которые обозначают глухие согласные , но встречаются только в начале слов в результате носовой мутации. [ необходимо уточнение ] , не рассматриваются как отдельные буквы и поэтому не включаются в алфавит.

Daighi tongiong pingim , система транскрипции, используемая для тайваньского хоккиена , включает или представляет /ə/ ( средняя центральная гласная ) или /o/ ( закругленная гласная ближней середины спины ), а также другие диграфы.

В Йорубе :

  • ⟨gb⟩ — это алфавит, и взрывное слово наиболее точно произносится, если попытаться произнести /g/ и /b/ одновременно.

Кириллица [ править ]

В современных славянских языках, написанных кириллицей, мало используются диграфы, за исключением ⟨дж⟩ для / dʐ/ , ⟨дз⟩ для / dz/ (на украинском, белорусском и болгарском языках), а также ⟨жж⟩ и ⟨зж⟩ для необычная русская фонема /ʑː/ . В русском языке последовательности ⟨дж⟩ и ⟨дз⟩ встречаются (в основном в заимствованных словах), но произносятся как комбинации имплозивного звука (иногда рассматриваемого как аффриката) и фрикативного звука; имплозивные элементы рассматриваются как аллофоны взрывного звука /d̪/, и поэтому эти последовательности не считаются орграфами. В кириллице мало диграфов, если только она не используется для написания неславянских языков, особенно кавказских языков .

Арабское письмо [ править ]

Поскольку гласные обычно не пишутся, диграфы в абджадах, таких как арабский, встречаются редко. Например, если sh вместо š используется , то последовательность sh может означать либо ša , либо саха. Однако диграфы используются для придыхательных и шепотных согласных (те, которые пишутся с диграфами h в латинской транскрипции) в языках Южной Азии, таких как урду , которые написаны арабским письмом с помощью особой формы буквы h , которая используется только для диграфов стремления, как это видно по следующим соединительным (kh) и несоединяющим (ḍh) согласным:

Урду подключение  не соединяющий
диграф: есть /kʰɑː/ Дха /ɖʱɑː/
последовательность: сказал /kəɦɑː/ 100 /ɖəɦɑː/

Армянский [ править ]

В армянском языке диграф ու ⟨ou⟩ транскрибирует / u / , условность, пришедшую из греческого языка.

грузинский [ править ]

Грузинский алфавит использует несколько орграфов для написания других языков. Например, на / сванском ø/ пишется ჳე ⟨we⟩ , а /y/ как ჳი ⟨wi⟩ .

греческий [ править ]

В современном греческом языке есть следующие орграфы:

  • αι ( ai ) представляет /e̞/
  • ei ( ei ) представляет /i/
  • οι ( oi ) представляет собой /i/
  • ou ( ой ) представляет /u/
  • υι ( yi ) представляет /i/

они называются «дифтонгами» По- гречески ; в классические времена большинство из них представляли собой дифтонги , и это название прижилось.

  • γγ ( gg ) представляет собой /ŋɡ/ или /ɡ/
  • τσ ( ts ) представляет собой аффрикат /ts/
  • τζ ( tz ) представляет собой аффрикат /dz/
  • Начальный γκ ( gk ) представляет собой /ɡ/
  • Начальный μπ ( mp ) представляет /b/
  • Начальный ντ ( nt ) представляет /d/

В древнегреческом языке также были перечисленные выше «дифтонги», хотя их произношение в древние времена оспаривается. Кроме того, в древнегреческом языке также использовалась буква γ в сочетании с велярной остановкой для создания следующих орграфов:

  • γγ ( gg ) представляет собой /ŋɡ/
  • γκ ( gk ) представляет собой /ŋɡ/
  • γχ ( gkh ) представляет собой /ŋkʰ/

У Цаконяна есть несколько дополнительных диграфов:

  • ρζ ( rz ) /ʒ/ (исторически возможно, фрикативная трель )
  • κχ ( kkh ) представляет /kʰ/
  • τθ ( tth ) представляет собой /tʰ/
  • πφ ( pph ) представляет собой /pʰ/
  • σχ ( сх ) представляет /ʃ/

Кроме того, небные согласные обозначаются гласной буквой ι , что, впрочем, во многом предсказуемо. Когда /n/ и /l/ не палатализованы перед ι , они записываются νν и λλ .

В бактрийском языке орграфы ββ , δδ и γγ использовались для /b/ , /d/ и /ŋg/ соответственно.

иврит [ править ]

В алфавите еврейском תס ‎ и תש ‎ иногда можно встретить для צ ‎ / ц / . В современном иврите также используются орграфы, составленные с помощью Символ ׳ ‎ для неродных звуков: С / дʒ / , Г / ʒ / , צ׳ ‎ / тʃ / ; и другие орграфы букв, написанные без гласных: וו ‎ для согласной буквы ו ‎ в середине слова, и יי ‎ для /aj/ или /aji/ и т. д., то есть согласная буква י ‎ в местах, где этого можно было не ожидать. Идиш имеет свою собственную традицию транскрипции, поэтому для некоторых одних и тех же звуков используются разные орграфы: дз / дз / / / ʒ / , Теш ‎ / / и J (буквально dzš ) для / / , וו ‎ / v / также доступен в виде одного Юникода . символа В , וי ‎ или как отдельный символ в Юникоде וי ‎ / ой/ , יי ‎ или / эй / и ײַ ‎ / aj/ . Односимвольные орграфы называются в Юникоде « лигатурами ». י ‎ также может использоваться после согласной для обозначения палатализации в славянских заимствованных словах.

Индийский [ править ]

В большинстве индийских письменностей сложных гласных есть диакритические знаки , которые невозможно предсказать на основе их отдельных элементов. Это можно проиллюстрировать на примере тайского языка , где диакритический знак เ, произносимый отдельно /eː/ , изменяет произношение других гласных:

знак одиночной гласной: чайник / каː/ , О /кеː/ , комок /kɔː/
знак гласной плюс: царапать /закрыто/ , для /kɛː/ , Ну и дела /kɤː/

Кроме того, сочетание รร произносится /a/ или /an/ , есть слова, в которых сочетания ทร и ศร обозначают /s/, а буква ห как приставка к согласной меняет свой тонический класс на высокий, изменяющий тон слога.

Инуиты [ править ]

Слоговое письмо инуктитут добавляет к кри два орграфа:

рк для q
qai , ᕿ qi , ᖁ qu , ᖃ qa , ᖅ q

и

ŋ для нг
нг

Последний образует триграфы и тетраграфы.

Персонажи CJK [ править ]

китайский [ править ]

Несколько комбинаций китайских иероглифов (ханзи), образованных из двух или более разных иероглифов, называются диграфами.

японский [ править ]

Две каны могут быть объединены в путем слог CV добавления второго индекса; соглашение отменяет первую гласную. Обычно это делается для CyV слогов , называемых yōon , например ひょ (ひ ) hyo ⟨hi yo . Они не являются орграфами, поскольку сохраняют нормальное последовательное чтение двух символов. Однако некоторые устаревшие последовательности больше не сохраняют это чтение, например, くゎ kwa, ぐゎ gwa и むゎ mwa, которые теперь произносятся как ka, ga, ma . Кроме того, несеквенируемые орграфы используются для иностранных займов, которые не соответствуют обычным японским образцам ассибиляции , например ティ ti , トゥ tu , チェ tye/che , スェ swe , ウィ wi , ツォ tso , ズィ zi . (Полные таблицы см. в катакане и транскрипции на японский язык .)

Долгие гласные записываются путем добавления к этой гласной каны, что фактически удваивает ее. Однако длинный ō может писаться как oo , так и ou , как в とうきょう toukyou [toːkʲoː] 'Tōkyō'. В диалектах, которые не различают ē и ei , последнее написание используется для длинного e , как в へいせい heisei [heːseː] ' Heisei '. В заимствованных словах chōonpu — строка, следующая за направлением текста, например ビール bīru [bi:ru] bīru «пиво». За исключением слогов, начинающихся с буквы n , удвоенные согласные звуки записываются с добавлением уменьшенной версии цу (написанной っ и ッ в хирагане и катакане соответственно), как в きって kitte «штамп». Согласные, начинающиеся с n, вместо этого используют символ кана n (пишется ん или ン) в качестве префикса.

Существует несколько условных обозначений окинавской каны , в которых используются подстрочные диграфы или лигатуры. Например, в системе Университета Рюкю ウ — это /ʔu/ , ヲ — /o/ , но ヲゥ (ヲ ) — /u/ .

корейский [ править ]

Как и в греческом языке, в корейском языке гласные произошли от дифтонгов, которые до сих пор пишутся двумя буквами. Эти диграфы ㅐ /ɛ/ и ㅔ /e/ (также ㅒ /jɛ/ , ㅖ /je/ ), а в некоторых диалектах ㅚ /ø/ и ㅟ /y/ оканчиваются на исторический ㅣ /i/ .

Хангыль был разработан с серией орграфов для обозначения « мутных » согласных: ㅃ *[b] , ㄸ *[d] , ㅉ *[dz] , ㄲ *[ɡ] , ㅆ *[z] , ㆅ *[ɣ] ; также ᅇ, с неопределенным значением. Эти значения сейчас устарели, но большинство удвоенных букв были возрождены в 19 веке для написания согласных, которых не существовало на момент изобретения хангыля: ㅃ /p͈/ , ㄸ /t͈/ , ㅉ /t͈ɕ/ , ㄲ /k͈/ , ㅆ /с͈/ .

Лигатуры и новые буквы [ править ]

Диграфы иногда пишутся одной лигатурой. Со временем лигатуры могут превратиться в новые буквы или буквы с диакритическими знаками. Например, sz в немецком языке превратилось в ß , а «nn» превратилось в ñ в испанском .

В Юникоде [ править ]

орграф просто представляется двумя символами Обычно в Юникоде . [2] Однако по разным причинам Unicode иногда предоставляет отдельную кодовую точку для орграфа, закодированную как один символ.

Диграфы DZ и IJ , а также сербско-хорватские диграфы DŽ, LJ и NJ имеют отдельные кодовые точки в Юникоде.

Два глифа Диграф Кодовая точка Юникода HTML
ДЗ, Дз, дз й, й, й U+01F1 U+01F2 U+01F3 DZ Dz dz
Дж, Дж, Дж й, й, й U+01C4 U+01C5 U+01C6 DŽ Dž dž
эй, эй IJ, ij U + 0132 U + 0133 IJ ij
ЭлДжей, ЭлДжей, ЭлДжей Ё, Ё, Ё U + 01C7 U + 01C8 U + 01C9 LJ Lj lj
Нью-Джерси, Нью-Джерси, Нью-Джерси Й, Й, Й U+01CA U+01CB U+01CC NJ Nj nj
й U + 1D7A [3]

См. также Лигатуры в Юникоде .

См. также [ править ]

Ссылки [ править ]

  1. ^ Брукс (2015) Словарь орфографической системы британского английского языка, стр. 460 и далее
  2. ^ «Часто задаваемые вопросы – лигатуры, орграфы и формы представления» . Консорциум Unicode: домашняя страница . Юникод Инк . 1991–2009 гг . Проверено 11 мая 2009 г.
  3. ^ «Стандарт Юникод, версия 15.1» (PDF) . Юникод . Проверено 20 декабря 2023 г.