Диграф (орфография)

Из Википедии, бесплатной энциклопедии
В валлийском языке диграф ⟨ll⟩ в на время слился лигатуру .

Диграф диграмма или , (от древнегреческого : δίς dis , «двойной» и γράφω gráphō ) — это пара символов используемых в орфографии языка , «писать » для написания либо одной фонемы (отдельного звука), либо последовательность фонем, которая не соответствует нормальным значениям двух объединенных символов.

Некоторые диграфы представляют фонемы, которые не могут быть представлены одним символом в системе письма языка, например sh в английском языке Ship и Fish . Другие диграфы представляют фонемы, которые также могут быть представлены отдельными символами. Диграф, произношение которого совпадает с одним символом, может быть пережитком более раннего периода языка, когда диграф имел другое произношение, или может представлять собой различие, которое проводится только в определенных диалектах , например английском wh . Некоторые такие орграфы используются чисто по этимологическим причинам, например rh в английском языке.

В некоторых орфографиях орграфы (а иногда и триграфы ) считаются отдельными буквами , а это означает, что они имеют собственное место в алфавите и не могут быть разделены на составляющие их места графемы при сортировке , сокращении или расстановке переносов слов. Диграфы используются в некоторых латинизации схемах , например, ⟨ zh как латинизация русского ж .

Заглавные буквы орграфов могут варьироваться, например, ⟨ch⟩ на английском языке пишется с заглавной буквы ⟨Ch⟩ , а ⟨kj⟩ на норвежском языке пишется с заглавной буквы ⟨Kj⟩ , а ij на голландском языке пишется с заглавной буквы ⟨IJ⟩ , а начальная буква слова ⟨dt⟩ на ирландском языке с заглавной буквы ⟨dT⟩ .

Диграфы могут превращаться в лигатуры , но это отдельная концепция: лигатура предполагает графическое слияние двух символов в один, например, когда ⟨o⟩ и ⟨e⟩ становятся ⟨œ⟩ , например, как во французском cœur «сердце».

Двойные буквы [ править ]

Орграфы могут состоять из двух разных символов (неоднородные орграфы) или двух экземпляров одного и того же символа (однородные орграфы). В последнем случае их обычно называют двойными (или сдвоенными ) буквами .

Двойные гласные буквы обычно используются для обозначения долгого гласного звука. Так обстоит дело, в финском и эстонском языках например, , где ⟨uu⟩ представляет собой более длинную версию гласной, обозначаемой ⟨u⟩ , ⟨ää⟩ представляет собой более длинную версию гласной, обозначаемой ⟨ä⟩ , и так далее. В среднеанглийском языке последовательности ⟨ee⟩ и ⟨oo⟩ использовались аналогичным образом для обозначения удлиненных звуков «e» и «o» соответственно; оба написания были сохранены в современной английской орфографии , но Большой сдвиг гласных и другие исторические звуковые изменения означают, что современное произношение сильно отличается от оригинального.

Двойные согласные буквы также могут использоваться для обозначения долгого или удвоенного согласного звука. В итальянском языке , например, согласные, написанные двойно, произносятся дольше, чем одинарные. Это было первоначальное использование удвоенных согласных букв в древнеанглийском языке , но в период среднеанглийского и раннего современного английского длина фонематических согласных была потеряна, и было разработано соглашение о написании, в котором удвоенная согласная служит для обозначения того, что должна произноситься предыдущая гласная. короткий. Например, в современном английском языке звук ⟨pp⟩ при постукивании отличает первый гласный звук от звука при постукивании . В редких случаях удвоенные согласные буквы представляют собой настоящую близнецовую согласную в современном английском языке; это может произойти, когда два экземпляра одной и той же согласной происходят от разных морфем , например, ⟨nn⟩ в неестественном ( un + natural ) или ⟨tt⟩ в рогозе ( cat + Tail ).

В некоторых случаях звук, представленный двойной согласной буквой, отличается от звука соответствующей одинарной согласной буквы не по длине, а по-другому:

В нескольких европейских системах письма, включая английскую, удвоение буквы ⟨c⟩ или ⟨k⟩ представлено как гетерогенный орграф ⟨ck⟩ вместо ⟨cc⟩ или ⟨kk⟩ соответственно. В родных немецких словах удвоение ⟨z⟩ , соответствующее /ts/ , заменяется орграфом ⟨tz⟩ .

- орграфы Пан диалектические

Некоторые языки имеют единую орфографию с диграфами, которые представляют собой разные произношения на разных диалектах ( диафонемы ). Например, в бретонском языке есть орграф ⟨zh⟩ , который обозначает [z] в большинстве диалектов, но [h] в Ваннетаисе. Точно так же в диалекте французского языка Сентонге есть орграф ⟨jh⟩ , который представляет [h] в словах, которые соответствуют [ʒ] в стандартном французском языке. Точно так же в каталонском языке есть диграф ⟨ix⟩ , который представляет [ʃ] в восточно-каталонском языке , но [jʃ] или [js] в западно-каталонском валенсийском языке .

Разделить орграфы [ править ]

Пара букв, составляющих фонему, не всегда находится рядом. Так обстоит дело с английским молчаливым e . Например, последовательность a_e имеет звук /eɪ/ в английском торте . Это результат трех исторических звуковых изменений: торт изначально назывался /kakə/ , открытый слог /ka/ стал произноситься с долгой гласной , а позже конечная шва исчезла, оставив /kaːk/ . Еще позже гласная /aː/ стала /eɪ/ . В английском языке шесть таких орграфов: ⟨a_e, e_e, i_e, o_e, u_e, y_e⟩ . [1]

Однако алфавиты также могут быть разработаны с прерывистыми орграфами. В татарской кириллице , например, буква ю используется для написания как /ju/, так и /jy/ . Обычно разница очевидна по остальной части слова, но когда это не так, последовательность ю...ь используется для /jy/ , как в юнь /jyn/ «дешево».

Индийские алфавиты отличаются прерывистыми гласными, например, тайский เ...อ /ɤː/ в เกอ /kɤː/ . Однако технически их можно считать диакритическими знаками , а не полными буквами; Таким образом, вопрос о том, являются ли они орграфами, является вопросом определения.

Неоднозначные последовательности букв [ править ]

Некоторые пары букв не следует интерпретировать как орграфы, а появляются из- соединения : hogshead исотрудничество за . Они часто никак не помечаются, поэтому их следует запомнить как исключения. Некоторые авторы, однако, указывают на это либо разбивая диграф дефисом , как в hogs-head , сотрудничать , либо знаком тремы , как в сотрудничать , но использование диаэрезиса в английском языке за последнее время сократилось. век. Когда оно встречается в таких именах, как Клэпхэм , Тауншенд и Хартсхорн, оно никогда не отмечается каким-либо образом. Позиционные альтернативные глифы могут помочь устранить неоднозначность в определенных случаях: когда округлый, ⟨s⟩ использовался как окончательный вариант длинного ⟨ſ⟩ , а английский диграф для /ʃ/ всегда будет ⟨ſh⟩ .

При латинизации японского языка составляющие звуки ( мораэ ) обычно обозначаются диграфами, но некоторые обозначаются одной буквой, а некоторые — триграфом. Случаем двусмысленности является слоговое письмо , которое пишется как n (или иногда m ), за исключением гласных или y , где за ним следует апостроф как n' . Например, имя じゅんいちろう латинизируется как Дзюнъитиро, так что оно анализируется как «Дзюн-и-чи-ру», а не как «Дзю-ни-чи-ру». Аналогичное использование апострофа наблюдается в пиньинь , где 嫦娥 пишется Чанъэ, ​​потому что g принадлежит последнему (-анг) первому слогу, а не началу второго слога. Без апострофа «Изменение» можно было бы понимать как слог чан (конечный -ан), за которым следует слог ге (начальный г-).

В алфавитном порядке [ править ]

В некоторых языках определенные орграфы и триграфы сами по себе считаются отдельными буквами и присваиваются определенному месту в алфавите , отличному от места последовательности символов, из которых они состоят, в целях орфографии и сопоставления . Например:

В большинстве других языков, включая английский, французский, немецкий, польский и т. д., орграфы для целей алфавитизации рассматриваются как комбинации отдельных букв.

Примеры [ править ]

Латинская письменность [ править ]

английский [ править ]

В английском языке есть как однородные орграфы (двойные буквы), так и гетерогенные орграфы (орграфы, состоящие из двух разных букв). К последнему типу относятся следующие:

Диграфы также могут состоять из гласных. Некоторые буквы ⟨a, e, o⟩ предпочтительны для первой позиции, другие — для второй ⟨i, u⟩ . Последние имеют аллографы ⟨y, w⟩ в английской орфографии .

Английские вокальные диграфы
вторая буква →
первая буква ↓
⟨...Это⟩ ⟨...я⟩ ¦ ⟨...й⟩ ⟨...u⟩ ¦ ⟨...w⟩ ⟨...а⟩ ⟨...О⟩
⟨О...⟩ ⟨oe¦œ⟩ > ⟨e⟩ /i/ ⟨oi¦oy⟩ /ɔɪ/ ⟨ou¦ow⟩ /aʊ¦uː¦oʊ/ ⟨oa⟩ /oʊ¦ɔː/ ⟨oo⟩ /uː¦ʊ(¦ʌ)/
⟨а...⟩ ⟨ae¦æ⟩ > ⟨e⟩ /i/ ⟨ai¦ay⟩ /eɪ¦ɛ/ ⟨au¦aw⟩ /ɔː/
(в заимствованиях: /aʊ/ )
(заимствованные слова и имена собственные: ⟨aa⟩ /ə¦ɔː¦ɔl/ ) (заимствования из китайского: ⟨ao⟩ /aʊ/ )
⟨Это...⟩ ⟨ee⟩ - /iː/ ⟨ei¦ey⟩ /aɪ¦eɪ¦(iː)/ ⟨eu¦ew⟩ /juː¦uː/ ⟨ea⟩ /iː¦ɛ¦(eɪ¦ɪə)/
⟨в...⟩ ⟨ue⟩ /uː¦u/ ⟨ui⟩ /ɪ¦uː/
⟨я...⟩ ⟨ie⟩ /iː(¦aɪ)/

Другие языки, использующие латинский алфавит [ править ]

На сербско-хорватском языке :

Обратите внимание, что в кириллической орфографии эти звуки представлены одиночными буквами (љ, њ, џ).

На чешском и словацком языках :

На датском и норвежском :

  • Диграф aa представлял собой /ɔ/ до 1917 года в Норвегии и 1948 года в Дании, но сегодня пишется å . Диграф по-прежнему используется в старых именах, но сортируется так, как если бы это была буква с диакритическим знаком.

В норвежском языке некоторые звуки могут быть представлены только орграфом или сочетанием букв. Это наиболее распространенные комбинации, но существуют крайние региональные различия, особенно в восточных диалектах . Примечательным отличием является стремление ⟨rs⟩ ⟨skj⟩ соответствует ⟨sj⟩ и в восточных диалектах, где оно . Среди многих молодых людей, особенно в западных регионах Норвегии, а также в крупных городах или вокруг них, разница между / ç / и / ʃ / полностью стерта, и теперь они произносятся одинаково.

  • ⟨kj⟩ представляет собой /ç/
  • ⟨tj⟩ представляет собой /ç/ .
  • ⟨skj⟩ представляет /ʃ/ .
  • ⟨sj⟩ представляет /
  • ⟨sk⟩ представляет собой /ʃ/ (перед i или y).
  • ng представляет собой /ŋ/, и ng английском языке как в .

На каталанском :

На голландском :

На французском :

Французские вокальные диграфы
⟨...я⟩ ⟨...в⟩
⟨а...⟩ ⟨ai⟩ /ɛ¦e/ ⟨au⟩ /о/
⟨Это...⟩ ⟨ei⟩ /ɛ/ ⟨eu⟩ /œ¦ø/
⟨О...⟩ ⟨oi⟩ /ва/ ⟨ou⟩ /u(¦w)/

См. также французскую фонологию .

На немецком :

На венгерском :

По -итальянски :

В мэнском гэльском языке ⟨ch⟩ представляет / χ/ , а ⟨çh⟩ представляет /tʃ/ .

На польском :

На португальском :

На испанском :

  • ⟨ll⟩ традиционно (но сейчас обычно нет) произносится /ʎ/
  • ⟨ch⟩ представляет собой /tʃ/ ( глухой постальвеолярный аффрикат ). С 2010 года ни один из них не считается частью алфавита. Раньше они сортировались как отдельные буквы, но реформа, проведенная в 1994 году Испанской королевской академией, позволила разделить их на составляющие буквы для сопоставления. Диграф rr , произносимый как отдельная альвеолярная трель , никогда официально не считался буквой испанского алфавита, и то же самое верно для ⟨gu⟩ и ⟨qu⟩ (для /ɡ/ и /k/ соответственно до ⟨ е⟩ или ⟨i⟩ ).

На валлийском :

Перечисленные выше орграфы представляют собой отдельные фонемы и для целей сопоставления рассматриваются как отдельные буквы. С другой стороны, орграфы mh , nh и триграф ngh , которые обозначают глухие согласные , но встречаются только в начале слов в результате носовой мутации. [ необходимо уточнение ] , не рассматриваются как отдельные буквы и поэтому не включаются в алфавит.

Daighi tongiong pingim , система транскрипции, используемая для тайваньского хоккиена , включает или представляет /ə/ ( средняя центральная гласная ) или /o/ ( закругленная гласная ближней середины спины ), а также другие диграфы.

В Йорубе :

  • ⟨gb⟩ — это алфавит, и взрывное слово наиболее точно произносится, если попытаться произнести /g/ и /b/ одновременно.

Кириллица [ править ]

В современных славянских языках, написанных кириллицей, мало используются орграфы, за исключением ⟨дж⟩ для / dʐ/ , ⟨дз⟩ для / dz/ (на украинском, белорусском и болгарском языках), а также ⟨жж⟩ и ⟨зж⟩ для необычная русская фонема /ʑː/ . В русском языке последовательности ⟨дж⟩ и ⟨дз⟩ встречаются (в основном в заимствованных словах), но произносятся как комбинации имплозивного (иногда рассматриваемого как аффрикаты) и фрикативного звука; имплозивные элементы рассматриваются как аллофоны взрывного звука /d̪/, и поэтому эти последовательности не считаются орграфами. В кириллице мало диграфов, если только она не используется для написания неславянских языков, особенно кавказских .

Арабское письмо [ править ]

Поскольку гласные обычно не пишутся, диграфы в абджадах , таких как арабский, встречаются редко. Например, если sh вместо š используется , то последовательность sh может означать либо ša , либо саха. Однако диграфы используются для придыхательных и шепотных согласных (те, которые пишутся с диграфами h в латинской транскрипции) в языках Южной Азии, таких как урду , которые написаны арабским письмом с помощью особой формы буквы h , которая используется только для диграфов стремления, как это видно по следующим соединительным (kh) и несоединяющим (ḍh) согласным:

Урду подключение   не соединяющий
диграф: есть /kʰɑː/ Дха /ɖʱɑː/
последовательность: сказал /kəɦɑː/ 100 /ɖəɦɑː/

Армянский [ править ]

В армянском языке диграф ու ⟨ou⟩ транскрибирует / u / , условность, пришедшую из греческого языка.

грузинский [ править ]

Грузинский алфавит использует несколько орграфов для написания других языков. Например, на / сванском ø/ пишется ჳე ⟨we⟩ , а /y/ как ჳი ⟨wi⟩ .

греческий [ править ]

В современном греческом языке есть следующие орграфы:

  • αι ( ai ) представляет /e̞/
  • ει ( ei ) представляет /i/
  • οι ( oi ) представляет собой /i/
  • ou ( ой ) представляет /u/
  • υι ( yi ) представляет /i/

они называются «дифтонги» По- гречески ; в классические времена большинство из них представляли собой дифтонги , и это название прижилось.

  • γγ ( gg ) представляет собой /ŋɡ/ или /ɡ/
  • τσ ( ts ) представляет собой аффрикат /ts/
  • τζ ( tz ) представляет собой аффрикат /dz/
  • Начальный γκ ( gk ) представляет /ɡ/
  • Начальный μπ ( mp ) представляет /b/
  • Начальный ντ ( nt ) представляет /d/

В древнегреческом языке также были перечислены выше «дифтонги», хотя их произношение в древние времена оспаривается. Кроме того, в древнегреческом языке также использовалась буква γ в сочетании с велярной остановкой для создания следующих орграфов:

  • γγ ( gg ) представляет собой /ŋɡ/
  • γκ ( gk ) представляет собой /ŋɡ/
  • γχ ( gkh ) представляет собой /ŋkʰ/

У Цаконяна есть несколько дополнительных диграфов:

  • ρζ ( rz ) /ʒ/ (исторически возможно, фрикативная трель )
  • κχ ( kkh ) представляет /kʰ/
  • τθ ( tth ) представляет собой /tʰ/
  • πφ ( pph ) представляет собой /pʰ/
  • σχ ( сх ) представляет /ʃ/

Кроме того, небные согласные обозначаются гласной буквой ι , что, впрочем, во многом предсказуемо. Когда /n/ и /l/ не палатализованы перед ι , они записываются νν и λλ .

В бактрийском языке орграфы ββ , δδ и γγ использовались для /b/ , /d/ и /ŋg/ соответственно.

иврит [ править ]

В еврейском алфавите תסи תש ‎ иногда можно встретить для צ ‎ / ц / . В современном иврите также используются орграфы, составленные с помощью Символ ׳ ‎ для неродных звуков: С / дʒ / , Г / ʒ / , צ׳ ‎ / тʃ / ; и другие орграфы букв, написанные без гласных: וו ‎ для согласной буквы ו ‎ в середине слова, и יי ‎ для /aj/ или /aji/ и т. д., то есть согласная буква י ‎ в местах, где этого можно было не ожидать. Идиш имеет свою собственную традицию транскрипции, поэтому для некоторых одних и тех же звуков используются разные орграфы: дз / дз / / / ʒ / , CH ‎ / / и J ‎ (буквально дзш ) для / / , וו ‎ / v / также доступен в виде одного Юникода. символа В , וי ‎ или как отдельный символ в Юникоде וי ‎ / ой/ , ייили ‎ / ej/ , и ײַ ‎ / aj/ . Односимвольные орграфы называются « лигатурами ». в Юникоде י ‎ также может использоваться после согласной для обозначения палатализации в славянских заимствованных словах.

Индийский [ править ]

В большинстве индийских письменностей сложных гласных есть диакритические знаки , которые невозможно предсказать на основе их отдельных элементов. Это можно проиллюстрировать на примере тайского языка , где диакритический знак เ, произносимый отдельно /eː/ , изменяет произношение других гласных:

знак одиночной гласной: чайник / каː/ , О /кеː/ , комок /kɔː/
знак гласной плюс: царапать /закрыто/ , для /kɛː/ , Ну и дела /kɤː/

Кроме того, сочетание รร произносится /a/ или /an/ , есть слова, в которых сочетания ทร и ศร обозначают /s/ , а буква ห как приставка к согласной меняет свой тонический класс на высокий, изменяющий тон слога.

намекнул [ править ]

Слоговое письмо инуктитут добавляет к кри два орграфа:

рк для q
qai , ᕿ qi , ᖁ qu , ᖃ qa , ᖅ q

и

из для ŋ
из

Последний образует триграфы и тетраграфы.

Персонажи CJK [ править ]

китайский [ править ]

Несколько комбинаций китайских иероглифов (ханзи), образованных из двух или более разных иероглифов, называются диграфами.

японский [ править ]

Две каны могут быть объединены в слог CV ; путем добавления второго индекса соглашение отменяет первую гласную. Обычно это делается для слогов , называемых yōon , например ひょ (ひよ ) hyo ⟨hi yo CyV Они не являются диграфами, поскольку сохраняют нормальное последовательное чтение двух символов. Однако некоторые устаревшие последовательности больше не сохраняют это чтение, например くゎ kwa, ぐゎ gwa и むゎ mwa, которые теперь произносятся как ka, ga, ma. Кроме того, несеквенируемые орграфы используются для иностранных займов, которые не соответствуют обычным японским образцам ассибиляции , например テ ti , ト tu , ェ /che , swe , swi , sūtso tye , sūzi . ( см. в катакане и переводе на японский язык Полные таблицы .)

Долгие гласные записываются добавлением каны к этой гласной, что фактически удваивает ее. Однако длинный ō может писаться как oo , так и ou , как в とうきょ うtoukyou [toːkōː] 'Tōkyō' В диалектах, которые не различают ē и ei , последнее написание используется для длинного e , как в へいせい heisei [heːseː] ' Heisei ' В заимствованных словах chōonpu — строка, следующая за направлением текста, например ビール bīru [bi:ru] bīru «пиво». За исключением слогов, начинающихся с буквы n , удвоенные согласные звуки записываются с добавлением уменьшенной версии цу (написанной っ и ッ в хирагане и катакане соответственно), как в きって kitte «штамп». Согласные, начинающиеся с n, вместо этого используют символ кана n (написанный ん или ン) в качестве префикса.

Существует несколько соглашений окинавского языка , в которых используются подстрочные диграфы или лигатуры. Например, в системе Университета Рюкю ウ — это /ʔu/ , ヲ — /o/ , а ヲゥ (ヲウ ) — /u /.

корейский [ править ]

Как и в греческом языке, в корейском языке гласные произошли от дифтонгов, которые до сих пор пишутся двумя буквами. Эти диграфы ㅐ /ɛ/ и ㅔ /e/ (также ㅒ /jɛ/ , ㅖ /je/ ), а в некоторых диалектах ㅚ /ø/ и ㅟ /y/ оканчиваются на исторический ㅣ /i/ .

Хангыль был разработан с серией диграфов для обозначения « мутных » согласных: ㅃ *[b] , ㄸ *[d] , ㅉ *[dz] , ㄲ *[ɡ] , ㅆ *[z] , ㆅ *[ɣ] ; также ᅇ, с неопределенным значением. Эти значения сейчас устарели, но большинство удвоенных букв были возрождены в 19 веке для написания согласных, которых не существовало на момент изобретения хангыля: ㅃ /p͈/ , ㄸ /t͈/ , ㅉ /t͈ɕ/ , ㄲ /k͈/ , ㅆ /с͈/ .

Лигатуры и новые буквы [ править ]

Диграфы иногда пишутся одной лигатурой. Со временем лигатуры могут превратиться в новые буквы или буквы с диакритическими знаками. Например, sz в немецком языке превратилось в ß , а в испанском «nn» превратилось в ñ .

В Юникоде [ править ]

орграф просто представляется двумя символами Обычно в Юникоде . [2] Однако по разным причинам Unicode иногда предоставляет отдельную кодовую точку для орграфа, закодированную как один символ.

Диграфы DZ , и IJ а также сербско-хорватские диграфы DŽ, LJ и NJ имеют отдельные кодовые точки в Юникоде.

Два глифа Диграф Кодовая точка Юникода HTML
ДЗ, ДЗ, ДЗ й, й, й U+01F1 U+01F2 U+01F3 DZ Dz dz
Дж, Дж, Дж й, й, й U+01C4 U+01C5 U+01C6 DŽ Dž dž
Эй Джей, Эй Джей IJ, ij U + 0132 U + 0133 IJ ij
ЭлДжей, ЭлДжей, ЭлДжей Ё, Ё, Ё U + 01C7 U + 01C8 U + 01C9 LJ Lj lj
Нью-Джерси, Нью-Джерси, Нью-Джерси Й, Й, Й U+01CA U+01CB U+01CC NJ Nj nj
й U + 1D7A [3]

См. также Лигатуры в Юникоде .

См. также [ править ]

Ссылки [ править ]

  1. ^ Брукс (2015) Словарь орфографической системы британского английского языка, стр. 460 и далее
  2. ^ «Часто задаваемые вопросы – лигатуры, орграфы и формы представления» . Консорциум Unicode: Домашняя страница . Юникод Инк . 1991–2009 . Проверено 11 мая 2009 г.
  3. ^ «Стандарт Юникод, версия 15.1» (PDF) . Юникод . Проверено 20 декабря 2023 г.