Романизация
В лингвистике в латинизация — это преобразование текста из другой системы письма латинское письмо или систему для этого. Методы латинизации включают транслитерацию для представления письменного текста и транскрипцию для представления устного слова, а также их комбинации. Методы транскрипции можно подразделить на фонематическую транскрипцию , при которой фиксируются фонемы или единицы смыслового значения в речи, и более строгую фонетическую транскрипцию , при которой с точностью фиксируются звуки речи.
Методы
[ редактировать ]Существует множество последовательных или стандартизированных систем латинизации. Их можно классифицировать по характеристикам. Характеристики конкретной системы могут сделать ее более подходящей для различных, иногда противоречивых приложений, включая поиск документов, лингвистический анализ, легкость чтения, точное представление произношения.
- Исходный или донорский язык. Система может быть адаптирована для латинизации текста с определенного языка или серии языков или для любого языка в определенной системе письменности. Система, ориентированная на конкретный язык, обычно сохраняет языковые особенности, такие как произношение, тогда как общая система может лучше подходить для каталогизации международных текстов.
- Целевой язык или язык получателя. Большинство систем предназначены для аудитории, которая говорит или читает на определенном языке. (Так называемые международные системы латинизации кириллического текста основаны на центральноевропейских алфавитах, таких как чешский и хорватский алфавит .)
- Простота. Поскольку в базовом латинском алфавите меньше букв, чем во многих других системах письма, орграфы , диакритические знаки для представления их всех в латинице необходимо использовать или специальные символы. Это влияет на простоту создания, цифрового хранения и передачи, воспроизведения и чтения латинизированного текста.
- Обратимость – можно ли восстановить оригинал из преобразованного текста. Некоторые обратимые системы допускают необратимую упрощенную версию.
Транслитерация
[ редактировать ]Если латинизация пытается транслитерировать исходный сценарий, руководящим принципом является взаимно однозначное отображение символов исходного языка в целевой сценарий с меньшим акцентом на то, как звучит результат при произнесении в соответствии с языком читателя. Например, языка Нихон-сики латинизация японского позволяет информированному читателю восстановить исходные японские слоги кана со 100% точностью, но требует дополнительных знаний для правильного произношения.
Транскрипция
[ редактировать ]фонематический
[ редактировать ]Большинство латинизаций предназначены для того, чтобы дать возможность обычному читателю, незнакомому с исходным письмом, достаточно точно произнести исходный язык. Такая латинизация следует принципу фонематической транскрипции и пытается максимально точно передать значимые звуки ( фонемы ) оригинала на целевом языке. Популярная романизация японского языка Хепберном является примером транскриптивной латинизации, предназначенной для носителей английского языка.
Фонетический
[ редактировать ]Фонетическое на исходном языке, при необходимости жертвуя разборчивостью за преобразование идет еще дальше и пытается отобразить все телефоны счет использования символов или условных обозначений, отсутствующих в целевом сценарии. На практике такое представление почти никогда не пытается представить все возможные аллофоны - особенно те, которые возникают естественным образом из-за эффектов коартикуляции - и вместо этого ограничивается наиболее значительными аллофоническими различиями. Международный фонетический алфавит — наиболее распространенная система фонетической транскрипции.
Торговля
[ редактировать ]Для большинства языковых пар построение удобной латинизации предполагает компромисс между двумя крайностями. Чистая транскрипция, как правило, невозможна, поскольку исходный язык обычно содержит звуки и различия, которых нет в целевом языке, но которые необходимо показать, чтобы латинизированная форма была понятной. Более того, из-за диахронических и синхронических различий ни один письменный язык не представляет собой устный язык с идеальной точностью, а голосовая интерпретация сценария может в значительной степени различаться в зависимости от языка. В настоящее время цепочка транскрипции обычно состоит из разговорного иностранного языка, письменного иностранного языка, письменного родного языка, устного (чтения) родного языка. Уменьшение количества этих процессов, то есть удаление одного или обоих этапов письма, обычно приводит к более точной устной артикуляции. В целом, за пределами ограниченной аудитории ученых, латинизация имеет тенденцию больше склоняться к транскрипции. В качестве примера рассмотрим японское боевое искусство 柔術: латинизацию Нихон-сики. Зюзюту может позволить тому, кто знает японский язык, восстановить слоги кана じゅうじゅつ , но большинству носителей английского языка или, скорее, читателям будет легче угадать произношение по версии Хепберн, дзюдзюцу .
Романизация конкретных систем письменности
[ редактировать ]арабский
[ редактировать ]Арабский алфавит используется для написания арабского , персидского , урду , пушту и синдхи, а также многих других языков мусульманского мира, особенно африканских и азиатских языков, не имеющих собственных алфавитов. Стандарты романизации включают следующее:
- Немецкое восточное общество (1936 г.): принято Международным съездом ученых-востоковедов в Риме. Это основа очень влиятельного словаря Ганса Вера ( ISBN 0-87950-003-4 ). [1]
- BS 4280 (1968): разработан Британским институтом стандартов. [2]
- SATTS (1970-е): система замены один к одному, наследие азбуки Морзе. эпохи
- НЕОПРЕДЕЛЕН (1972) [3]
- DIN 31635 (1982): разработан Немецким институтом стандартизации.
- ИСО 233 (1984). Транслитерация.
- Калам (1985): система, которая фокусируется на сохранении правописания, а не произношения, и использует смешанный регистр. [4]
- ISO 233-2 (1993): Упрощенная транслитерация.
- Транслитерация Баквальтера (1990-е): разработана в Xerox Баквальтером Тимом ; [5] не требует необычных диакритических знаков [6]
- АЛА-ЛК (1997) [7]
- Арабский чат-алфавит
персидский
[ редактировать ]Юникод | персидский письмо | НАСИЛИЕ | ДМГ (1969) | АЛА-ЛК (1997) | BGN/PCGN (1958) | НЕТ (1960) | НЕТ (2012) | И (1967) | И (2012) | Произношение |
---|---|---|---|---|---|---|---|---|---|---|
U + 0627 | А | ʔ, ∅ [а] | ʾ, — [б] | ʼ, — [б] | ʾ | - как в ох | ||||
U + 0628 | для | б | б | B как в Бобе | ||||||
U + 067E | п | п | п | P как домашнее животное | ||||||
U + 062A | Т | т | т | Т как в высоком | ||||||
U + 062B | че | с | с̱ | с̱ | с̄ | т-ч | ṯ | с̄ | с | S как в песке |
U + 062C | С | дʒ | ٧ | дж | дж | диджей | дж | дж | J как в джеме | |
U + 0686 | ж | тʃ | С | ч | ч | С | ч | С | Ч как в Чарли | |
U + 062D | ЧАС | час | час | час | ḩ/ḥ [с] | час | час | час | Ч как в отпуске | |
U + 062E | Х | х | час | х | х | к-ч | ḵ | х | х | чем-то напоминающий German Ch |
U + 062F | принадлежащий | д | д | D как у Дэйва | ||||||
U + 0630 | З | С | ẕ | ẕ | z̄ | черт возьми | ḏ | z̄ | С | Z как ноль |
U + 0631 | Р | р | р | R как у кролика | ||||||
U + 0632 | З | С | С | Z как ноль | ||||||
U + 0698 | Нет | ʒ | час | zh | zh | зч | час | zh | час | S как на телевидении или G как в жанре |
U + 0633 | вопрос | с | с | S как у Сэма | ||||||
U + 0634 | Ш | ʃ | с | ш | ш | тсс | с | ш | с | Ш как у овцы |
U + 0635 | п | с | ш | ш | SS [с] | ш | ш | с | S как у Сэма | |
U + 0636 | З | С | г | z̤ | ẕ | ḍ | г | ẕ | С | Z как ноль |
U + 0637 | я | т | ṭ | ṭ | т/т [с] | ṭ | Þ | т | т как в танке | |
U + 0638 | З | С | ẓ | ẓ | z¸/ẓ [с] | ẓ | ẓ | я | С | Z как ноль |
U + 0639 | А | ʕ | ʿ | ʻ | ʼ [б] | ʻ | ʻ | ʿ | ʿ | _____ |
U + 063A | г | ɢ~ɣ | с | хх | хх | тьфу | ḡ | хх | д | чем-то напоминающий французский R |
U + 0641 | Ф | ж | ж | F как у Фреда | ||||||
U + 0642 | вопрос | ɢ~ɣ | д | ḳ | д | чем-то напоминающий французский R | ||||
U + 06A9 | К | к | к | C как на карточке | ||||||
U + 06AF | Г | ɡ | г | G как в ходу | ||||||
U + 0644 | к | л | л | L как в лампе | ||||||
U + 0645 | М | м | м | М как у Майкла | ||||||
U + 0646 | Н | н | н | Н как по имени | ||||||
U + 0648 | и | в~в [а] [д] | v | в, ш [и] | v | V как в видении | ||||
U + 0647 | е | час [а] | час | час | час [ф] | час | час [ф] | час [ф] | H как в горячем | |
U + 0629 | Ой | ∅, т | — | час [г] | — | т [час] | час [г] | — | — | |
U + 06CC | Да | дж [а] | и | Да, как в Йельском университете | ||||||
U + 0621 | А | ʔ, ∅ | ʾ | ʼ | ʾ | |||||
U + 0623 | А | ʔ, ∅ | ʾ | ʼ | ʾ | |||||
U + 0624 | был | ʔ, ∅ | ʾ | ʼ | ʾ | |||||
U + 0626 | Э | ʔ, ∅ | ʾ | ʼ | ʾ |
Юникод | Финал | Медиальный | Исходный | изолированный | НАСИЛИЕ | ДМГ (1969) | АЛА-ЛК (1997) | BGN/PCGN (1958) | НЕТ (2012) | И (1967) | И (2012) | Произношение |
---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 064E | ـَ | ـَ | А | А | ой | а | а | а | а | а | а | А как в коте |
U + 064F | ـُ | ـُ | Он | Он | тот | тот | тот | тот | в | тот | тот | О, как в гоу |
U + 0648 U + 064F | И | И | — | — | тот [Дж] | тот | тот | тот | в | тот | тот | О, как в гоу |
U + 0650 | ـِ | ـِ | А | А | и | и | я | и | и | и | и | Е как десять |
U + 064E U + 0627 | ـَا | ـَا | ну давай же | ну давай же | ɑː~ɒː | и | и | и | и | и | и | О, как в горячем |
U + 0622 | Ну давай же | Ну давай же | ну давай же | ну давай же | ɑː~ɒː | а, ха [к] | ох, ох [к] | и | и | и | и | О, как в горячем |
U + 064E U + 06CC | ـَی | — | — | — | ɑː~ɒː | и | на | на | и | на | и | О, как в горячем |
U + 06CC U + 0670 | Да | — | — | — | ɑː~ɒː | и | на | на | и | и | и | О, как в горячем |
U + 064F U + 0648 | ـُو | ـُو | он | он | уː, оː [и] | Эм-м-м | Эм-м-м | Эм-м-м | ты, о [и] | Эм-м-м | в | Ты как на самом деле |
U + 0650 U + 06CC | ـِی | ـِیـ | Ой | Ой | яː, еː [и] | я | я | я | я, а [и] | я | я | Да, как счастливый |
U + 064E U + 0648 | ـَو | ـَو | Ой | Ой | ой~ой [и] | В | хорошо | ой | ох, ох [и] | ой | ой | О, как в гоу |
U + 064E U + 06CC | ـَی | ـَیـ | Да | Да | Эй~ай [и] | есть | является | эй | собака, собака [и] | эй | эй | Да, как в игре |
U + 064E U + 06CC | Да | — | — | — | –е, –дже | –e, –ye | –я, –йи | –e, –ye | –e, –ye | –e, –ye | –e, –ye | Да, как да |
U + 06C0 | Эх | — | — | — | -является | -вы | -я | -вы | -вы | -вы | -вы | Да, как да |
Примечания :
- ^ Перейти обратно: а б с д Также используется как гласная.
- ^ Перейти обратно: а б с Хамза и айн не транслитерируются в начале слов.
- ^ Перейти обратно: а б с д Точку ниже можно использовать вместо седилья.
- ^ В начале слов сочетание ⟨ خو ⟩ произносилось /xw/ или /xʷ/ на классическом персидском языке. В современных разновидностях скольжение / ʷ / утеряно, хотя написание не изменилось. Его до сих пор можно услышать на дари как реликтовое произношение. Комбинация /xʷa/ была изменена на /xo/ (см. ниже).
- ^ Перейти обратно: а б с д и ж г час я В От.
- ^ Перейти обратно: а б с Не транслитерируется в конце слов.
- ^ Перейти обратно: а б В сочетании ⟨ یة ⟩ в конце слов.
- ^ При использовании вместо ⟨ ت ⟩ в конце слов.
- ^ Диакритические знаки ( харакат ) пишутся редко.
- ^ После ⟨ خ ⟩ из предыдущего /xʷa/ . Часто транслитерируется как xwa или xva . Например, خور /xor/ «солнце» в классическом персидском языке было /xʷar/ .
- ^ Перейти обратно: а б После гласных.
Армянский
[ редактировать ]Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( июнь 2015 г. ) |
грузинский
[ редактировать ]Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( июнь 2015 г. ) |
Грузинское письмо | НАСИЛИЕ | Национальная система (2002) | BGN/PCGN (1981—2009) | ИСО 9984 (1996) | АЛА-ЛК (1997) | Неофициальная система | Kartvelo translit | НГР2 |
---|---|---|---|---|---|---|---|---|
А | /ɑ/ | а | а | а | а | а | а | а |
б | /б/ | б | б | б | б | б | б | б |
с | /ɡ/ | г | г | г | г | г | г | г |
д | /д/ | д | д | д | д | д | д | д |
е | /ɛ/ | и | и | и | и | и | и | и |
В | /v/ | v | v | v | v | v | v | v |
З | /С/ | С | С | С | С | С | С | С |
ჱ [а] | / еɪ / | эй | были | были | и | ej | сказать | |
Т | /тʰ/ | т | т' | т̕ | т' | Т [б] или т | т | т / т̊ |
я | /я/ | я | я | я | я | я | я | я |
К | /к'/ | к' | к | к | к | к | ǩ | к̉ |
л | /л/ | л | л | л | л | л | л | л |
М | /м/ | м | м | м | м | м | м | м |
Н | /н/ | н | н | н | н | н | н | н |
Я [а] | / я /, / дж / | дж | и | и | дж | ой | ||
О | /ɔ/ | тот | тот | тот | тот | тот | тот | тот |
П | /pʼ/ | п' | п | п | п | п | п̌ | п̉ |
Дж | /ʒ/ | zh | zh | час | час | Дж, [б] ж или дж | час | г̃ |
Р | /р/ | р | р | р | р | р | р | р |
С | /с/ | с | с | с | с | с | с | с |
Т | /т'/ | т' | т | т | т | т | т̆ | т̉ |
В [а] | /В/ | В | В | ш | е | |||
ты | /в/ | в | в | в | в | в | в | в |
Ф | /pʰ/ | п | п' | п̕ | п` | п или ж | п | п / п̊ |
ул. | /кʰ/ | к | к' | к̕ | к' | д или к | д или к | к / к̊ |
Г | /ʁ/ | хх | хх | ḡ | с | г, гх или р [б] | г, гх или р [б] | д |
вопрос | /qʼ/ | Q' | д | д | д | и [с] | д | д |
Ш | /ʃ/ | ш | ш | с | с | ш или С [б] | с | х |
Ч | /t͡ʃ(ʰ)/ | ч | ч' | č̕ | чо | ч или С [б] | С | с |
с | /t͡s(ʰ)/ | тс | тс' | с̕ | с` | с или тс | с | с |
Доктор | /ддз/ | дз | дз | дж | г | дз или Z [б] | ʒ | д̃ |
год | /цц/ | тс' | тс | с | с | w, c или ts | ʃ | с̉ |
Ч | /t͡ʃʼ/ | ч' | ч | С | С | В, [б] ч или тч | ʃ̌ | j̉ |
Х | /х/ | х | х | х | х | х или х (редко) | х | к̃ |
час [а] | /q/, /qʰ/ | Q' | час | х̣ | q̌ | вопрос | ||
Дж | /d͡ʒ/ | дж | дж | ϰ | дж | дж | - | дж |
ЧАС | /час/ | час | час | час | час | час | час | час |
ჵ [а] | / оː/ | ой | ой | ï | час |
Примечания :
- ^ Перейти обратно: а б с д и Архаичные письма.
- ^ Перейти обратно: а б с д и ж г час На них влияет вышеупомянутая компоновка, и их предпочитают избегать двусмысленности, поскольку выражения: t, j, g, ch могут означать две буквы.
- ^ Первоначально использование буквы y вместо ყ, скорее всего, связано с их сходством друг с другом.
Греческий
[ редактировать ]Существуют системы латинизации как современного , так и древнегреческого языка .
иврит
[ редактировать ]Еврейский алфавит латинизируется с использованием нескольких стандартов:
- АНСИ Z39.25 (1975 г.)
- НЕОПРЕДЕЛЕН (1977) [11]
- ISO 259 (1984): Транслитерация.
- ISO 259-2 (1994): Упрощенная транслитерация.
- ISO/DIS 259-3: Фонематическая транскрипция.
- АЛА-ЛК [12]
Индийские (брахмические) сценарии
[ редактировать ]Брахмическая семья абугидас используется для языков Индийского субконтинента и Юго-Восточной Азии. На Западе существует давняя традиция изучать санскрит и другие индийские тексты в латинской транслитерации. Различные соглашения о транслитерации использовались для индийских сценариев со времен сэра Уильяма Джонса. [13]
- ISO 15919 (2001 г.): Стандартное соглашение о транслитерации было закреплено в стандарте ISO 15919. Он использует диакритические знаки для сопоставления гораздо большего набора брахмических согласных и гласных с латинским шрифтом. Часть, специфичная для Деванагари, очень похожа на академический стандарт IAST : «Международный алфавит санскритской транслитерации» и на стандарт Библиотеки Конгресса США ALA-LC . [14] хотя есть некоторые различия
- Латинизация Национальной библиотеки в Калькутте , предназначенная для латинизации всех индийских письменностей , является расширением IAST.
- Гарвард-Киото : используются прописные и строчные буквы, а также удвоение букв, чтобы избежать использования диакритических знаков и ограничить диапазон 7-битным ASCII.
- ITRANS : схема транслитерации в 7-битный ASCII, созданная Авинашем Чопде и ранее широко распространенная в Usenet .
- ВЫПУСК (1988)
Деванагари-насталик (хиндустани)
[ редактировать ]Хиндустани — индоарийский язык с крайней диграфией и диглоссией, возникший в результате разногласий между хинди и урду, начавшихся в 1800-х годах. Технически сам хиндустани не признан ни языковым сообществом, ни правительствами. Два стандартизированных реестра , стандартный хинди и стандартный урду , признаны официальными языками в Индии и Пакистане. Однако на практике ситуация такова,
- В Пакистане: стандартный (сааф или хаалис) урду — это «высокая» разновидность, тогда как хиндустани — это «низкая» разновидность, используемая массами (называемая урду, написанная шрифтом насталик ).
- В Индии как стандартный (шудд) хинди, так и стандартный (сааф или хаалис) урду представляют собой разновидности «H» (написанные на деванагари и насталик соответственно), тогда как хиндустани - это разновидность «L», используемая массами и написанная либо на деванагари, либо на языке насталик. насталик (и называется «хинди» или «урду» соответственно).
Диграфия делает любую работу в любом сценарии в значительной степени недоступной для пользователей другого сценария, хотя в остальном хиндустани является совершенно взаимопонятным языком, что по сути означает, что любой вид сотрудничества на основе текста с открытым исходным кодом невозможен среди читателей деванагари и насталик.
Инициатива Хамари Боли, инициированная в 2011 году. [15] - это полномасштабная инициатива языкового планирования с открытым исходным кодом , направленная на письменность, стиль, статус, лексическую реформу и модернизацию хиндустани. Одна из основных заявленных целей Хамари Боли - избавить хиндустани от разрушительной диграфии деванагари-насталик путем латинизации. [16]
китайский
[ редактировать ]Романизация китайских языков , особенно мандаринского , оказалась очень сложной проблемой, хотя эта проблема еще более осложняется политическими соображениями. По этой причине многие таблицы латинизации содержат китайские символы плюс одну или несколько латинизаций или Zhuyin .
Мандарин
[ редактировать ]- ALA-LC : Раньше был похож на Уэйда-Джайлза, [17] но преобразован в Ханью Пиньинь в 2000 году [18]
- ЭФЕО . Разработан Французской школой Крайнего Востока в 19 веке и используется в основном во Франции.
- Latinxua Sin Wenz (1926): пропущенные звуки. Использовался в основном в Советском Союзе и Синьцзяне в 1930-е годы. Предшественник Ханью Пиньинь .
- Лессинг-Отмер : используется в основном в Германии.
- Почтовая латинизация (1906 г.): ранний стандарт международных адресов.
- Уэйд-Джайлз (1892): Транслитерация. Очень популярен с 19 века до недавнего времени и продолжает использоваться некоторыми западными учеными.
- Йельский университет (1942 г.): создан в США для связи на поле боя и используется во влиятельных учебниках Йельского университета.
- Латинизация Легга : Создано Джеймсом Леггом , шотландским миссионером.
Материковый Китай
[ редактировать ]- Ханью Пиньинь (1958): В материковом Китае Ханью Пиньинь официально использовался для латинизации мандаринского языка на протяжении десятилетий, прежде всего как лингвистический инструмент для обучения стандартизированному языку. Система также используется в других китайскоязычных регионах, таких как Сингапур и некоторые районы Тайваня , и была принята большей частью международного сообщества в качестве стандарта для написания китайских слов и имен латиницей. Ценность Ханью Пиньинь в образовании в Китае заключается в том, что в Китае, как и в любой другой населенной территории с сопоставимой площадью и населением, существует множество различных диалектов , хотя существует только один общий письменный язык и одна общая стандартизированная разговорная форма. (Эти комментарии относятся к латинизации в целом)
- ISO 7098 (1991): На основе Ханью Пиньинь.
Тайвань
[ редактировать ]- Гвоё Роматых (GR, 1928–1986, на Тайване 1945–1986; Тайвань использовал японский ромадзи до 1945 года),
- Фонетические символы китайского языка II (MPS II, 1986–2002 гг.),
- Тонгён Пиньинь (2002–2008 гг.), [19] [20] и
- Ханью Пиньинь (с 1 января 2009 г.). [21] [22]
Сингапур
[ редактировать ]Кантонский диалект
[ редактировать ]- Барнетт-Чао
- Гуандун (1960)
- Правительство Гонконга
- Джютпинг
- Правительство Макао
- Мейер-Вемпе
- Сидни Лау
- Йельский университет (1942)
- Кантонский пиньинь
Ву
[ редактировать ]Мин Нан или Хоккиен
[ редактировать ]- Pe̍h-ōe-jī (POJ), когда-то де-факто официальный сценарий пресвитерианской церкви на Тайване (с конца 19 века). Технически это представляло собой в основном фонематическую систему транскрипции, поскольку Мин Нань обычно не писался на китайском языке.
- Тай-ун Ло-ма-джи Пхинг-им Хон-ан
Теочью
[ редактировать ]- Гуандун (1960 г.) для особого сорта Теочью .
Мин Донг
[ редактировать ]Мин Бэй
[ редактировать ]японский
[ редактировать ]Романизация (или, в более общем плане, римские буквы называется « ромаджи » ) по- японски . Наиболее распространенными системами являются:
- Хепберн (1867): фонетическая транскрипция англо-американских практик, используемых в географических названиях.
- Нихон-сики (1885 г.): транслитерация. Также принят как ( ISO 3602 Strict ) в 1989 году.
- Кунрей-сики (1937): фонематическая транскрипция. Также принят как ( ISO 3602 ).
- JSL (1987): фонематическая транскрипция. Назван в честь книги Японский: разговорный язык» . Элеоноры Джорден «
- ALA-LC : похож на модифицированную Хепберн. [23]
- Wāpuro : транслитерация («латинизация текстового процессора»). Не совсем система, а набор общих практик, позволяющих вводить японский текст.
корейский
[ редактировать ]Хотя латинизация приняла различные и порой, казалось бы, неструктурированные формы, некоторые наборы правил все же существуют:
- МакКьюн-Рейшауэр (MR; 1937?), первая транскрипция, получившая некоторое признание. Слегка измененная версия MR была официальной системой корейского языка в Южной Корее с 1984 по 2000 год, однако другая модификация по-прежнему остается официальной системой в Северной Корее . Использует короткие слова , апострофы и диересы , причем последние два указывают границы орфографических слогов в случаях, которые в противном случае были бы двусмысленными.
То, что называется MR, во многих случаях может быть любой из множества систем, которые отличаются друг от друга и от исходного MR главным образом тем, отделяются ли окончания слов от основы пробелом, дефисом или - согласно системе МакКьюна и Райшауэра - нисколько; и если используется дефис или пробел, отражается ли изменение звука в последней согласной букве основы и первой согласной букве окончания (например, пур-и против пул-и ). Хотя эти отклонения в основном не имеют значения при транскрипции неизменяемых слов, эти отклонения настолько широко распространены, что любое упоминание о «латинизации МакКьюна-Рейшауэра» не обязательно относится к исходной системе, опубликованной в 1930-х годах.- Есть, например, система ALA-LC /Библиотеки Конгресса США, основанная на MR, но с некоторыми отклонениями. Разделение слов рассмотрено подробно, с щедрым использованием пробелов для отделения окончаний слов от основ, чего нет в MR. Слоги имен всегда разделяются дефисом, чего MR явно никогда не делает. Изменения звука игнорируются чаще, чем в MR. Делает различие между ' и ' . [24]
Несколько проблем с MR привели к разработке новых систем:
- Йельский университет (1942 г.): Эта система стала общепринятым стандартом латинизации корейского языка среди лингвистов . Длина гласного в старом или диалектном произношении обозначается макроном . В случаях, которые в противном случае были бы двусмысленными, границы орфографических слогов обозначаются точкой. и стандартного произношения слова Эта система также указывает согласные, которые исчезли из южнокорейской орфографии .
- Пересмотренная романизация корейского языка (RR; 2000): включает правила как транскрипции, так и транслитерации. Южная Корея теперь официально использует эту систему, одобренную в 2000 году. Дорожные знаки и учебники должны были соответствовать этим правилам как можно скорее, а стоимость, по оценкам правительства, составила не менее 20 миллионов долларов США. Изменены все дорожные знаки, названия железных дорог и станций метро на схемах и указателях и т.д. В некоторых случаях это изменение было либо проигнорировано, либо унаследовано , в частности, латинизация названий и существующих компаний. RR в целом похож на MR, но не использует диакритических знаков и апострофов и использует отдельные буквы для ㅌ/ㄷ (t/d), ㅋ/ㄱ (k/g), ㅊ/ㅈ (ch/j) и ㅍ/ㅂ ( п/б). В случаях двусмысленности границы орфографических слогов предполагалось обозначать дефисом , но на практике это применяется непоследовательно.
- ISO/TR 11941 (1996): Фактически это два разных стандарта под одним названием: один для Северной Кореи (КНДР), а другой для Южной Кореи (РК). Первоначальное представление в ИСО во многом основывалось на Йельском университете и было совместными усилиями обоих штатов, но они не смогли прийти к согласию по окончательному проекту. [25]
- Латинизация Лукова , разработанная в 1945–47 годах для его по разговорному корейскому языку. учебников [26]
тайский
[ редактировать ]Тайский язык , на котором говорят в Таиланде и некоторых районах Лаоса, Бирмы и Китая, написан собственным письмом , вероятно, произошедшим от смеси тайско-лаосского и старокхмерского языков брахмической семьи .
- Общая система транскрипции Королевского Таиланда
- ISO 11940 1998 Транслитерация
- ISO 11940-2 2007 Транскрипция
- АЛА-ЛК [27]
Нуосу
[ редактировать ]Язык Нуосу , на котором говорят на юге Китая, имеет собственную письменность — И. сценарий Единственная существующая система латинизации - YYPY (И Ю Пин Инь), которая представляет собой тон с буквами, прикрепленными к концу слогов, поскольку Нуосу запрещает коды. В нем не используются диакритические знаки, и поэтому из-за большого фонематического набора нуосу требуется частое использование диграфов, в том числе для монофтонговых гласных.
тибетский
[ редактировать ]Тибетский сценарий имеет две официальные системы латинизации: тибетский пиньинь (для лхасского тибетского языка ) и римский дзонгкха (для дзонгкха ).
Кириллица
[ редактировать ]В англоязычных библиотечных каталогах, библиографиях и большинстве научных публикаций метод транслитерации Библиотеки Конгресса используется во всем мире.
В лингвистике научная транслитерация применяется как для кириллицы , так и для глаголицы . Это касается старославянского языка , а также современных славянских языков , использующих эти алфавиты.
белорусский
[ редактировать ]- Латинизация белорусского языка BGN/PCGN , 1979 г. ( Совет США по географическим названиям и Постоянный комитет по географическим названиям для британского официального использования )
- Научная транслитерация , или система лингвистики Международная научная
- Латинизация ALA-LC , 1997 г. (Американская библиотечная ассоциация и Библиотека Конгресса): [28]
- ИСО 9 :1995
- Инструкция по транслитерации белорусских географических названий буквами латиницы , 2000 г.
болгарский
[ редактировать ]Система, основанная на научной транслитерации и ISO/R 9:1968, считалась официальной в Болгарии с 1970-х годов. С конца 1990-х годов болгарские власти перешли на так называемую упрощенную систему, избегающую использования диакритических знаков и оптимизированную для совместимости с английским языком. Эта система стала обязательной для публичного использования согласно закону, принятому в 2009 году. [29] Там, где в старой системе используется <č,š,ž,št,c,j,ă>, в новой системе используется <ch,sh,zh,sht,ts,y,a>.
Новая болгарская система была одобрена для официального использования также ООН в 2012 году. [30] а также BGN и PCGN в 2013 году. [31]
киргизский
[ редактировать ]Этот раздел пуст. Вы можете помочь, добавив к нему . ( июнь 2015 г. ) |
македонский
[ редактировать ]Этот раздел пуст. Вы можете помочь, добавив к нему . ( июнь 2015 г. ) |
Русский
[ редактировать ]Не существует единой общепринятой системы написания русского письма латиницей — на самом деле таких систем огромное количество: некоторые адаптированы под тот или иной целевой язык (например, немецкий или французский), некоторые задуманы как транслитерация библиотекаря, некоторые предусмотрены для паспортов российских выезжающих; транскрипция некоторых имен чисто традиционна. Все это привело к значительному дублированию названий. Например, имя русского композитора Чайковского можно также написать как Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , Чайковский , j и т. д. Системы включают в себя:
- BGN/PCGN (1947): система транслитерации (Совет США по географическим названиям и Постоянный комитет по географическим названиям для британского официального использования). [32]
- ГОСТ 16876-71 (1971): ныне несуществующий советский стандарт транслитерации. Заменен ГОСТ 7.79, который является эквивалентом ISO 9 .
- ООН Система латинизации географических названий (1987): На основе ГОСТ 16876-71 .
- ISO 9 (1995): Транслитерация. От Международной организации по стандартизации .
- АЛА-ЛК (1997) [33]
- Кодировка «Волапук» (1990-е): жаргонный термин (на самом деле это не Волапюк ) для обозначения метода письма, который на самом деле не является транслитерацией, но используется для аналогичных целей (см. Статью).
- Обычная английская транслитерация основана на BGN/PCGN, но не соответствует определенному стандарту. Подробно описано в романизации русского языка .
- Оптимизированная система [34] [35] [36] [37] [38] для латинизации русского языка.
- Сравнительная транслитерация русского языка [39] на разных языках (западноевропейский, арабский, грузинский, шрифт Брайля, Морзе)
сирийский
[ редактировать ]Латинская письменность для сирийского языка была разработана в 1930-х годах в соответствии с государственной политикой Советского Союза в отношении языков меньшинств , некоторые материалы были опубликованы. [40]
Украинский
[ редактировать ]Украинская национальная система 2010 года была принята UNGEGN в 2012 году и BGN/PCGN в 2020 году. Она также очень близка к модифицированной (упрощенной) системе ALA-LC, которая остается неизменной с 1941 года.
- АЛА-ЛК [41]
- ИСО 9
- Украинская национальная транслитерация [42]
- Украинская национальная система и системы BGN/PCGN в Рабочей группе ООН по системам латинизации. [43]
- Сравнение пяти систем Томасом Т. Педерсеном [44]
Обзор и резюме
[ редактировать ]В таблице ниже показаны наиболее распространенные латинизации фонематической транскрипции, используемые для нескольких разных алфавитов. Хотя для многих обычных пользователей этого достаточно, для каждого алфавита используется несколько альтернатив и множество исключений. Для получения более подробной информации обратитесь к каждому из языковых разделов выше. (Иероглифы хангыля разбиты на компоненты джамо .)
романизированный | НАСИЛИЕ | Греческий | Кириллица | амазиг | иврит | арабский | персидский | Катакана | хангыль | Бопомофо |
---|---|---|---|---|---|---|---|---|---|---|
А | а | А | А | а | ַ, ֲ, ָ | َ, а | О, давай | а | все | ㄚ |
НО | ай / ɛ | Ай | ага | |||||||
ИИ | есть | Да | ㄞ | |||||||
Б | б | депутат, Б | Б | Б | на | Б Б Б Б Б Б | Б Б Б Б | сто | ㄅ | |
С | к/с | Х | ㄘ | |||||||
СН | ʧ | ТС | Ч | ч | ж | поздравляю | ㄔ | |||
ТРАТИТЬ | ʨ я | кровь | ||||||||
Д | д | НТ, Д | Д | д, д | д | - | принадлежащий | делать | ㄉ | |
ДХ | д | Д | д | ﺫ — ﺫ | ||||||
ДЗ | ʣ | ТЗ | С | |||||||
И | он/она | Привет, ИИ | Э | Э | , ֱ, y ֵֶ, ֵ, y ֶ | рабочий | к | ㄟ | ||
ЭО | ʌ | да | ||||||||
Евросоюз | ɯ | ㅡ | ||||||||
Ф | ж | Ф | Ф | Ф | פ (или его окончательная форма ף) | F F F F F F F F F F F F F F F F F F F F F F F F F F F F F | А | ㄈ | ||
ФУ | ɸɯ | центр | ||||||||
Г | ɡ | ГГ, ГГ, Г | Г | ГАРАНТИРОВАННАЯ ПОБЕДА | третий | Г | идти | ㄍ | ||
ГХ | ɣ | С | Г | Вт | С, р | ﻎ ﻎ ﻎ ﻎ | q г | |||
ЧАС | час | ИЛИ | ЧАС | Ч, Ч | Ч, Ч | Э-э-э, ххххххх | Э Х Э | он | ㄏ | |
ХА | ха | С | ||||||||
ОН | он | Ф | ||||||||
ПРИВЕТ | привет | Привет | ||||||||
К | к | Хо | ||||||||
я | я / ɪ | Ч, Я, Й, ЭИ, ОИ | И, И | я | ִ, й ִ | д | желудок | зуб | ㄧ | |
я | ij | Д | ||||||||
Дж | ʤ | ТӞ | ДЖ, Џ | дж | третий' | К Е К Е К Е К | С | триллион | ㄐ | |
Джей-Джей | ʦ͈/ʨ͈ | хромой | ||||||||
К | к | К | К | к, к | Все | ККККК | К | ржу не могу | ㄎ | |
ТО | тот | комар | ||||||||
КЕ | тот | Ке | ||||||||
КХ | х | Х | Х | Х | כ, חֿ (или его окончательная форма ך) | ﷺ ﷺ | Х | |||
К | к | дерево | ||||||||
КК | к- | цветок | ||||||||
ЯВЛЯЕТСЯ | является | Ко | ||||||||
КУ | ка | девять | ||||||||
л | л | л | л | л | к | ЛЛЛ ЛЛЛ | к | ㄹ | ㄌ | |
М | м | М | М | м | מ (или его окончательная форма ם) | Ммм Ммм | М | могила | ㄇ | |
И | и | Ма | ||||||||
МНЕ | мне | Почта | ||||||||
МНЕ | мне | Ми | ||||||||
МО | для | Мо | ||||||||
В | мɯ | Му | ||||||||
Н | н | Н | Н | из | נ (или его окончательная форма ן) | н н н н н | Н | хм | ты | ㄋ |
ЧТО | уже | На | ||||||||
NE | ne | Не | ||||||||
из | ŋ | одеяло | ||||||||
В | хороший | Д | ||||||||
НЕТ | нет | из | ||||||||
НЕТ | нет | Ню | ||||||||
ТО | тот | О, О | О | , ֳ и ֹ | ُا | О | ㅗ | |||
ТЫ | ø | ㅚ | ||||||||
П | п | П | П | п | п | кровь | ㄆ | |||
ПП | п͈ | пердеть | ||||||||
ПС | пс | P.S. | ||||||||
вопрос | д | че | д | К | Qqqqqq | хх q | ㄑ | |||
Р | р | Р | Р | Р, Р | Р | ر — ر | Р | ㄹ | ㄖ | |
ДА | ɾа | Ла | ||||||||
РЭ | ɾe | Ре | ||||||||
РИ | ɾi | Ли | ||||||||
РО | ɾо | Б | ||||||||
RU | ɾɯ | ле | ||||||||
С | с | С | С | SS | с, ш | x x x x x, x x x x x x x x x x x x x x x x x x x x | х ш у | корова | ㄙ | |
на | на | са | ||||||||
ЮВ | с | Се | ||||||||
Ш | ʃ | С̈ | Ш | С | что | шш шш шш | Ш | ㄕ | ||
SHCH | ʃʧ | Щ | ||||||||
ОН | ɕi | С | ||||||||
ТАК | так | Так | ||||||||
SS | s͈ | ㅆ | ||||||||
Они есть | да | уксус | ||||||||
Т | т | Т | Т | т, т | Т, Т, Т | тттттттттттттттттттттттттттттттттттттттттттттттттттттт, мм | Т я | рамка | ㄊ | |
ОБЛИЦОВКА | лицом к лицу | Та | ||||||||
ТО | тот | Те | ||||||||
ТД | я | че | Т | вот это да | ||||||
К | к | к | ||||||||
ТС | ʦ | ТС | Ц | צ (или его окончательная форма ץ) | ||||||
ТГУ | ʦɯ | цу | ||||||||
ТТ | т͈ | снова | ||||||||
В | в | ОУ, Ю | У | и | , в | Д | баклан | рыдать | ㄩ | |
пользовательский интерфейс | ɰи | ㅢ | ||||||||
ТВОЙ | твой | два | ||||||||
V | v | Б | В | на | и | |||||
В | В | Ой | Вт | И, В | Й - Й | |||||
Вашингтон | из | Ва | ㅘ | |||||||
WAE | да | ㅙ | ||||||||
МЫ | мы | ヱ | ㅞ | |||||||
Висконсин | y/ɥi | ヰ | ㅟ | |||||||
ГДЕ | где | горе | ㅝ | |||||||
Х | х/кс | Х, Х | ㄒ | |||||||
И | дж | Д, я, солдат | Й, Й, Дж | й | Дж | Да, да | Да | |||
ИЗ | и | Я | Да | привет | ||||||
ДА | бледный | этот парень | ||||||||
ВЫ | является | Э, Е | да | |||||||
ЙЕО | jʌ | женщина | ||||||||
ДЕЛАТЬ | из | Ей | ||||||||
ОНИ | потому что | Или | Йо | одеяло | ||||||
YU | верно | Ю | Ю | ㅠ | ||||||
С | С | Г | С | з, з | Г | ﺯ — ﺰ, ﻅ | Z Z Z Z | ㄗ | ||
ZH | ʐ/ʒ | Z̈ | Же | Г | Нет | ㄓ |
См. также
[ редактировать ]- англизация
- Кириллизация , выражение языка кириллическими буквами.
- Франчайзинг
- Гайрайго
- Транскрипция на китайский язык , хотя стандарты различаются в зависимости от государства.
- Китаизация , в частности принятие китайской литературной культуры.
- Латинизация имен
- Семитская латинизация
- Распространение латинской графики.
Ссылки
[ редактировать ]- ^ «Немецкое восточное общество» . Dmg-web.de . Проверено 2 июля 2015 г.
- ^ «Стандарты, обучение, тестирование, оценка и сертификация» . BSI-Global.com . Группа компаний БСИ . Проверено 25 апреля 2013 г.
- ^ «Арабский» (PDF) . Eki.ee. Проверено 2 июля 2015 г.
- ^ «Калам: Соглашение о морфологической арабско-латинско-арабской транслитерации» . EServer.org . Архивировано из оригинала (TXT) 8 февраля 2009 г. Проверено 2 июля 2015 г.
- ^ «Букволтерская арабская транслитерация» . Камус.орг . Проверено 25 апреля 2013 г.
- ^ Бисли, Кен (22 ноября 2010 г.). «Бакуолтерская транслитерация» . Исследовательский центр Xerox в Европе . Архивировано из оригинала 24 апреля 2002 г. Проверено 25 апреля 2013 г.
- ^ «Арабский» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ «Греческий» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ "ТЛГ ® Руководство по бета-коду 2004 г.» (PDF) . Thesaurus Linguae Graecae . Калифорнийский университет, Ирвин . 23 июня 2004 г. Архивировано из оригинала (PDF) 29 января 2006 г.
- ^ Лефорт, Франсуа; Рубелакис-Ангелакис, Каллиопи А. «Схема транслитерации ISO 843» . biology.uoc.gr . Университет Крита . Архивировано из оригинала 10 декабря 2004 года.
- ^ «Иврит» (PDF) . Eki.ee. Проверено 2 июля 2015 г.
- ^ «Иврит и идиш» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ Габриэль Прадипака. «Санскрит 3: сравнение систем транслитерации» . Санскрит-Sanscrito.com.ar . Архивировано из оригинала 15 марта 2004 г. Проверено 25 апреля 2013 г.
- ^ «Хинди» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ «Что такое ХамариБоли?» . ХамариБоли . 15 июня 2011 г. Архивировано из оригинала 1 июня 2013 г. Проверено 25 апреля 2013 г.
- ^ The News International - 29 декабря 2011 г. Архивировано 16 июня 2013 г. в Wayback Machine - «Хамари боли (наш язык), возможно, является одним из самых первых серьезных начинаний по исследованию, развитию и поощрению роста использования латинского алфавита. языка урду/хинди».
- ^ «Китайский» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ «Новые правила латинизации китайского языка» . Библиотека Конгресса . 03.11.1998 . Проверено 25 апреля 2013 г.
- ^ «Тонгён Пиньинь — новая система латинизации» . Тайбэй Таймс . 11 июля 2002 г.
- ^ «Обеспокоенные власти Тайваня приняли схему Тунъён Пиньинь» . Народная газета онлайн . 12 июля 2002 г.
- ^ «Ханьюй Пиньинь станет стандартной системой в 2009 году» . Тайбэй Таймс . 18 сентября 2008 г.
- ^ «Правительство стремится улучшить среду, дружественную к английскому языку» . Почта Китая . 18 сентября 2008 г. Архивировано из оригинала 19 сентября 2008 г.
- ^ «Японский» (PDF) . Библиотека Конгресса . Проверено 28 сентября 2014 г.
- ^ «Корейский» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ «Поверхностное сравнение между ними» . Сори.орг . Проверено 25 апреля 2013 г.
- ^ «Справочник по корейской романизации» . Глоссика.com . Архивировано из оригинала 14 февраля 2006 года.
- ^ «Тайский» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ «Белорусский» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ↑ Государственный вестник № 19, София, 13 марта 2009 г. (на болгарском языке).
- ^ «Латинизация ООН болгарского языка для географических названий (1977)» . Eki.ee. Проверено 27 июня 2015 г.
- ^ «Система латинизации болгарского языка, система BGN/PCGN 1952 года» (PDF) . земля-info.nga.mil . Национальное агентство геопространственной разведки . Архивировано из оригинала (PDF) 19 декабря 2007 г.
- ^ «Кириллические переводы» . DSpace.Dial.Pipex.com . Архивировано из оригинала 16 июля 2012 г. Проверено 25 апреля 2013 г.
- ^ «Русский» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ Dimiter Dobrev. "Транслитерация" [Transliteration]. Metodii.com (in Russian) . Retrieved 2013-04-25 .
- ^ Базовый и оптимизированный. Архивировано 12 апреля 2016 г. на сайте Wayback Machine. Романизация русского языка. 2006–2016 гг.
- ^ Л. Иванов. «Упрощенная романизация русской кириллицы» . Контрастивная лингвистика . XLII (2017) № 2. С. 66-73. ISSN 0204-8701
- ^ Интерскрипт. Упрощенная романизация русской кириллицы (Базовая оптимизированная система).
- ^ Интерскрипт. Упрощенная романизация русской кириллицы (Оптимизированная оптимизированная система).
- ^ "Транслитерация русского алфавита" [Transliteration of the Russian alphabet]. Russki-mat.net (in Russian) . Retrieved 2013-04-25 .
- ^ С. П. Брок, «Три тысячи лет арамейской литературы», в Араме, 1: 1 (1989).
- ^ «Украинский» (PDF) . Библиотека Конгресса . Проверено 2 июля 2015 г.
- ^ "Приложение к решению №9" . hostmaster.net.ua . Archived из original на March 7, 2005.
- ^ «Украинский» (PDF) . Eki.ee. Проверено 2 июля 2015 г.
- ^ «Украинский» (PDF) . Транслитерация.Eki.ee . Проверено 2 июля 2015 г.
Внешние ссылки
[ редактировать ]- О латинизации
- IPA для урду и римского урду для пользователей мобильных устройств и Интернета (загрузить). Архивировано 23 декабря 2008 г. на Wayback Machine.
- Microsoft Transliteration Utility — инструмент для создания, отладки и использования модулей транслитерации из любого сценария в любой другой сценарий.
- Рэндалл Барри (редактор) Таблицы романизации ALA-LC Библиотека Конгресса США, 1997, ISBN 0-8444-0940-5 . (Одна из немногих печатных книг со списками латинизации)
- Таблицы латинизации Библиотеки Конгресса США в формате PDF
- Рабочая группа UNGEGN по системам латинизации
- Рекомендации по транслитерации Unicode, заархивировано 28 марта 2009 г. на Wayback Machine.
- Романизация онлайн
- Инструмент китайского фонетического преобразования — конвертирует пиньинь в другие форматы.
- Кириллическая транслитерация и транскрипция ОНЛАЙН (Кириллица -> Латиница)
- eiktub. Архивировано 25 октября 2019 г. на Wayback Machine — блокнот для арабской транслитерации.
- Lingua::Translit – модуль Perl , охватывающий различные системы письма, например кириллицу или греческий язык. Предоставляет множество стандартов, а также общие схемы транслитерации.
- Arabeasy – арабская транслитерация (существует бесплатное расширение для Chrome, также работает для персидского и урду)
- Russianeasy. Архивировано 8 марта 2016 г. на Wayback Machine - русская транслитерация (существует бесплатное расширение для Chrome).
Для персидской романизации
Для кантонской романизации