Jump to content

Персонажи CJK

(Перенаправлено с CJKV )
Перевод фразы «Этому старику 72 года» на вьетнамский , кантонский , китайский ( упрощенными и традиционными иероглифами ), японский и корейский языки .

В интернационализации символы CJK — это собирательный термин для графем, используемых в китайской , японской и корейской системах письма , каждая из которых включает китайские иероглифы . Термин CJKV также включает Chữ Nôm письмо китайского происхождения, , логографическое ранее использовавшееся для вьетнамского языка .

Репертуар персонажей

[ редактировать ]

Стандартный китайский и стандартный кантонский диалект написаны почти исключительно китайскими иероглифами. требуется более 3000 символов Для общей грамотности , а для достаточно полного охвата — до 40 000 символов. В японском языке используется меньше символов: общая грамотность японского языка может составлять 2136 символов. Использование китайских иероглифов в Корее становится все более редким, хотя своеобразное использование китайских иероглифов в именах собственных требует знания (и, следовательно, наличия) гораздо большего количества символов. Однако даже сегодня южнокорейские студенты изучают 1800 иероглифов .

Другие алфавиты, используемые для этих языков, такие как бопомофо и латиницы на основе пиньинь для китайского языка, хирагана и катакана для японского языка и хангыль для корейского языка, не являются строго «символами CJK», хотя наборы символов CJK почти всегда включают их по мере необходимости для полного использования. охват целевых языков.

Синолог Карл Лебан (1971) провел ранний обзор систем кодирования CJK.

До начала 20 века классический китайский был письменным языком правительства и науки во Вьетнаме. Популярная литература на вьетнамском языке была написана шрифтом Тё Ном , состоящим из китайских иероглифов, многие из которых были созданы на местном уровне. С 1920-х годов для записи литературы использовался вьетнамский алфавит на основе латиницы . [1] [2]

Кодирование

[ редактировать ]

Количество символов, необходимое для полного покрытия потребностей всех этих языков, не может уместиться в 256-символьном кодовом пространстве 8-битных кодировок символов , поэтому требуется как минимум 16-битная кодировка фиксированной ширины или многобайтовые кодировки переменной длины. 16-битные кодировки с фиксированной шириной, такие как кодировки от Unicode до версии 2.0 включительно, теперь устарели из-за необходимости кодировать больше символов, чем может вместить 16-битная кодировка — Unicode 5.0 содержит около 70 000 символов Han — и требование правительства Китая о том, чтобы программное обеспечение в Китае поддерживало набор символов GB 18030 .

Хотя кодировки CJK имеют общие наборы символов, кодировки, часто используемые для их представления, были разработаны отдельно правительствами разных стран Восточной Азии и компаниями-разработчиками программного обеспечения и несовместимы друг с другом. Unicode попыталась, хотя и с некоторыми противоречиями, унифицировать наборы символов в процессе, известном как унификация Хань .

Кодировки символов CJK должны состоять как минимум из символов хань плюс фонетические сценарии, специфичные для языка, такие как пиньинь , бопомофо , хирагана, катакана и хангыль. [3]

Кодировки символов CJK включают:

Наборы символов CJK занимают большую часть отведенного кодового пространства Юникода . Среди японских экспертов по китайским иероглифам существует много разногласий по поводу желательности и технической ценности процесса объединения хань , используемого для сопоставления нескольких наборов китайских и японских символов в единый набор унифицированных символов. [ нужна ссылка ]

На всех трех языках можно писать как слева направо, так и сверху вниз (справа налево и сверху вниз в древних документах), но при обсуждении проблем кодирования их обычно рассматривают как сценарии с письмом слева направо.

[ редактировать ]

Библиотеки сотрудничали в разработке стандартов кодирования символов JACKPHY ​​в начале 1980-х годов. По словам Кена Лунде , аббревиатура «CJK» была зарегистрированной торговой маркой Research Libraries Group. [4] (которая объединилась с OCLC в 2006 году). Срок действия товарного знака, принадлежавшего OCLC в период с 1987 по 2009 год, истек. [5]

См. также

[ редактировать ]
  1. ^ Коулмас (1991) , стр. 113–115.
  2. ^ ДеФрэнсис (1977) .
  3. ^ Эта статья основана на материалах, взятых из CJK в Бесплатном онлайн-словаре вычислительной техники до 1 ноября 2008 г. и включенных в соответствии с условиями «повторного лицензирования» GFDL версии 1.3 или более поздней.
  4. ^ Кен Лунде, 1996
  5. ^ Список Юстии

Цитируемые работы

[ редактировать ]
  • Коулмас, Флориан (1991). Письменные системы мира . Блэквелл. ISBN  978-0-631-18028-9 .
  • ДеФрэнсис, Джон (1977). Колониализм и языковая политика во Вьетнаме . Гаага: Мутон. ISBN  978-90-279-7643-7 .

Источники

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3fff64b5c2978157f5758085fd72b42d__1722193020
URL1:https://arc.ask3.ru/arc/aa/3f/2d/3fff64b5c2978157f5758085fd72b42d.html
Заголовок, (Title) документа по адресу, URL1:
CJK characters - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)