Jump to content

Наборы китайских символов

Набор китайских символов ( упрощенный китайский : 汉字字符集 ; традиционный китайский : 中文字元集 ; пиньинь : hànzì zìfú jí ) — это группа китайских иероглифов. Поскольку размер набора — это количество элементов в нем, при знакомстве с наборами китайских символов будут также представлены номера китайских символов в них. [ 1 ]

Существуют разные наборы китайских символов для разных целей. Ниже приводится введение в некоторые типичные наборы символов из истории, современных языков и информационных технологий.

Словари и лексикон

[ редактировать ]

Вместе с развитием систем письменности число китайских иероглифов продолжало расти, о чем свидетельствуют наборы символов словарей. [ 2 ] [ 3 ] Общее количество созданных персонажей достигает сотен тысяч, если учитывать варианты.

Количество символов в одноязычных китайских словарях
Год Дикт. Чар.
300 г. до н.э. Эрия 4300 [ 4 ]
100 год нашей эры Шуовэнь Цзецзы 9516
230 Шэнглей 11 520
350 Жилин 12 824
543 Юпиань 16 917
601 Цеюнь 12 150
732 Танюнь 15 000
753 Юньхай Цзинъюань 26 911 [ 5 ]
997 Лонгкан Шоуцзян 26 430 [ 6 ]
1011 Гуанъюнь 26 194
1039 Цзиюнь 53 525
1066 Лейпийский 31 319
1615 Цзихуэй 33 179
1675 Чжэнцзитун 33 440
1716 Словарь Канси 46 933
1915 Чжунхуа Да Цзыдянь 48 200
1968 Чжунвэнь Да Сидиан 49 888
1989 Ханью Да Зидиан 54 678
1994 Чжунхуа Цзихай 85 568 [ 7 ]
2017 Словарь вариантов китайских иероглифов 106 330 [ 8 ]
Количество символов в двуязычных китайских словарях
Год Словарь Язык Чар.
2003 Китайско-английский обширный словарь ABC Английский 9638 [ а ] [ 9 ]
2003 Дай Кан-Ва Джитен японский 50 305 [ 10 ]
2008 Хан-Хан Дэ Саджон корейский 53 667 [ 11 ]

Современные стандарты

[ редактировать ]

В связи с динамичным развитием языков не существует определенного количества современных китайских иероглифов. Однако разумную оценку можно сделать путем изучения наборов символов соответствующих стандартных списков и влиятельных словарей в странах и регионах, где используются китайские иероглифы. [ 12 ]

Политика Стандартный Чар. Дата
 Китай Общий список упрощенных китайских иероглифов 2235 1964 [ 13 ]
Список часто используемых иероглифов современного китайского языка 7000 1988 [ 14 ]
Таблица общих стандартных китайских иероглифов 8105 2013 [ 15 ]
 Гонконг Список графем часто используемых китайских иероглифов [ б ] 4762 2012 [ 16 ]
Справочные глифы для китайских компьютерных систем в Гонконге [ с ] 2016 [ 17 ]
 Тайвань Таблица стандартных форм общенациональных символов 4808 1982 [ 18 ]
Таблица стандартных форм малораспространенных национальных символов 6341 1983 [ 19 ]
Таблица редко используемых национальных символов 18 388 2017
 Япония Тойо кандзи 1850 1946 [ 20 ]
Джойо кандзи 2136 2010 [ 21 ]
 Южная Корея Базовая ханджа для образовательных целей 1800 2000 [ 22 ]

Материковый Китай

[ редактировать ]

Важные стандарты в Китайской Народной Республике включают Список часто используемых символов современного китайского языка ( Список часто используемых символов современного китайского языка , состоящий из 3500 символов), [ 23 ] и Список часто используемых иероглифов современного китайского языка ( Список общих символов современного китайского языка , содержащий 7000 символов, включая 3500 символов в предыдущем списке). [ 24 ] Но нынешним стандартом является Таблица общих стандартных китайских иероглифов , которая была выпущена Государственным советом в июне 2013 года для замены двух предыдущих списков и некоторых других стандартов. Он включает 8105 символов упрощенной китайской письменности, 3500 основных, 3000 второстепенных и 1605 третичных. Кроме того, существует 2574 традиционных символа и 1023 варианта. [ 25 ]

С 1990 по 1991 год Национальная ведущая группа по преподаванию китайского языка как иностранного и Центр проверки знаний китайского языка Пекинского института языка совместно разработали «汉语水平词汇与汉字等级大纲» (Описание оцениваемого словарного запаса и символов для HSK ). Структура китайских иероглифов содержит 2905 символов, разделенных на четыре класса: 800 символов класса A, 804 символа класса B, 601 символ класса C и 700 символов класса D. [ 26 ]

Самый популярный современный словарь китайских иероглифов и словарь слов — «Синьхуа Цзыдянь». [ 27 ] и Сяньдай Ханью Сидиан . [ 28 ] Каждый из них включает более 13 000 символов упрощенного и традиционного символов, а также некоторых вариантов.

На Тайване существует Таблица стандартных форм общенациональных иероглифов ( стандартный список шрифтов часто используемых китайских иероглифов ) с 4808 символами и Таблица стандартных форм менее распространенных национальных иероглифов ( стандартный список шрифтов часто используемых китайских иероглифов). иероглифы ), содержащие 6 341 общенациональный иероглиф. Оба списка были опубликованы Министерством образования и содержат в общей сложности 11 149 иероглифов традиционной китайской письменности.

В Гонконге существует Список графем часто используемых китайских иероглифов для начального и неполного среднего образования, всего 4762 символа. Этот список был опубликован Бюро образования и пользуется большим влиянием в образовательных кругах.

В Японии существуют кандзи дзёё (часто используемые китайские иероглифы, определенные Министерством образования Японии , включая 2136 символов) и кандзи дзинмейё (для использования в личных именах, в настоящее время включающие 983 символа).

В Корее существуют использования в образовательных целях базовые ханджа для — подмножество из 1800 ханджа, определенное в 1972 году образовательным стандартом Южной Кореи , а также Таблица ханджа для в личных именах , использования опубликованная Верховным судом Кореи в марте 1991 года. [ 29 ] Список постепенно расширялся, и к 2015 году 8 142 ханджи . в корейских именах было разрешено использовать [ 30 ]

Общая оценка

[ редактировать ]

С учетом всех упомянутых выше наборов символов общее количество современных китайских иероглифов в мире превышает 10 000, вероятно, около 15 000. [ 31 ] [ 32 ] Такую оценку не следует считать слишком грубой, учитывая, что, как упоминалось выше, всего существует более 100 000 китайских иероглифов.

Выпускник колледжа, владеющий письменным китайским языком, знает от трех до четырех тысяч иероглифов. По оценкам, рабочий словарь специалистов по классической литературе или истории, которые часто сталкиваются с уже не используемыми персонажами, составляет от 5000 до 6000 символов. [ 33 ]

Информационные технологии

[ редактировать ]

В следующих разделах будут представлены наборы китайских символов некоторых стандартов кодирования, используемых в информационных технологиях, включая GB , Big5 и Unicode .

GB означает Guobiao («национальный стандарт») и является префиксом для ссылочных номеров официальных стандартов, выпущенных Китайской Народной Республикой .

Первый стандарт кодирования китайских символов GB — GB 2312 , который был выпущен в 1980 году. Он включает в себя 6763 китайских иероглифа, из которых 3755 часто используемых отсортированы по пиньинь , а остальные — по радикалам (компонентам индексации). GB 2312 был разработан для упрощенных символов . Традиционные символы , которые были упрощены, не рассматриваются. GB 2312 до сих пор используется на некоторых компьютерах и в Интернете, хотя были выпущены более новые версии с расширенными наборами символов, такие как GB 13000.1 и GB 18030. [ 34 ] Последняя версия кодировки GB — GB 18030 . Он поддерживает как упрощенные, так и традиционные китайские символы и соответствует набору символов Unicode. [ 35 ]

Большой5

[ редактировать ]

Кодировка Big5 была разработана пятью крупными ИТ-компаниями Тайваня в начале 1980-х годов и с тех пор является фактическим стандартом для представления традиционного китайского языка в компьютерах. Big5 широко используется на Тайване, в Гонконге и Макао. Первоначальный стандарт Big5 включал 13 053 китайских иероглифа без каких-либо упрощенных символов материкового Китая. Китайские иероглифы в наборе символов Big5 расположены в радикальном порядке. Расширенные версии Big5 включают Big-5E и Big5-2003, которые включают некоторые упрощенные символы и символы гонконгского кантонского диалекта. [ 36 ]

Unicode — наиболее влиятельный международный стандарт многоязычной кодировки символов. Он соответствует стандарту ISO/IEC10646 (или практически эквивалентен ему). Полная версия Unicode представляет собой символ с 4-байтовым цифровым кодом, предоставляя огромное пространство для кодирования, охватывающее все символы всех языков мира. Базовая многоязычная плоскость (BMP) — это 2-байтовая версия ядра Unicode с 2^16=65 536 кодовыми точками для важных символов многих языков. В зоне иероглифов CJKV (Китай, Япония, Корея и Вьетнам) содержится 27 522 символа, включая все упрощенные и традиционные китайские иероглифы в GB2312 и традиционные символы Big5. [ 37 ]

В Unicode 15.0 имеется многоязычный набор символов из 149 813 символов, среди которых 98 682 (около 2/3) — китайские иероглифы, отсортированные по радикалам Канси . Доступны даже очень редко используемые символы. [ 38 ]

Все 5009 символов дополнительного набора символов Гонконга ( HKSCS ). [ 39 ] включены в Юникод. HKSCS был разработан правительством Гонконга как набор местных китайских иероглифов, которые вначале не были доступны на компьютере.

Юникод становится все более популярным. Сообщается, что UTF-8 (Unicode) используется на 98,1% всех веб-сайтов. Широко распространено мнение, что Unicode в конечном итоге заменит все другие коды обмена информацией и внутренние коды цифровых устройств. [ 40 ]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Заголовки символов из 196 373 словесных записей.
  2. ^ Справка по образованию
  3. ^ Справочник по производителям шрифтов.
  1. ^ Ян 2008 , с. 186.
  2. ^ Ян 2008 , стр. 186–187.
  3. ^ Ли 2013 , с. 32.
  4. ^ Ван и Цзоу 2003 , с. 45.
  5. ^ Чжоу 2003 , с. 73.
  6. ^ Юн и Пэн 2008 , стр. 198–199.
  7. ^ Уилкинсон 2012 , с. 46.
  8. ^ Инструкция к онлайн-версии «Словаря различных символов» . Словарь вариантов китайских иероглифов (на китайском языке). Архивировано из оригинала 17 марта 2009 г.
  9. ^ ДеФрэнсис 2003 .
  10. ^ Цифровое издание Дайкан-японского словаря – Taishukan Shoten Co., Ltd. . www.taishukan.co.jp (на японском языке) . Проверено 1 ноября 2023 г.
  11. ^ «Самый большой в мире словарь китайских иероглифов почти полон» . Чосун . Проверено 1 ноября 2023 г.
  12. ^ С 2014 г. , с. 47.
  13. ^ Ли 2020 , с. 142.
  14. ^ Лунде 2008 , с. 80.
  15. ^ Уведомление Государственного совета о публикации «Общего стандартного списка китайских иероглифов» [Уведомление Государственного совета о публикации «Общего стандартного списка китайских иероглифов»] (на китайском языке). Государственный совет Китайской Народной Республики . 5 июня 2013 г.
  16. ^ Бюро образования Гонконга, 2012 .
  17. ^ «Справочные символы для китайских компьютерных систем в Гонконге» . Общий интерфейс на китайском языке . Проверено 25 марта 2024 г.
  18. ^ Таблица часто используемых стандартных китайских иероглифов [ Таблица стандартных форм общенациональных иероглифов ] (на китайском языке). Тайбэй: Чжэнчжун Шуцзюй. 1983. ISBN  978-9-570-90664-6 .
  19. ^ Лунде 2008 , стр. 81–82.
  20. ^ Лунде 2008 , с. 82.
  21. ^ Пересмотренный список кандзи для общего использования, заявление Кабинета министров от 30 числа, официальное решение на заседании Кабинета министров [Измененный список кандзи Дзёё получил уведомление кабинета министров 30-го числа: будет официально подтвержден на заседании кабинета министров] (на японском языке). Нихон Кэйзай Симбун. 24 ноября 2010 г.
  22. ^ Лунде 2008 , стр. 84.
  23. ^ 现代汉语常用字表. Архивировано 13 ноября 2016 г. в Wayback Machine [Список часто используемых символов современного китайского языка], Министерство образования Китайской Народной Республики, 26 января 1988 г.
  24. Архивировано [ Список 23 ноября 2016 г. в Wayback Machine часто используемых иероглифов современного китайского языка], Министерство образования Китайской Народной Республики , 26 января 1988 г.
  25. ^ «Уведомление Государственного совета о публикации «Общего стандартного списка китайских иероглифов». Gov.cn (на китайском языке). Государственный совет Китайской Народной Республики . 5 июня 2013 г.
  26. ^ Ян 2008 , с. 220.
  27. ^ Институт языка 2020 .
  28. ^ Институт языка 2016 .
  29. ^ Национальная академия корейского языка (1991). Архивировано 19 марта 2016 года в Wayback Machine.
  30. ^ « Имя человека» значительно расширилось с 5761 до 8142 китайских иероглифов » . Чосон Ильбо (на корейском языке). 20 октября 2014 г. Проверено 23 августа 2017 г.
  31. ^ С 2014 г. , с. 51.
  32. ^ Ян 2008 , с. 192.
  33. ^ Норман 1988 , с. 73.
  34. ^ В 2014 году , стр. 213–215.
  35. ^ Лунде, Кен (4 августа 2022 г.). «Стандарт ГБ 18030-2022» . Середина . Проверено 7 августа 2022 г.
  36. ^ «[китайский Mac] Наборы символов» . chinesemac.org . Проверено 24 ноября 2023 г.
  37. ^ Консорциум Unicode 2023 .
  38. ^ «Статистика Юникода» .
  39. ^ «OGCIO: дополнительный набор символов Гонконга (HKSCS)» .
  40. ^ «Статистика использования и рыночная доля UTF-8 для веб-сайтов, март 2024 г.» .

Цитируемые работы

[ редактировать ]
  • ДеФрэнсис, Джон , изд. (2003). Китайско-английский большой словарь ABC . Гавайский университет Press . ISBN  978-0-824-82766-3 .
  • Таблица часто используемых символов символов: переработанное издание 2007 г.: с произношением символов кантонского диалекта и пу и объяснением на английском языке. [ Таблица символов часто используемых символов: переработанное издание 2007 г. с кантонским и мандаринским произношением и английскими пояснениями ] (на китайском языке). Бюро образования Гонконга. 2012 [2007]. ISBN  978-9-888-12393-3 .
  • Институт языка Китайской академии социальных наук (2016). Современный китайский словарь [ Современный китайский словарь ] (на китайском языке) (7-е изд.). Пекин: Коммерческая пресса. ISBN  978-7-100-12450-8 .
  • Институт языка Китайской академии социальных наук (2020). Словарь Синьхуа [ Словарь Синьхуа ] (на китайском языке) (12-е изд.). Пекин: Коммерческая пресса. ISBN  978-7-100-17093-2 .
  • Ли Дасуй (李大素) (2013). Краткие и практические исследования китайских иероглифов [ Краткие и практичные китайские иероглифы ] (на китайском языке) (3-е изд.). Издательство Пекинского университета. ISBN  978-7-301-21958-4 .
  • Ли, Ю (2020). Китайская письменность в Азии: междисциплинарная перспектива . Рутледж. ISBN  978-1-138-90731-7 .
  • Лунде, Кен (2008). Обработка информации CJKV (2-е изд.). О'Рейли. ISBN  978-0-596-51447-1 .
  • Норман, Джерри (1988). Китайский . Издательство Кембриджского университета. ISBN  978-0-521-29653-3 .
  • Су Пэйчэн (苏 Peicheng) (2014). Очерк современных исследований китайских иероглифов [ Основы современных китайских иероглифов ] (на китайском языке) (3-е изд.). Пекин: Коммерческая пресса. ISBN  978-7-100-10440-1 .
  • Стандарт Unicode, версия 15.1.0 , Южный Сан-Франциско, Калифорния: Консорциум Unicode, 2023 г., ISBN  978-1-936-21332-0
  • Ван Нин Цзоу Сяоли (王宁) (2003). справочник [ Справочники ] (на китайском языке: Peace Books Co., Ltd. ISBN) .  9-622-38363-7 .
  • Уилкинсон, Эндимион (2012). История Китая: новое руководство . Серия монографий Гарвардского института Йенчинга. Том. 85. Кембридж, Массачусетс: Азиатский центр Гарвардского университета. ISBN  978-0-674-06715-8 .
  • Ян Жунлу (Yang Runlu) (2008). современные кандзи [ Современные китайские иероглифы ] (на китайском языке). Издательство Пекинского педагогического университета. ISBN  978-7-303-09437-0 .
  • Йонг, Хеминг; Пэн, Цзин (2008). Китайская лексикография: история с 1046 г. до н.э. по 1911 г. н.э. Издательство Оксфордского университета. ISBN  978-0-191-56167-2 .
  • Чжоу Югуан (周有光) (2003). Историческая эволюция китайских языков и письменности Эволюция китайского языка с течением времени (на английском и китайском языках). Перевод Чжан Лицина (张立青). Колумбус: Национальный ресурсный центр восточноазиатских языков, Университет штата Огайо. ISBN  978-0-87415-349-1 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 72b3f0ee9e46f10c34135ada54160662__1719645780
URL1:https://arc.ask3.ru/arc/aa/72/62/72b3f0ee9e46f10c34135ada54160662.html
Заголовок, (Title) документа по адресу, URL1:
Chinese character sets - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)