Современные китайские иероглифы
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Современные китайские иероглифы ( традиционный китайский : современные китайские иероглифы ; упрощенный китайский : современные китайские иероглифы ; пиньинь : xiàndài hànzì ) — это китайские иероглифы, используемые в современных языках, включая китайский, японский, корейский и вьетнамский. [1] Китайские иероглифы состоят из компонентов, которые, в свою очередь, состоят из штрихов. [2] 100 наиболее часто используемых иероглифов охватывают (т.е. имеют суммарную частоту) более 40% современных китайских текстов. 1000 наиболее часто используемых символов охватывают примерно 90% текстов. [3] Существует множество новых аспектов современных китайских иероглифов, в том числе орфографии, фонологии и семантики, а также вопросы сопоставления, организации и статистического анализа, компьютерной обработки и педагогики. [4] [5]
Фон
[ редактировать ]Историческое развитие
[ редактировать ]С тех пор, как китайские иероглифы стали полноценной системой письма, они прошли непрерывную историю развития на протяжении более 3000 лет, включая этапы
- Сценарий кости Oracle ,
- Бронзовый сценарий ,
- Печать сценария ,
- Канцелярское письмо и
- Обычный сценарий ,
ведущие к современным письменным формам, [6] как показано на примере развития характера 馬 ; 'лошадь':
Оракул | Бронза | Тюлень | Канцелярский | Обычный | ||
---|---|---|---|---|---|---|
Большой | Маленький | Традиционный | Упрощенный | |||
В 1980 году Чжоу Югуан , которого часто называют «отцом пиньинь », опубликовал статью под названием «Введение в изучение современных китайских иероглифов», в которой он подробно описал аспекты чисел, порядков, форм, звуков, значений и символов. педагогика относительно современных персонажей. [7] За его докладом последовала «Краткая дискуссия о создании современных исследований китайских иероглифов» Гао Цзяина. [8] и другие статьи по этой теме. [9] По этому направлению издано не менее пяти учебников. [10] [4] [5] [11] [12]
Региональные сорта
[ редактировать ]Первоначально китайские иероглифы были изобретены для написания китайского языка, а затем использовались в других восточноазиатских языках, развиваясь как часть общей орфографической традиции. Среди других мест, в обычных и исторических целях, упрощенные символы в основном используются в материковом Китае, Сингапуре и Малайзии, традиционные символы используются на Тайване, в Гонконге и Макао, а также кандзи в Японии, ханджа в Корее и чо Хан. во Вьетнаме. [1] Например, традиционный иероглиф 廣 ; «широкий», «широкий» имеет упрощенную форму 广 и синдзитай форму кандзи 広 .
Характеристики
[ редактировать ]В отличие от латинского алфавита, используемого для написания многих языков, включая английский, китайские иероглифы имеют множество различных свойств, в том числе: [13]
- Здесь десятки тысяч разных персонажей,
- Персонаж находится в двухмерной блочной структуре,
- У персонажа могут быть десятки ударов,
- В большинстве случаев иероглиф обозначает морфему . [14]
- Односложное, обычно один иероглиф читается как один слог. [15]
- Тексты, написанные китайскими иероглифами, понятны читателям разных диалектов и разных династий.
Источники
[ редактировать ]Современные китайские иероглифы включают: [16]
- Получены иероглифы, стандартизированные как для упрощенного, так и для традиционного китайского языка, составляющие около 75% современных иероглифов, например : «Солнце», « Луна», «Пятница» ; « Чт » , «Дерево», ; «Вода» , огонь ; «огонь» и земля ;
- Недавно придуманные символы, около 2,7% от общего числа, например , « аммиак », «йод» , понг «пинг - горшок » , «не делать» и « »;
- Перепрофилированные древние символы, произношение и значение которых отличаются от древних, например 她 ; «она» и 旮 (используется в 旮旯 ; «угол»);
- Упрощенные формы, часто производные от уже широко используемых вариантов, около 20%, например 汉语 ; 汉语 «китайский язык», 学 ; 学 ; «учиться»);
- Символы современного диалекта, такие как кантонские символы, включенные в дополнительный набор символов Гонконга .
Количество и комплекты
[ редактировать ]В связи с динамичным развитием языков не существует определенного количества современных китайских иероглифов. Однако разумную оценку можно сделать путем изучения наборов символов соответствующих стандартных списков и влиятельных словарей в странах и регионах, где используются китайские иероглифы. [17]
Материковый Китай
[ редактировать ]Важные стандарты в Китайской Народной Республике включают Список часто используемых символов современного китайского языка объемом общим 3500 символов. [18] и Список часто используемых символов современного китайского языка ( Список общих символов современного китайского языка , содержащий 7000 символов, включая 3500 символов в предыдущем списке). [19] Но нынешним стандартом является Таблица общих стандартных китайских иероглифов , которая была выпущена Государственным советом в июне 2013 года для замены двух предыдущих списков и некоторых других стандартов. Он включает 8105 символов упрощенной китайской письменности, 3500 основных, 3000 второстепенных и 1605 третичных. Кроме того, существует 2574 традиционных символа и 1023 варианта. [20] И наборы символов Синьхуа Цзыдянь [21] и Сяньдай Ханью Сидиан , [22] самый популярный современный словарь китайских иероглифов и словарь слов. Каждый из них включает более 13 000 символов упрощенного и традиционного символов, а также некоторых вариантов.
Тайвань
[ редактировать ]На Тайване существует Таблица стандартных форм общенациональных иероглифов с 4808 символами и Таблица стандартных форм менее распространенных национальных иероглифов ( 次常用國字標準字體表 ) с 6341 распространенным национальным иероглифом. Оба списка были опубликованы Министерством образования и содержат в общей сложности 11 149 символов традиционной китайской письменности.
Гонконг
[ редактировать ]В Гонконге существует Список графем часто используемых китайских иероглифов для начального и неполного среднего образования, всего 4762 символа. Этот список был опубликован Бюро образования и пользуется большим влиянием в образовательных кругах.
Япония
[ редактировать ]В Японии существует кандзи дзёё — список из 2136 часто используемых символов, утвержденный Министерством образования Японии , а также 983 кандзи дзинмейё для использования в личных именах.
Корея
[ редактировать ]В Корее существует базовый ханджа для использования в образовательных целях ( 中文字幕 Основные китайские иероглифы , подмножество из 1800 ханджа, определенное в 1972 году образовательным стандартом Южной Кореи ) и Таблица ханджа для использования в личных именах ( 人名用综合汉字表 ). ), опубликованный Верховным судом Кореи в марте 1991 года. [23] Список постепенно расширялся, и к 2015 году 8 142 ханджи . в корейских именах было разрешено использовать [24]
Общая оценка
[ редактировать ]Учитывая все упомянутые выше наборы символов, общее количество современных китайских иероглифов в мире составляет более 10 000, вероятно, около 15 000. [25] [26] Такую оценку не следует считать слишком грубой, учитывая, что в Юникоде содержится более 90 000 китайских иероглифов ( унифицированных иероглифов CJK ), и даже больше, если включить каждый китайский иероглиф, когда-либо появившийся в мире. [27]
Выпускник колледжа, владеющий письменным китайским языком, знает от трех до четырех тысяч иероглифов. По оценкам, рабочий словарь специалистов по классической литературе или истории, которые часто сталкиваются с уже не используемыми персонажами, составляет от 5000 до 6000 символов. [28]
Частота
[ редактировать ]Частоты китайских иероглифов рассчитываются на основе данных корпусов . Корпус — это совокупность текстов, представляющих один или несколько языков. Частота символа — это отношение количества его появлений в корпусе к общему количеству символов корпуса. Формула для расчета частоты: F я = n i ⁄ N × 100% ,
где n i — количество раз определенного ( i й ) Китайский иероглиф появляется в корпусе, а N — общее количество (вхождений) символов в корпусе. [29]
Происхождение
[ редактировать ]Первым человеком, который провел статистическое исследование частоты использования китайских иероглифов, был Чэнь Хэцинь ( 陳鶴琴 ). [30] В 1920-х годах он и его помощники потратили два года на ручной подсчет символов в корпусе из 554 478 символов и получили 4261 различный символ с информацией о частоте. Затем они составили книгу «Прикладная лексика народного китайского языка» ( 語體文應用字彙 ). [31] 10 наиболее часто используемых символов в их корпусе по убыванию частоты:
of ('of'), not ('no', 'not'), one ('one', 'an'), ( PERF ) , is ( связка ), I (I/me), on (on, вверх), его ; «он», «он», иметь , человека («человек»).
Опрос CUHK
[ редактировать ]В 2001 году Китайский университет Гонконга (CUHK) опубликовал в Интернете ряд списков частот. [3] под названием «Частота китайского языка в Гонконге, материковом Китае и Тайване: межрегиональный диахронический обзор». Данные о частоте были получены из большого корпуса с рядом субкорпусов, представляющих китайские языки в трех регионах Гонконга, материкового Китая и Тайваня, а также за два периода времени: 1960-е и 1980-90-е годы. Каждый подкорпус включает около 5000 различных символов, о чем свидетельствуют их частотные списки.
Из данных этих частотных списков можно обнаружить некоторые важные и интересные особенности китайского языка:
- 的 , 一 и 是 — три наиболее часто используемых символа в регионах и периодах времени корпусов. 的 занимает первое место во всех списках частотности.
- 10 наиболее часто используемых символов в трех регионах и двух временных периодах очень схожи. Это означает, что часто используемый символ в одном регионе или периоде, скорее всего, будет часто использоваться в другом регионе или периоде.
- 100 наиболее часто используемых иероглифов 80-х и 90-х годов охватывают (т. е. имеют суммарную частоту) 41,00% текстов Гонконга того периода, 41,34% текстов материкового Китая и 41,88% текстов Тайваня. Это более 4 из каждых 10 символов по трем регионам.
- 1000 наиболее часто используемых иероглифов 80-х и 90-х годов охватывают 89,25% текстов Гонконга того периода, 90,26% текстов материкового Китая и 88,74% текстов Тайваня.
Опрос правительства Китая
[ редактировать ]Масштабные исследования, проведенные Министерством образования и Комиссией по государственному языку КНР на протяжении многих лет, показали, что использование китайских иероглифов и слов имеет четко выраженную структуру распространения. Количество иероглифов, используемых в современном китайском языке, стабильно составляет около 10 000 в течение многих лет. Количество наиболее часто используемых символов с охватом 80%, 90% и 99% составляет около 590, 960 и 2400 соответственно. [32]
Частота китайских иероглифов важна для количественного исследования китайских иероглифов и применяется для преподавания языка, составления словаря, составления списков символов, обработки информации о китайских иероглифах и т. д. [33]
Заказы
[ редактировать ]Порядок или методы сортировки китайских словарей традиционно делятся на три категории: порядок, основанный на форме, порядок, основанный на звуках, и порядок, основанный на значении. [34] В современном китайском языке люди также используют порядок частот .
На основе форм
[ редактировать ]В этой категории заказов иероглифы и слова сортируются по различным особенностям формы или формы китайских иероглифов. По сравнению с порядками на основе звуков, порядок на основе форм имеет преимущества, позволяющие искать символы и слова, не зная их произношения, а также эффективно сопоставлять большие наборы символов без поддержки других методов сортировки. Существует две подкатегории приказов, основанных на форме: приказы, основанные на штрихах, и приказы, основанные на компонентах, которые дополнительно включают приказы, основанные на радикалах , и т. д. [35] [36]
Звуковой
[ редактировать ]В стандартном китайском языке существуют две основные системы звукового представления: пиньинь и бопомофо . Соответственно, существует алфавитный порядок пиньинь и порядок на основе бопомофо. [37]
Основанный на значении
[ редактировать ]Порядки, основанные на значении, также называемые порядками, основанными на семантике, упорядочивают символы и слова в иерархическую структуру семантических категорий. [38]
Частотный
[ редактировать ]В этой категории заказов китайские иероглифы отсортированы по частоте их использования, обычно в порядке убывания. Это означает, что наиболее часто используемый символ находится вверху списка. Список частот создается на основе текстового корпуса . В корпусной лингвистике частота символа — это отношение процента его появления в корпусе к общему количеству символов корпуса. [29]
Порядок слов
[ редактировать ]Китайские слова состоят из одного или нескольких символов. Односимвольные слова можно сортировать по порядку символов, а многосимвольные слова можно сортировать посимвольно аналогичным образом. [39]
Формы
[ редактировать ]Современные китайские иероглифы представлены в виде квадратных блоков. Существует три слоя или уровня структурных единиц китайских иероглифов: штрихи, компоненты и целые иероглифы. [40] [а] Например, 字 (иероглиф) состоит из двух компонентов, каждый из которых состоит из трех стоков:
Символ = 宀 : ㇔㇔㇇ + 子 : ㇇㇚㇐ . |
Штрихи
[ редактировать ]Штрихи ( традиционный китайский : 筆劃 ; упрощенный китайский : 笔画 ; пиньинь : bϐhuà ) — это наименьшие единицы письма китайских иероглифов. При написании китайского иероглифа след точки или линии, оставленный на пишущем материале (например, бумаге) от пера вниз до верха пера, называется штрихом. [42] Номер штриха — это количество штрихов китайского иероглифа. Это варьируется, например, символы 一 и 乙 имеют только одну черту, в то время как символ 齉 имеет 36 штрихов, а 龘 (состоящий из трех 龍 ; «дракон») состоит из 48 штрихов. [43]
Формы штрихов относятся к формам штрихов. Формы штрихов стандартного набора китайских символов можно классифицировать в таблицу, например, список штрихов Unicode CJK содержит 36 типов штрихов: [44]
Порядок штрихов — это порядок написания штрихов для формирования китайского иероглифа. Например, порядок штрихов в 千 — ㇓,㇐,㇑ . [45]
Компоненты
[ редактировать ]Китайские иероглифы состоят из компонентов ( 部件 ; bùjiàn ), которые, в свою очередь, состоят из штрихов. [2] В большинстве случаев компонент больше штриха (т. е. состоит из более чем одного штриха) и меньше всего символа (объединяется с некоторыми другими компонентами, образуя символ). Например, в иероглифе 件 есть два компонента, 亻 и 牛 , каждый из которых состоит из более чем одного штриха ( 亻 : ㇓㇑ , 牛 : ㇓㇐㇐㇑ ). В особых случаях однострочных символов, таких как 一 и 乙 , штрих является компонентом и символом.
Анализ компонентов китайского иероглифа заключается в разделении иероглифа на компоненты. Существует два способа разделения китайских иероглифов: иерархическое разделение и плоское разделение . Иерархическое разделение отдельных слоев слой за слоем от более крупных компонентов к более мелким и, наконец, получение примитивных компонентов. Плоское деление отделяет все примитивные компоненты одновременно. [46]
Компонент, который может независимо формировать персонаж, — это компонент персонажа или компонент независимого формирования персонажа ( 成字部件 ). Например, компонент 口 независимо формирует символ 口 и является компонентом символов 另 , 洁 и 唱 . Компонент, который не может самостоятельно формировать символ, является несимвольным компонентом или компонентом зависимого формирования персонажа ( 非成字部件 ). Например, компонент 冂 в символах 同 , 鋼 и 岗 . [2]
Компонент, который не может быть (дальнейше) разделен на более мелкие компоненты по правилам, является примитивным компонентом , или базовым компонентом ( 基礎部件 ; 基础部件 ). Примитивные компоненты — это компоненты последнего уровня иерархического деления. Например, компоненты « и » в символах . Компонент, состоящий из двух или более примитивных компонентов, является составным компонентом ( 合成部件 ). Например, компонент 咅 в символах 陪 , 部 и 菩 . [47]
Целые персонажи
[ редактировать ]«Целые символы» ( китайский : 整字 ; пиньинь : zhěngzì ) лежат на последнем уровне композиции штрих-компонент-символ. [48] ( Неразложимый иероглиф 獨 體字 ; 独体字 ) состоит из одного примитивного компонента, который формируется непосредственно штрихами и не может быть разложен на более мелкие компоненты. [49] ( Разложимый символ 合 字 ; 合字 ) можно разбить на несколько компонентов.
Структура китайского иероглифа — это образец или правило, по которому иероглиф формируется из его компонентов (первого уровня). [47] Структуры китайских иероглифов включают в себя:
- Однокомпонентная структура (т. е. неразлагаемый символ): Символ формируется одним примитивным компонентом, таким как 口 , 日 и 月 .
- Лево-правая структура: иероглиф состоит из компонента слева и компонента справа, например 好 , 部 и 件 .
- Структура «вверх-вниз»: иероглиф формируется компонентом, расположенным над другим компонентом, например 号 , 召 и 昌 .
- Окружающая структура: один компонент полностью или частично окружен другим компонентом, таким как Го , Тун , Район , Хань , Ли , Си и Цзинь .
Популярные шрифты современных китайских иероглифов включают
- Сун ( 宋体 ; 宋体 ) или Мин ( 明体 ; 明体 ),
- Fangsong ( стиль имитации песни ; стиль имитации песни ),
- Обычный сценарий ,
- Канцелярское письмо ( канцелярское письмо ; канцелярское письмо ),
- Хэй или «черный» ( 黑体 ; 黑体 ) и
- Вэй ( стиль Вэй ; стиль Вэй ). [50]
В китайском языке, помимо международной системы баллов, (字號 ; 字号 для размеров символов используется уникальная «числовая» система ). Например, версия Microsoft Word на упрощенном китайском языке позволяет устанавливать размеры шрифта как в точках, так и в цифрах. [51]
Фонология
[ редактировать ]Стандартное произношение китайских иероглифов основано на пекинском диалекте мандаринского языка. [52] Обычно иероглиф читается с одного слога. Некоторые китайские иероглифы имеют более одного произношения (полифонические иероглифы). Некоторые слоги соответствуют более чем одному символу (омофонические символы). [53]
Полифонические персонажи
[ редактировать ]Полифонические символы ( 多音字 ) — это символы с двумя или более произношениями, в отличие от монофонических символов, имеющих только одно. Полифонический однозначный иероглиф ( 多音同義字 ) имеет два или более произношения одного и того же значения. Например, английское слово «тон» транслитерируется как 吨 ; 噸 , при этом в некоторых старых словарях сосуществуют два варианта произношения dūn и dùn , оба имеют одно и то же значение «тон». Поскольку 噸 — это и иероглиф, и слово, то он является полифоническим однозначным иероглифом, а также полифоническим однозначным словом.
В декабре 1985 года китайское правительство опубликовало Таблицу слов китайского языка с вариантным произношением ( 普通话异读词审音表 ), чтобы определить стандартное произношение полифонических однозначных символов. [54] На Тайване существует аналогичный официальный стандарт для слов китайского языка с разными звуками, где произношение выражается бопомофо, а не пиньинь.
Полифонический многозначный символ ( 多音多義字 ) имеет два или более произношения, и разные варианты произношения представляют разные значения. Например, иероглиф 长 ; 長 произносится как cháng со значением «длинный» или zhong со значением «расти». Упрощенный иероглиф 脏 произносится как занг от традиционного иероглифа 髒 ; «грязный» или как zàng от традиционного иероглифа 臟 ; «внутренние органы». Произношение таких символов определяется предполагаемым смыслом. [55]
Полифонические многозначные иероглифы могут препятствовать изучению и применению китайских иероглифов, и их следует сократить. Существует два основных метода: [56]
- Чангское произношение. Распространенный подход заключается в замене редких и субчастых звуков на частые. И измените древнее произношение на сегодняшнее.
- Изменить форму. Это означает изменение некоторых звуков и значений, которые будут выражаться другими персонажами.
Омофоны
[ редактировать ]Гомофонические иероглифы ( 同音字 ) — это те, которые имеют одинаковое произношение, в отличие от гетерофонных иероглифов ( 異音字 ; 异音字 ). Гомофонические символы либо понимаются в узком смысле как имеющие идентичные инициалы, финалы и тона, либо в более широком смысле — как просто имеющие идентичные инициалы и финалы, причем тона могут различаться. Например, 馬、瑪、碼、獁、螞 произносятся как mَ , а 媽 ; ма , 麻 ; ма , 馬 ; му , 駡 ; ма , 嗎 ; ma являются омофонами только в более широком смысле. Обычно люди понимают гомофонию символов как относящуюся к узкому смыслу. [57]
В мандаринском языке широко распространены гомофонические символы: существует около 1300 возможных слогов, включая тональные различия — без учета тонов количество различных слогов падает до 400. Между тем в письменной речи более 10 000 символов, каждому соответствует в среднем 7,5 символов. слог. [58]
Чжоу Югуан представил два способа исторического сокращения омофонов: [59] [60]
- Дифференцируйте произношение символов, не меняя слова. Например: 癌症 ; «рак» первоначально произносился как «яньчжэн» , позже был изменен на «айчжэн» из-за путаницы с 炎症 ; Яньчжэн ; 'воспаление');
- Дифференцировать слова и произношение. Например: 期終 (期终; qízhōng ; «конечный срок») путали с 期中 ; цижун ; «среднесрочный»), позже синоним 期末 ; кимо ; Вместо этого стали использовать «конечный срок».
Другие
[ редактировать ]Существует две системы фонетической записи китайских иероглифов.
В пиньинь либо диакритические знаки (например, ма ), либо цифры ( ма1 для обозначения тонов могут использоваться ). В системе Джютпинг для кантонского диалекта используются цифры, например 香港 ; хоэн1 гонг2
Кунёми — это чтение кандзи с использованием родных японских слов, сопоставленных со значениями заимствованных китайских иероглифов. Персонажи также были заимствованы при прочтении онёми с заимствованным китайско-японским произношением. Например, когда китайский иероглиф 山 ; Шан ; Слово «гора» было заимствовано в Японию, люди читали его либо с местным кунъёми произношением « яма» , либо с китайско-японским онъёми произношением слова «шань» . Эти явления также проявляются в мандаринском и английском языках, например, когда их читают вслух как «это есть». Цю Сигуй называл это 同义换读 ; 同義換讀 ; «синонимическое чтение»). [61]
Семантика
[ редактировать ]В современном китайском языке иероглиф может представлять собой слово, морфему в сложном слове или, альтернативно, бессмысленный слог в сочетании с некоторыми другими слогами или символами, образующими морфий. [62] В языке морфемы являются минимальными единицами значения. [63] Некоторые символы имеют только одно значение, некоторые имеют несколько значений, а некоторые символы в основном имеют одно и то же значение. [64]
Однозначные и многозначные символы.
[ редактировать ]Иероглиф, имеющий только одно значение, является однозначным иероглифом, а иероглиф, имеющий два и более значений, — многозначным иероглифом. По статистике Китайского информационного словаря иероглифов , среди 7785 стандартных китайских иероглифов в словаре есть 4139 однозначных иероглифов, 3053 многозначных иероглифа и 593 бессмысленных иероглифа. [65]
Значение, которое люди придали персонажу при его создании, является исходным значением ( 本義 ; 本义 ) персонажа. [66] Например, исходное значение 兵 ; бин — «оружие» ( 斤 ; джин ; «режущий нож»), которое держат обеими руками 八 ).
Значение, возникшее из исходного значения иероглифа посредством ассоциации, является расширенным значением ( 引申義 ; 引申义 ). [66] Например, 士兵 ; «солдат» — расширенное значение слова 兵 .
Значение, добавляемое за счет заимствования омонимичных звуков, является значением фонетического заимствования ( 假借義 ; 假借义 ). [67] Например, исходное значение 其 ; qì — это «совок для мусора»: его использование в качестве местоимения третьего лица произошло из фонетического заимствования.
Синонимы
[ редактировать ]Символы-синонимы — это группа символов, имеющих одинаковое или похожее значение. Символы в группе синонимов часто различаются по частоте употребления и словообразовательной способности, а также есть некоторые (незначительные) различия в значении и эмоциональной окраске. Знание символов-синонимов поможет учащимся более правильно писать по-китайски и точнее выражать смысл. [68] Например,
И 面 , и 臉 имеют значение «лицо». Но есть некоторые различия. [69] Обычно 面 , а только в Лицо слово в китайском языке соединениях не используется как самостоятельное многосимвольных . в этих словах не может быть отождествлено с лицом . Напротив, в китайском языке лицо обычно может использоваться отдельно. собственное слово, а также такие составные слова, как facebook ; «макияж лица», 花面 «нарисованное лицо» ; , «детское лицо» , « круглое лицо» и « квадратное лицо», милое личико ; «милое личико». Лицо в этих словах нельзя заменить на 面 .
Значения символов и слов
[ редактировать ]Значение односимвольного слова – это значение его символа. Значение многосимвольного слова обычно определяется значениями иероглифов. Отношения между значением сложного слова и его символами подразделяются на следующие категории: [70]
- Синонимы (A + B = A = B), такие как звук ; «звук» = звук ; «звук» = « звук».
- Синтетическое значение (A + B = AB), например 品德 ; 'моральный облик' = 品 ; «характер» и 德 ; «мораль»
- Расширенное значение (A + B = AB + ε), например 景物 ; 'пейзаж' = 景 ; 'просмотреть' + 物 ; «вещь» + («для осмотра достопримечательностей»)
- Частичное значение (A + B = A или B, но не другое), например 國家 ; 'страна') = 國 ; «страна», но не 家 ; 'семья', 容易 ; 'легко' = 易 ; «легко», но не 容 ; 'лицо'.
- Дополнительное значение (A + B = ε), например 東西 ; «вещь», «материал») — не 東 ; 'восток' + 西 ; «запад».
По выборочной статистике на категории 2 и 3 приходится 89,7% сложных слов.
Внутренние структуры
[ редактировать ]При анализе внутренних структур китайские иероглифы разлагаются на внутренние структурные компоненты во взаимосвязи со звучанием и значением иероглифов. [71]
Традиционная классификация
[ редактировать ]В Шуовэнь Цзецзы Сюй Шэнь предложил шесть категорий ( традиционный китайский : 六書 ; упрощенный китайский : 六书 ; пиньинь : лиусю ; букв. «шесть письмен») китайских иероглифов, в том числе [72]
- Пиктограммы ( 象形 ; xiàngxíng ; «имитация формы»), односмысловые символы, являющиеся изображениями предметов, которые они представляют.
- Простые идеограммы ( 指事 ; чжуши ; «указание») выражают абстрактную идею в знаковой форме.
- Сложные иероглифы ( 會意 ; 会意 ; huìyì ; «объединенное значение») объединяют два или более семантических компонента, чтобы указать значение иероглифа.
- Фоносемантические символы ( 形声 ; 形聲 ; xíngshēng ; «форма и звук») состоят из фонетических компонентов и семантических компонентов.
- Производные родственники ( 轉注 ; 转注 ; zhuǎnzhù ; «взаимное значение»), два иероглифа имели похожее древнекитайское произношение и, возможно, имели один и тот же этимологический корень.
- Символы ребуса (фонетического заимствования) ( 假借 ; «заимствование», «использование») — это символы, заимствованные для написания других морфем с похожим произношением.
Современная классификация
[ редактировать ]Традиционный люшу предполагал, что каждый внутренний компонент может представлять либо звук, либо значение иероглифа. Но после долгой эволюции китайских систем письма многие компоненты больше не могут эффективно играть свои роли и превратились в компоненты чистой формы. С точки зрения внутренней структуры современные китайские иероглифы состоят из семантических компонентов, фонетических компонентов и компонентов чистой формы. И они сформировали семь категорий современных китайских иероглифов: [73] [74]
Семантическая составляющая символов состоит из смысловых компонентов и включает в себя: [75] [76]
- Пиктограммы, такие как 田 ; «поле», « колодец », . «дверь»
- Простые идеограммы, такие как один ; «один», два , «два», лезвие ;
- Сложные идеограммы. Например, 拿 ; 'взять': 合 ; 'закрыть' 手 ; «руки» вместе, чтобы взять; 掰 ; 'развалиться': 分 ; «отделить» что-либо с помощью двух 手 ; 'руки'; 从 ; «следовать»: один 人 ; «человек» следует за другим человеком; 泪 ; 'слезы': 氵 ; «вода» от 目 ; 'глаза'.
- Специальные методы, такие как 叵 ; 'не могу': повернуть 可 ; 'может' в противоположную (правую) сторону; 冇 ; 'нет', 'нет': 有 ; 'забрали' 二 ; «содержание».
Фонетические компоненты иероглифов состоят из фонетических компонентов. [75] Например,
- Фонетико-заимствованный, например, иероглиф 花 ; Слово «цветок» заимствовано для обозначения «расходов».
- Используется в транслитерированном иностранном слове, например, в словах 打 ; да ; «дюжина» и 馬達 ; муда ; 'мотор'.
- Многофонетические составляющие символы, например 新 ; синь изначально был семантико-фонетическим символом, но его современное значение «новый» не имеет ничего общего с исходным семантическим компонентом 斤 ; Джин ; «0,5 », «кг», но звуки похожи. Таким образом, 新 ; Тогда синь имеет два фонетических компонента: 亲 ; цинь и 斤 ; Джин .
Символы чистой формы состоят из компонентов формы, которые не представляют ни звука, ни значения символов. [77] Например:
- 日 ; «Солнце»: символ日 в современном обычном письме больше не круглый, как Солнце.
- широкий ; 'широкий': Традиционный символ широкий .
- 鹿 ; 'олень': Оракул напоминал оленя.
Семантико-фонетические знаки , называемые также «фоносемантическими знаками», состоят из смысловых компонентов и фонетических компонентов. [78] Существует шесть комбинаций:
- Левое значение (семантическое) и правый звук (фонетическое), например 肝 ; ган ; 'печень', 惊 ; цзин ; 'страх', 湖 ; ху ; 'озеро';
- Правое значение и левый звук, например 鵡 ; уу ; 'попугай', 剛 ; банда ; 'фирма', 甥 ; шэн ; 'племянник';
- Верхнее значение и нижний звук: 霖 ; Лин ; 'дождь', 茅 ; Мао ; «кигограсс» и 竿 ; ган ; 'полюс';
- Нижнее значение и верхний звук: 盂 ; ю ; 'чаша', 岱 ; дай ; «Гора Тай», 鯊 ; ша ; 'акула';
- звуки yeng зуд ' ' 园 ; сад 心 , ' ; внутренние , : ' и Внешний смысл
- внешний звук: biàn ' мэн коса', ' ' тупой , 湹 ; и Внутреннее значение
Символы семантической формы состоят из семантических компонентов и компонентов чистой формы. [79] Многие из этих символов изначально были семантико-фонетическими персонажами. Из-за последующих изменений в произношении фонетических компонентов или символов фонетические компоненты не могли эффективно отражать произношение иероглифа и стали чистой формой. Например: [80]
- 布 ; бу ; «ткань»: раньше имело значение 巾 ; «шарф» и фонетический 父 ; fù , фонетического компонента больше нет 父 .
- 急 ; джи ; «срочно»: раньше имел семантический 心 ; «сердце» и фонетический 及 ; джи . Теперь верхний компонент больше не похож на 及 .
- курица ; jī ; «курица» — птица но не читается как ты» « , .
Символы фонетической формы состоят из фонетических компонентов и компонентов чистой формы. [81] В основном они произошли от древних семантико-фонетических символов, где смысловые компоненты утратили свои функции и приобрели чистую форму. Например,
- 球 ; цю ; «шар»: первоначально относилось к разновидности красивого нефрита с семантическим компонентом 王 (玉} ; «нефрит». Позже оно было заимствовано для обозначения шара, а затем распространено на любой сферический объект, и 王 ; «нефрит» стал чистый компонент формы, тогда как остается 求 фонетическим компонентом.
- 笨 ; Бен ; «глупый»: первоначально относится к внутреннему белому слою бамбука со семантическим компонентом 竹 ; «бамбук» и фонетический 本 ; Бен . Позже этот иероглиф был заимствован по звучанию и означал «глупый».
- 华 ; хуа ; «Великолепный»: это упрощенный иероглиф с фонетическим 化 и чистым компонентом формы 十 .
Семантико-фонетическая форма иероглифов состоит из трех видов компонентов. Например, [77]
- 岸 ; АН ; «банк», «берег»: первоначально имело значение ⿱ 山厂 и фонетическое 干 ; Ган . В современном китайском языке ⿱ 山厂 не является иероглифом или радикалом со звуком или значением, но 山 все же может выражать значение, в то время как 厂 остается компонентом чистой формы.
- 聽 ; тинг ; 'слушать': семантический 耳 ; «ухо» и фонетический 壬 ; Тунг . В современных китайских иероглифах правая часть стала компонентом чистой формы.
Семантико-фонетико-формные символы встречаются очень редко, и приведенные выше примеры не совсем убедительны. Могут ли они быть оправданы как внутренняя структурная категория, еще предстоит изучить. Если не категория, то приведенную выше классификацию можно также назвать «Новые шесть сочинений».
По словам Янга, [79] среди 3500 часто используемых китайских иероглифов в их эксперименте иероглифов семантической составляющей меньше всего, составляя около 5%; символы компонентов чистой формы составляют около 18%; Семантико-форменные и фонетико-формные символы составляют около 19%. Самую большую группу составляют семантико-фонетические символы, составляющие около 58%.
Упрощение
[ редактировать ]Вехи
[ редактировать ]Исторические вехи упрощения китайских иероглифов включают: [82] [83]
В 1909 году Лу Фэйкуй опубликовал статью « Вульгарные китайские иероглифы следует использовать в общем образовании» ( 普通教育當采用俗體字 ). Движение четвертого мая еще больше способствовало упрощению китайских иероглифов. В августе 1935 года Министерство образования Китая в Нанкине опубликовало Список первой партии упрощенных китайских иероглифов ( 第一批簡體字表 ), в который вошли 324 иероглифа. В январе 1956 года Схема упрощения китайских иероглифов была одобрена Государственным советом Китая. В мае 1964 года Общий список упрощенных символов ( 簡化字總表 был опубликован ). Пересмотренная версия была опубликована в 1986 году. В июне 2013 года Таблицу общих стандартных китайских иероглифов Государственный совет Китая опубликовал . Он включает 8105 символов упрощенной китайской письменности. Кроме того, существует 2574 соответствующих традиционных символа и 1023 варианта.
Источники
[ редактировать ]Существует четыре основных источника упрощенных символов: [84]
- Древние символы, такие как: 云 ( 云 ; «облако»), 礼 ( 礼 ; «этикет»), 后 ( 后 ; «после»)
- Популярные в обществе упрощенные китайские иероглифы, такие как: 体 ( 体 ; «тело»), 声 ( 声 ; «звук»), 铁 ( 铁 ; «железо»).
- Курсивные регуляризованные символы, например: 书 ( 书 ; «книга»), 为 ( 为 ; «за»), 东 ( 东 ; «восток»).
- Недавно придуманные символы, например: 国 ( 国 ; 'страна', поддержка ( поддержка ; 'поддержка'), защита ( защита ; 'защита').
Методы
[ редактировать ]Методы упрощения китайских иероглифов включают в себя [85]
Пропуск
[ редактировать ]То есть опустить некоторые компоненты иероглифа, например:
- Опустите одну сторону, например , запись → запись , число → число , облако → юн , 丽 → 丽 ;
- Опустите обе стороны, например Шу → Шу , Ли → Ли ;
- Опустите угол, например Ji → Ji, Ken → Ken ;
- Держите угол, например , звук → звук , лекарство → лекарство ,
- Опустите внутри, например Guang → Guang , Fen → Fen ;
- Опустите снаружи, например 开 → 开 ;
- Опустите штрихи, такие как минус → минус , сеть → сеть , гало → гало ;
- Другие, такие как хуэй → хуэй , зуб → зубы , малярия → малярия , истребление → истребление .
Изменение формы
[ редактировать ]То есть менять формы на основе оригинальных персонажей. Например,
- Измените один или оба компонента семантико-фонетического характера, например, цзин → цзин , защита → защита , кольцо → кольцо , ( часы → часы .
- Замените семантико-фонетические символы, например 蒋 → 蒇 , 屯 → 袁 , Чжуан → Чжуан .
- Измените компоненты многозначных символов, таких как: пыль → пыль , перо → перо .
- Перейдите на многозначные символы, такие как: занавес → занавес , тело → тело , печь → печь .
- , например: черепаха → черепаха , Бао → Бао , Су → Су , Зонтик → Зонтик , Ци → Ци , ) курсив Фа ( упорядоченный Че → Че , Яо → Яо, Ле Ле → , Фа → Сохраняйте контур .
- Обозначьте компоненты, такие как: only → only , Han → Han , Deng → Deng , District → District , Division → Division .
- Упрощайте радикалы, например: 訁 → 讠 ( говорить, говорить ... → говорить, говорить ...), 堠 → 饣 ( 吃荍狠 ...→ пить 荍狠 ), 釒 → 酠 ( сталь медь ... → сталь медь ...).
- Другие: старый → старый , дух → дух , делать → делать .
Замена
[ редактировать ]Обычно заменяют весь символ персонажем со схожим звучанием. Например,
- Долина → Долина ; gǔ , после → после ; hòu , несколько → несколько ; доска доска → ;
- только ; жи → только ; фа ; фа фа → ; фа ; фа .
Рационализация
[ редактировать ]Целью рационализации китайских иероглифов или оптимизации китайских иероглифов ( 漢字整理 ; 汉字整理 ; hànzì zhěnglǐ ) является, помимо упрощения китайских иероглифов , оптимизация китайских иероглифов и установка одной стандартной формы для каждого из них. [86]
Обработка вариантов символов
[ редактировать ]Вариантные китайские иероглифы — это иероглифы с одинаковым произношением и значением, но разными формами, например 夠够 ; гоу ; «достаточно» и 它牠 ; та ; 'это'. Существование вариантов символов приводит к появлению нескольких форм одного символа, что увеличивает бремя изучения и применения языка. В процессе применения китайских иероглифов людям необходимо постоянно обрабатывать варианты иероглифов и удалять неподходящие. [87]
Существует два разных принципа обработки вариантов символов:Один соответствует обычаям и простоте. Другой — следовать исходной форме и значению, основываясь на методе создания иероглифов и этимологии, особенно Шуовэнь Цзецзы . [88]
Существует два метода обработки вариантов символов: Метод выбора заключается в выборе одного из вариантов символов в качестве стандартного символа и исключении остальных. [89] Метод разделения состоит в том, чтобы дифференцировать группу вариантов символов с точки зрения использования, чтобы устранить вариантную связь.
В декабре 1955 года Министерство культуры и Комиссия по культурной реформе КНР совместно объявили «Первый список обработанных вариантов персонажей» ( 第一批异体字整理表 ). После некоторых последующих корректировок список теперь насчитывает 796 групп вариантов символов, а 1027 символов были удалены. [90]
Обработка печатных шрифтов
[ редактировать ]В январе 1965 года Министерство культуры и Комиссия по культурной реформе КНР совместно выпустили Общие формы китайских иероглифов для печати ( 印刷通用汉字字形表 ; 字形表 сокращенно Таблица шрифтов). Таблица шрифтов содержит 6196 часто используемых символов стиля Song для печати. В соответствии с принципами простоты, удобства для изучения и использования для каждого общего символа была указана стандартная форма, включая количество штрихов, структуру и порядок штрихов. После Культурной революции Таблица шрифтов была официально опубликована. Указанные им формы символов теперь принято называть «новыми формами символов», а используемые ранее шрифты назывались «старыми формами символов». «Таблица сравнения форм новых и старых символов» ( 新旧字形对照表 ) во многих языковых справочниках, включая словарь Синьхуа и словарь Сяндай Ханьюй, составлена и напечатана на основе таблицы шрифтов. [91] [92]
Текущие стандарты шрифтов включают:
- В материковом Китае существует Таблица общих стандартных китайских иероглифов выпущенная , Государственным советом 5 июня 2013 года. [20] Символы набраны шрифтом Song.
- На Тайване существует стандартная форма национальных символов ( стандартный шрифт 国字, обычный шрифт ). Символы написаны обычным шрифтом. [93]
- Стандартом, принятым сектором образования Гонконга, является Список графем часто используемых китайских иероглифов ( 常用字字形表 ). Первоначально символы были написаны от руки, затем были изменены на шрифт Kai.
- Список кандзи дзёё для Японии.
- Словарь Канси (де-факто) для Кореи.
Названия мест
[ редактировать ]Чтобы облегчить использование географических названий, китайское правительство начало обрабатывать необычные символы, используемые в географических названиях, в 1950-х годах.
Принципы выбора замещающих символов следующие: [94] [95]
- Такое же произношение и ясное,
- Чаще используется,
- Просто и легко писать,
- Стандартный персонаж, популярный в данной местности.
- Не путать с другими географическими названиями.
С марта 1955 г. по август 1964 г. с одобрения Государственного совета было изменено 35 топонимов уровня уезда и выше. Например:
- « Уезд Тиели » был изменен на « Уезд Тиели »,
- « Округ Поян » был изменен на « Округ Боян » (округ Боян),
- « Префектура Хэтянь » (префектура Хэтянь) была изменена на « Префектура Хэтянь » (префектура Хэтянь).
Позже в целях сохранения стабильности топонимов эта работа была приостановлена. [96]
Измерительные слова
[ редактировать ]Когда английские единицы измерения были переведены на китайский язык, возникли несоответствия в использовании символов. Например:миля: 英里 или 哩 .стопа: 英尺 , 呎 .киловатт: 千瓦 , 瓩 .Таким образом, нагрузка на языковое применение была увеличена. 哩、呎、唡 и т. д. — это специально созданные иероглифы, которые также содержат многосложные звуки, которые не соответствуют односложному образцу китайских иероглифов. Чтобы решить эти проблемы, в июле 1977 года Комиссия по реформе китайского иероглифа и Национальное бюро стандартов и мер КНР совместно выпустили «Уведомление о единообразном использовании иероглифов в названиях некоторых единиц измерения» ( 关于部分计量单位).名称统一用字的通知 ), устанавливающий метрическую систему как основную систему измерения. [97] [98]
Образование
[ редактировать ]Обучение китайским иероглифам – это преподавание и изучение китайских иероглифов. Когда в социальной коммуникации появилось письменное китайское письмо, возникло обучение китайским иероглифам. С древних времен и до наших дней обучение китайским иероглифам всегда было в центре внимания обучения китайскому языку. [99]
Древнее образование
[ редактировать ]В древние времена исследования в области преподавания китайских иероглифов были сосредоточены на подготовке различных централизованных учебников и словарей по грамотности. Среди них к наиболее влиятельным относятся: [100]
- Южные и Северные династии: классика из тысячи символов , написанная обычным шрифтом, 502–549 гг.
- Династия Сун: Сто семейных фамилий , обычный сценарий, 960–1279)
- Династия Сун: классика трех символов , обычный сценарий, 13 век).
Предыдущие три книги затем превратились в набор учебных материалов под общим названием «Триста тысяч» ( 三百千 , около 2000 различных иероглифов), которые использовались более 1000 лет до конца династии Цин и до сих пор имеют определенное влияние сегодня. «Триста тысяч» написана в рифмованной форме, чтобы сделать ее запоминающейся и легко запоминающейся. Еще одним влиятельным учебником по грамотности является «Вэньцзы Мэнцю» ( 文字蒙求 ), составленный для детей писателем династии Цин Ван Цзюнем (1784–1854) и содержащий 2049 символов. [101]
Современное образование на родном языке
[ редактировать ]Современное обучение китайскому характеру является важным компонентом начального образования в Китае, а также важной частью обучения грамоте и преподавания китайского языка как иностранного. [102] [103]
Метод заключается в использовании высокочастотных символов в соответствии со статистикой частот. Важные списки персонажей включают в себя:
- «Список часто используемых символов современного китайского языка» ( Список часто используемых символов современного китайского языка , Комиссия по государственному языку, Пекин, 1988), [104] 3500 символов.
- Таблица общих стандартных китайских иероглифов ( 通用规范汉字表 , 3500 основных иероглифов в этом списке из 8105 иероглифов упрощенной китайской письменности, опубликованном Государственным советом КНР в июне 2013 года)
- Таблица стандартных форм общенациональных иероглифов ( обычно используемые китайские иероглифы, Министерство образования, Тайбэй , 1979 г.), включая 4808 широко используемых китайских иероглифов.
Движение за грамотность китайских иероглифов зародилось в начале 20 века, когда уровень грамотности простых китайцев был довольно низким. Интеллектуалы, которые заботились о стране и ее людях, выступали за образование, чтобы спасти страну, и начали кампанию по обучению китайской иероглифической грамотности. [105] В июне 1952 года Министерство образования Китая опубликовало список часто используемых символов грамотности, включая 2000 символов для использования в учебниках по грамотности. В 1993 году Комиссия по государственному языку опубликовала «Список символов грамотности», который включает таблицы А и Б. Таблица А содержит 1800 символов, необходимых для грамотности в стране, а таблица Б содержит 200 справочных символов для грамотности. [106] По данным ЮНЕСКО , к 2015 году уровень неграмотности в Китае снизился до 3,6 процента.
Обучение иностранному языку
[ редактировать ]В III веке нашей эры китайские иероглифы были завезены в Корею, затем в Японию, Вьетнам и другие страны. Так началось обучение иностранцев китайским иероглифам.К 1989 году в Китае насчитывалось более 100 колледжей и университетов, преподающих китайский язык как иностранный. [107]
С 1990 по 1991 год Национальная ведущая группа по преподаванию китайского языка как иностранного и Центр проверки знаний китайского языка Пекинского института языка совместно разработали « 汉语水平词汇与汉字等级大纲 » (Описание оцениваемого словарного запаса и символов для HSK). Структура китайских иероглифов содержит 2905 символов, разделенных на четыре класса: 800 символов класса A, 804 символа класса B, 601 символ класса C и 700 символов класса D. Среди этих 2905 символов 2485 являются часто используемыми символами первого уровня в « 现代汉语常用字表 » (Список часто используемых символов современного китайского языка). [108] Преподаванию китайских иероглифов как иностранного языка уделяется все больше внимания, появилось множество учебников и факультативов в этой области. В настоящее время в мире существует более 200 Институтов Конфуция, преподающих китайский язык как иностранный.
Информационные технологии
[ редактировать ]Информационные технологии китайских иероглифов (ИТ) — это технология компьютерной обработки китайских иероглифов .В то время как английская система письма использует несколько десятков различных символов, китайскому языку требуется гораздо больший набор символов. более десяти тысяч символов В словаре Синьхуа . [21] В многоязычном наборе символов Unicode, состоящем из 149 813 символов, 98 682 (около двух третей) являются китайскими. [109]
Ввод китайских иероглифов
[ редактировать ]Компьютерный ввод китайских иероглифов далеко не так прост, как английский. Английский язык состоит из 26 букв и нескольких других символов, и каждому символу соответствует клавиша на клавиатуре. Китайский язык можно ввести аналогичным образом. Однако для этого потребуется огромная клавиатура, по крайней мере, с тысячами клавиш. Поиск символа на клавиатуре был бы непростой задачей. [110] Альтернативный способ — закодировать каждый китайский символ английскими символами, что позволит вводить китайский текст на английской клавиатуре. Фактически, этот метод стал преобладающим для китайского компьютерного ввода.
Кодирование на основе звука обычно основано на существующей схеме латинских символов для китайской фонетики, такой как схема пиньинь для китайского языка или путунхуа и схема Джютпин для кантонского диалекта. Входной код китайского иероглифа представляет собой строку букв пиньинь, за которой следует необязательное число, обозначающее тон. Например, входной код Путунхуа Пиньинь для 香港 (Гонконг) — «xianggang» или «xiang1gang3», а кантонский код Jyutping — «hoenggong» или «hoeng1gong2», и все эти коды можно легко ввести с помощью английской клавиатуры.
Альтернативно китайский символ можно ввести с помощью кодировки на основе формы . Большинство китайских иероглифов можно разделить на последовательность компонентов в порядке написания. Есть несколько сотен основных компонентов, [111] намного меньше, чем количество символов. Представляя каждый компонент английской буквой и размещая их в порядке написания символов, создатель метода ввода может получить строку букв, готовую для использования в качестве кода ввода на английской клавиатуре. Конечно, создатель также может разработать правило для выбора характерных букв из строки, если она слишком длинная. Например, в методе ввода Цанцзе символ 疆 (граница) кодируется как «NGMWM», соответствующий компонентам «弓土一田一», при этом некоторые компоненты опущены.Популярные методы кодирования на основе форм включают Wubi (五笔) на материке и Cangjie (倉頡) на Тайване и в Гонконге. [112]
Наиболее важной особенностью интеллектуального ввода является применение контекстуальных ограничений для выбора символов-кандидатов. Например, в Microsoft Pinyin, когда пользователь вводит код ввода «daxuejiaoshou», он/она получит « 大学教授 / 大學教授 » (профессор университета), когда пользователь вводит «daxuepiaopiao», компьютер предложит « 大雪飘飘 / 大雪飄 »飄 » (полет сильный снег). Хотя неотонированные буквы пиньинь 大学 и 大雪 являются «даксуэ», компьютер может сделать разумный выбор на основе последующих слов. [113]
Кодировка китайских символов для обмена информацией
[ редактировать ]Внутри компьютера или мобильного телефона каждый символ представлен внутренним кодом. Когда символ передается между двумя компьютерами или другими цифровыми устройствами, он находится в коде обмена информацией. В настоящее время коды обмена информацией, такие как ASCII и Unicode, часто напрямую используются в качестве внутренних кодов.
Первый стандарт кодирования китайских символов GB — GB2312 , который был выпущен КНР в 1980 году. Он включает в себя 6763 китайских иероглифа, из которых 3755 часто используемых отсортированы по пиньинь , а остальные — по радикалам (компонентам индексации). GB2312 был разработан для упрощенных китайских иероглифов . Традиционные символы , которые были упрощены, не рассматриваются. Код символа представлен двухбайтовым шестнадцатеричным числом, например, коды GB 香港 (Гонконг) — CFE3 и B8DB соответственно. GB2312 до сих пор используется на некоторых компьютерах и в WWW, хотя были выпущены более новые версии с расширенными наборами символов, такие как GB13000.1 и GB18030. [114] Последняя версия кодировки GB — GB18030 , которая поддерживает как упрощенные, так и традиционные китайские символы и соответствует набору символов Юникода. [115]
Стандарт Big5 кодирования был разработан пятью крупными ИТ-компаниями Тайваня в начале 1980-х годов и с тех пор является фактическим стандартом для представления традиционного китайского языка в компьютерах. Big5 широко используется на Тайване, в Гонконге и Макао.Первоначальный стандарт Big5 включал 13 053 китайских иероглифа без каких-либо упрощенных символов материкового Китая. Каждый символ кодируется двухбайтовым шестнадцатеричным кодом, например 香 (ADBB) 港 (B4E4) 龍 (C073). Китайские иероглифы в наборе символов Big5 расположены в радикальном порядке.Расширенные версии Big5 включают Big-5E и Big5-2003, которые включают некоторые упрощенные символы и символы гонконгского кантонского диалекта. [116]
Полная версия стандарта представляет Unicode символ с 4-байтовым цифровым кодом, предоставляя огромное пространство для кодирования, охватывающее все символы всех языков мира. Базовая многоязычная плоскость (BMP) — это 2-байтовая версия ядра Unicode с 2^16=65 536 кодовыми точками для важных символов многих языков. В зоне иероглифов CJKV (Китай, Япония, Корея и Вьетнам) содержится 27 522 символа, включая все упрощенные и традиционные китайские иероглифы в GB2312 и традиционные символы Big5. В Unicode 15.0 имеется многоязычный набор символов из 149 813 символов, среди которых более 98 682 (около 2/3) являются китайскими, отсортированными по Kangxi Radicals . Доступны даже очень редко используемые символы. Например: H (0048) K (004B), 香 (9999), 港 (6E2F), 龍(9F8D), 龙 (9F99), 龖 (9F96), 龘 (9F98), 𪚥 (2A6A5). [109] [117]
Юникод становится все более популярным. Сообщается, что UTF-8 (Unicode) используется на 98,1% всех веб-сайтов. Широко распространено мнение, что Unicode в конечном итоге заменит все другие коды обмена информацией и внутренние коды, и путаницы в кодах больше не будет. [118]
Вывод китайских иероглифов
[ редактировать ]Как и английский и другие языки, китайские иероглифы выводятся на принтеры и экраны различными шрифтами и стилями. Наиболее популярными китайскими шрифтами являются Song ( традиционный китайский : 宋体 ; упрощенный китайский : 宋体 ), Kai ( 楷体 ; 楷体 ), Hei ( 黑体) . ; жирный шрифт ) и семьи Фансонг ( подражая династии Сун ; подражая династии Сун ). [50]
Шрифты отображаются в разных размерах. В дополнение к международной системе измерения точек , китайские иероглифы также измеряются числами размеров ( традиционный китайский : 字號 ; упрощенный китайский : 字号 ; пиньинь : цзихао ), изобретенными американцем для китайской печати в 1859 году. [51]
Компьютерный ввод китайских иероглифов
[ редактировать ]Компьютерный вывод китайских иероглифов
[ редактировать ]Внутреннее представление китайских иероглифов в компьютере
[ редактировать ]Информационный обмен китайскими иероглифами
[ редактировать ]Набор компьютерных символов для китайских иероглифов
[ редактировать ]Упрощенный китайский, традиционный китайский и многоязычная обработка информации
[ редактировать ]Автоматическое преобразование китайских иероглифов в пиньинь
[ редактировать ]и т. д.(Чжан, 2016 г. и cbs517 содержат подробные вводные и экспериментальные упражнения.)
-->
См. также
[ редактировать ]- Китайские иероглифы
- Штрихи китайских иероглифов
- Компоненты китайских иероглифов
- Китайский иероглиф ИТ
- Персонажи CJK
- Кандзи
- Таблица общих стандартных китайских иероглифов
- Варианты китайских иероглифов
- Письменный китайский
Примечания
[ редактировать ]Ссылки
[ редактировать ]Цитаты
[ редактировать ]- ^ Перейти обратно: а б В 2014 году , стр. 19–21.
- ^ Перейти обратно: а б с Национальная языковая комиссия 2009 г. , с. 1.
- ^ Перейти обратно: а б «Статистика частотности китайских иероглифов для Гонконга, материкового Китая и Тайваня — межрегиональное диахроническое исследование: Гонконг, материковый Китай, Тайвань — статистика частотности часто используемых китайских иероглифов в разных регионах и поколениях » .
- ^ Перейти обратно: а б Они в 2014 году .
- ^ Перейти обратно: а б Тот самый 2008 года .
- ^ Цю 2013 , стр. 45–101.
- ^ Чжоу 1980 .
- ^ Гао и Фан 1985 .
- ^ В 2014 году , стр. 29–30.
- ^ Инь и Ван 2007 , с. [ нужна страница ] .
- ^ Гао, Фей и Фань 1993 , стр. [ нужна страница ] .
- ^ Чжан 1992 .
- ^ Пекинский университет, 2004 г. , стр. 145–148.
- ^ Норман 1988 , стр. 74–75.
- ^ Норман 1988 , с. 74.
- ^ В 2014 году , стр. 51–52.
- ^ Вс 2014 , с. 47.
- ^ 现代汉语常用字表 Архивировано 13 ноября 2016 г. в Wayback Machine [Список часто используемых символов современного китайского языка], Министерство образования Китайской Народной Республики, 26 января 1988 г.
- ^ 现代汉语通用字表. Архивировано 23 ноября 2016 г. в Wayback Machine [Список часто используемых символов современного китайского языка], Министерство образования Китайской Народной Республики , 26 января 1988 г.
- ^ Перейти обратно: а б «Уведомление Государственного совета о публикации «Общего стандартного списка китайских иероглифов». Gov.cn (на китайском языке). Государственный совет Китайской Народной Республики . 5 июня 2013 г.
- ^ Перейти обратно: а б Языковой институт 2020 .
- ^ Институт языка 2016 .
- ^ Национальная академия корейского языка (1991). Архивировано 19 марта 2016 года в Wayback Machine.
- ^ « Имя человека» значительно расширилось с 5761 китайского иероглифа до 8142 иероглифов» . Чосон Ильбо (на корейском языке). 20 октября 2014 г. Проверено 23 августа 2017 г.
- ^ Вс 2014 , с. 51.
- ^ (Конспект лекций по предмету «Современные китайские иероглифы и информационные технологии», кафедра китайских и двуязычных исследований Гонконгского политехнического университета, доктор Чжан Сяохэн, 12 июня 2017 г.)
- ^ «UAX № 38: База данных Unicode Han (Unihan)» .
- ^ Норман 1988 , с. 73.
- ^ Перейти обратно: а б Его 2014 , с. 34.
- ^ Вс 2014 , с. 35.
- ^ Чен 1928 .
- ^ Национальная языковая комиссия 2013 .
- ^ Вс 2014 , с. 42.
- ^ В 2014 году , стр. 183–207.
- ^ Жан 2008 , с. 19-24.
- ^ Ван и Цзоу 2003 , с. 20-27.
- ^ Ван и Цзоу 2003 , с. 27-28.
- ^ Ван и Цзоу 2003 , с. 29-31.
- ^ В 2014 году , стр. 201–202.
- ^ Пекинский университет, 2004 г. , стр. 148–152.
- ^ Чжан и Ли 2013 .
- ^ В 2014 году , стр. 74–75.
- ^ Национальная языковая комиссия 1999 .
- ^ «Стандарт Unicode, версия 15.1: штрихи CJK» (PDF) .
- ^ В 2014 году , стр. 82–84.
- ^ Вс 2014 , с. 86.
- ^ Перейти обратно: а б Национальная языковая комиссия 2009 г. , с. 2.
- ^ Вс 2014 , с. 94.
- ^ Национальная языковая комиссия 2009a , стр. 1.
- ^ Перейти обратно: а б Ли 2013 , с. 62.
- ^ Перейти обратно: а б Чжан 2006 .
- ^ Пекинский университет, 2004 , с. 169.
- ^ В 2014 году , стр. 160–161.
- ^ Национальная языковая комиссия, 1985 .
- ^ Пекинский университет, 2004 , с. 171.
- ^ В 2014 году , стр. 172–175.
- ^ Вс 2014 , с. 176.
- ^ Пекинский университет, 2004 , с. 172.
- ^ Чжоу 1993 .
- ^ Вс 2014 , с. 180.
- ^ Цю 2013 , стр. 210–211.
- ^ Ян 2008 , с. 169.
- ^ Фромкин 1993 , с. 41.
- ^ Ян 2008 , с. 170–172.
- ^ Ли 1988 , с. 1112.
- ^ Перейти обратно: а б Ли 2013 , с. 231.
- ^ Ли 2013 , с. 232.
- ^ В 1994 году , стр. 128–129.
- ^ Вс 1994 , с. 129.
- ^ Ян 2008 , стр. 173–174.
- ^ Ли 2013 , стр. 122-124.
- ^ Цю 2013 , стр. 102–108.
- ^ Инь и Ван 2007 , стр. 97–100.
- ^ В 2014 году , стр. 102–111.
- ^ Перейти обратно: а б Инь и Ван 2007 , с. 98.
- ^ В 2014 году , стр. 103–105.
- ^ Перейти обратно: а б Инь и Ван 2007 , с. 100.
- ^ Инь и Ван 2007 , с. 99.
- ^ Перейти обратно: а б Ян 2008 , с. 147.
- ^ Вс 2014 , с. 107-108.
- ^ Вс 2014 , с. 109.
- ^ В 2014 году , стр. 120–126.
- ^ Ли 2013 , стр. 300-302.
- ^ Вс 2014 , с. 127.
- ^ Вс 2014 , стр. 127–128; Ли 2013 , с. 304.
- ^ Ян 2008 , с. 116.
- ^ Пекинский университет, 2004 , с. 163.
- ^ В 2014 году , стр. 141.
- ^ В 2014 году , стр. 141–142.
- ^ Издательство китайского языка, 1997 , стр. 10. 182.
- ^ В 2014 году , стр. 145–146.
- ^ Ли 2013 , стр. 301-302.
- ^ « Рукопись обычным шрифтом китайского стандартного шрифта <Порядок слов Министерства образования>» [Рукопись обычным шрифтом китайского стандартного шрифта <Порядок слов Министерства образования>].
- ^ Вс 2014 , с. 148.
- ^ Фу 1994 , с. 95.
- ^ Ли и Фей 2001 , с. 260.
- ^ В 2014 году , стр. 150–151.
- ^ «Уведомление о едином использовании слов в названиях некоторых единиц измерения» Архивировано из оригинала 28 июля 2016 г.
- ^ Ли 2013 , с. 366.
- ^ В 2014 году , стр. 245–246.
- ^ Ян 2008 , с. 216.
- ^ Ян 2008 , с. 217.
- ^ В 2014 году , стр. 248–249.
- ^ «Список часто используемых иероглифов современного китайского языка» .
- ^ Ян 2008 , с. 219.
- ^ Ян 2008 , стр. 219–220.
- ^ Деньги 2001 , с. 147.
- ^ Ян 2008 , с. 220.
- ^ Перейти обратно: а б «Статистика Юникода» .
- ^ Вс 2014 , с. 218.
- ^ Национальная языковая комиссия 1997 .
- ^ Чжан 2016 , с. 422.
- ^ Вс 2014 , с. 222.
- ^ В 2014 году , стр. 213–215.
- ^ Лунде, Кен (4 августа 2022 г.). «Стандарт ГБ 18030-2022» . Середина . Проверено 7 августа 2022 г.
- ^ «[китайский Mac] Наборы символов» . chinesemac.org . Проверено 24 ноября 2023 г.
- ^ Консорциум Unicode 2023 .
- ^ «Статистика использования и рыночная доля UTF-8 для веб-сайтов, ноябрь 2023 г.» .
Цитируемые работы
[ редактировать ]- Аркодия, Джорджо (и Башано, Бьянка) (2021). Китайская лингвистика . Оксфорд: Издательство Оксфордского университета. ISBN 978-0-19-884784-7 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Чен, Хэцинь Чэнь Хэцинь (1928). Прикладная лексика лингвистики [ Прикладная лексика народного китайского языка ] (на китайском языке). Пекин: Шанву (Коммерческая пресса).
- Чен, Маорен Чен Маорен (2021). Введение в филологию [ Введение в китайскую письменность ] (на китайском языке: Нью-Сюэлин).
- Издательство китайского языка, Издательство китайского языка КНР (1997). Руководство по спецификации языка [ Справочник языковых стандартов ] (на китайском языке: China Language Press).
- Фромкин, Виктория (и Роберт Родман) (1993). Введение в язык (5-е изд.). Орландо, США: Издательство колледжа Харкорт Брейс Джаванович. ISBN 0-03-075379-1 .
- Фу, Юнхэ傅永和 (1994). Стандартизированные китайские иероглифы [ Стандартизация китайских иероглифов ] (на китайском языке: Chinese Language Press).
- Фу, Юнхэ傅永和 (1999). Китайская обработка информации [ Обработка китайской информации ] (на китайском языке) (3-е изд.) . 9-787540-640804 .
- Гао, Цзяин Гао Цзяин Фань, Кейю Фан Кейю (1985). Краткая дискуссия о создании современных исследований китайского характера. [Краткая дискуссия о создании современных китайских исследований иероглифов]. Журнал Шанхайского педагогического университета [ Журнал Шанхайского педагогического университета ]. 1985 (4).
- Гао Фэй, Цзиньчан Фэй Цзиньчан, Кейю Фань Кейю (1993); Гао, Цзяин современные кандзи [ Современные китайские иероглифы Higher Education Press). ] (на китайском языке: ISBN 7040040670 .
- Институт языка Китайской академии социальных наук (2016). Современный китайский словарь [ Современный китайский словарь ] (на китайском языке) (7-е изд.). Пекин: Коммерческая пресса. ISBN 978-7-100-12450-8 .
- Институт языка Китайской академии социальных наук (2020). Синьхуа Зыдиан Словарь Синьхуа [ Словарь Синьхуа ] (на китайском языке) (12-е изд.). Пекин: Шанву иньшугуань (Коммерческая пресса). ISBN 978-7-100-17093-2 .
- Ли, Дасуи Ли Даси (2013). Краткие и практические исследования китайских иероглифов [ Краткие и практичные китайские иероглифы ] (на китайском языке) (3-е изд.). Пекин: Издательство Пекинского университета. ISBN 978-7-301-21958-4 .
- Ли, Гуньи Ли Гуньи (1988) Лю, Рушуй Лю Рушуй (ред.). Информационный словарь китайских иероглифов [ Информационный словарь китайских иероглифов ] (на китайском языке: Science Press) . 7-03-000862-6 .
- Ли, Синцзянь Ли Синцзянь Фэй, Цзиньчан Фэй Цзиньчан (2001); Рекомендации по использованию языковых спецификаций [ Руководство по применению стандартов языка и символов ] (на китайском языке: Издательство Shanghai Dictionary).
- Национальная комиссия по языку, Министерство образования, Китай (1985 год). Список слов для произношения мандаринского варианта [ Таблица слов китайского языка с вариантами произношения ] (PDF) . Пекин: Национальная языковая комиссия . Проверено 15 сентября 2023 г.
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Национальная языковая комиссия КНР (1997). Стандарт компонентов китайских символов набора символов GB13000.1 для обработки информации (PDF) . Пекин: Национальная языковая комиссия Китая.
- Национальная языковая комиссия Министерства образования Китая (1999 год). GB13000.1 Набор символов Порядок китайских символов (порядок штрихов) Спецификация [ Стандарт набора символов GB13000.1. Порядок китайских символов (порядок на основе штрихов) ] (PDF) (на китайском языке). Шанхайское образовательное издательство. ISBN 7-5320-6674-6 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Национальная языковая комиссия Министерства образования Китая (2009a). Стандарты для современных односимвольных символов, обычно используемых [ Спецификация неразложимых иероглифов, обычно используемых в современном китайском языке ] (PDF) . Пекин: Национальная языковая комиссия . Проверено 8 сентября 2023 г.
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Национальная языковая комиссия Министерства образования Китая (2009 г.). Стандарты современных часто используемых символов и названий компонентов. [ Спецификация распространенных современных китайских иероглифов и названий компонентов ] (PDF) . Пекин: Национальная языковая комиссия . Проверено 3 сентября 2023 г.
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Национальная языковая комиссия Министерства образования Китая (2013 г.). Отчет о ситуации в жизни китайского языка за 2012 год [ Отчет о языковой жизни в Китае, 2012 г. ] (на китайском языке). Пекин: Шанву (Коммерческая пресса).
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Норман, Джерри (1988). Китайский . Кембридж: Издательство Кембриджского университета. ISBN 978-0-521-29653-3 .
- Пекинский университет, Отдел преподавания и исследования современного китайского языка (2004 г.). Сяндай ханью современный китайский [ Современный китайский ] (на китайском языке). Шану иньшугуань (Коммерческая пресса). ISBN 7-100-00940-5 .
- Цю, Сигуй (2000). Китайское письмо . Перевод Гилберта Л. Маттоса; Джерри Норман. Беркли: Общество изучения раннего Китая и Институт исследований Восточной Азии Калифорнийского университета. ISBN 978-1-55729-071-7 ( Английский перевод Вэньцзюэ Гайяо резюме филологии , Шанву, 1988.)
- Цю, Сигуй Цю Сигуй (2013). Обзор графологии [ Китайское письмо ] (на китайском языке) (2-е изд.) . 978-7-100-09369-9 .
- Су, Пэйчэн Су Пэйчэн (1994). Очерк современных исследований китайских иероглифов [ Основы современных китайских иероглифов, глава 6 ] (на китайском языке). Пекин: Издательство Пекинского университета). ISBN 7-301-02597-1 .
- Су, Пейчэн Су Пэйчэн (2014). Очерк современных исследований китайских иероглифов [ Основы современных китайских иероглифов е изд.). ] (на китайском языке) (3 - 978-7-100-10440-1 .
- Консорциум Юникод (2023 г.). Стандарт Юникод, версия 15.1.0 . Маунтин-Вью, Калифорния: Консорциум Unicode.
- Ван, Нин (王宁) (2001). Краткое описание китайских иероглифов [ Очерк изучения китайского характера ] (на китайском языке). Пекин: Издательство Пекинского педагогического университета.
- Ван, Нин Цзоу, Сяоли (2003). справочник [ Справочники ] (на китайском языке: ISBN Peace Books Ltd.). 962-238-363-7 .
- Ян, Рунлу Ян Рунлу (2008). современные кандзи [ Современные китайские иероглифы ] (на китайском языке). Пекин: Издательство Пекинского педагогического университета. ISBN 978-7-303-09437-0 .
- Инь, Цзиминь иньцзин; Ван, Рудонг Вангрудонг (2007). Сяндай ханью вэньцзысюэ Современная китайская филология [ Современное китайское письмо ] (на китайском языке). Шанхай: Издательство Фуданьского университета. ISBN 978-7-309-05525-2 .
- Жан, Дэю и др. (2008). Как пользоваться китайскими справочниками [ Как пользоваться китайскими справочниками ] (на китайском языке). Пекин: Коммерческая пресса. ISBN 978-7-100-01510-3 .
- Чжан, Цзинсянь Чжан Цзинсянь (1992). Учебник по современным китайским иероглифам [ Учебное пособие по современным китайским иероглифам ] (на китайском языке). Пекин: Современная пресса.
- Чжан, Сяохэн Чжан Сяохэн (2006). «Система счисления», «система баллов» и «метрическая система» шрифтов. [Числовая, точечная и метрическая системы размера шрифта]. Компьютерная инженерия и приложения [ Вычислительная техника и приложения ]. 42 (10): 175–177 и стр. 215.
- Чжан, Сяохэн Ли, Сяотун (2013). Руководство по проверке заказа на один, два, три такта [ Справочник по методу сортировки YES ] (на китайском языке). Пекин: 语文出版社 (The Language Press). ISBN 978-7-80241-670-3 .
- Чжан, Сяохэн (2016). «Компьютерная лингвистика». Энциклопедия китайского языка Routledge . Оксфордфорд: Рутледж. стр. 420–437. ISBN 978-0-415-53970-8 .
- Чжоу, Югуан Чжоу Югуан (1980). Открытие современных китайских иероглифов [Введение в изучение современного китайского характера]. Модернизация китайского языка [ Модернизация языка ]. 2. Знание Пресс.
- Чжоу, Югуан Чжоу Югуан (1993). Язык в эпоху передачи «Язык в эпоху передачи звука». Новости образования Китая [ Новости образования Китая ]. 10 (27).
- Чжоу, Югуан (2003). Историческая эволюция китайских языков и письменности . Перевод Чжан Лицина. Колумбус: Национальный ресурсный центр восточноазиатских языков, Университет штата Огайо. ISBN 978-0-87415-349-1 .