Jump to content

Компоненты китайских иероглифов

В письменном китайском языке компоненты ( китайский : 部件 ; пиньинь : bùjiàn ) являются строительными блоками символов, состоящими из штрихов. [1] В большинстве случаев компонент состоит из более чем одного штриха и меньше, чем весь символ. Например, иероглиф состоит из двух компонентов: и . Их можно дополнительно разложить: можно анализировать как последовательность штрихов ㇓㇑ , а как последовательность ㇓㇐㇐㇑ . [2]

Существует два метода анализа компонентов китайского иероглифа: иерархическое деление и плоское деление . Иерархическое разделение отделяет слой за слоем от более крупных компонентов к более мелким и, наконец, получает примитивные компоненты. Разделение плоскости отделяет примитивные компоненты одновременно. [3]

Структура китайского иероглифа — это образец или правило, по которому иероглиф формируется из его компонентов (первого уровня). [4] Структуры китайских иероглифов включают однокомпонентную структуру, структуру лево-право, структуру вверх-вниз и окружающую структуру. [5]

Китайские иероглифы можно анализировать с точки зрения более мелких компонентов. Этот анализ обычно основан на графических формах без учета таких аспектов, как произношение и значение. [3]

Анализ компонентов очень полезен для изучения китайских иероглифов. Например:

  • думать фаза + сердце
  • Хунань + фаза
  • фаза дерево + глаз

Благодаря компонентному анализу можно легче изучать символы. Если учащийся сначала выучит , эти знания помогут ему в изучении или повторении , , и . Очевидно, что обучение посредством анализа компонентов гораздо эффективнее, чем обучение путем анализа каждого символа по штрихам. Компонентный анализ также используется в кодировке китайских символов для компьютерного ввода. [6]

Существует два метода разделения китайских иероглифов: иерархическое деление и плоское деление . Иерархическое разделение слой за слоем отделяет большие компоненты от мелких и, наконец, получает примитивные компоненты. Разделение плоскости отделяет примитивные компоненты одновременно. Иерархическое деление может отображать внешнюю структуру китайских иероглифов, тогда как плоское разделение можно рассматривать как исключение более высоких уровней разделения и прямую запись окончательного результата разделения примитивных компонентов. [3]

Правила деления

[ редактировать ]

К правилам иерархического деления относятся: [7]

  • Канава /промежуток разделительного пространства ( 分割沟 ) — это очевидная граница, где символ (или более крупный компонент) разделяется на (меньшие) компоненты.
  • вдоль разделительной на два разделите ее имеется ингредиента Если , одна канава канавы только разделительная .
  • Если имеется более одной разделительной канавы, сначала разделите по более длинной. Например: Соу Соу + 、Соу ( Ме + Шин , чтобы получить иерархическую структуру Со Ки Соу ( Дерево + Я ) + Шо ) с двумя слоями. компонентов.
  • Если несколько разделительных канав параллельны и равны по длине, разделите их вдоль всех. Например: + + .
  • Пересекающиеся группы штрихов не делятся, например, и — примитивные компоненты.
  • Нижняя граница деления обычно больше, чем одиночные штрихи, а компоненты, состоящие только из двух штрихов, например « 二八刁 », не подлежат разделению.
  • Иерархический анализ должен соответствовать базовой структуре китайских иероглифов. Например: самый внешний слой « » имеет структуру лево-право, поэтому сначала используется разделение на лево и право: + , за которым следует разделение внутри-внешне ( + ), хотя Г-образный разделительный ров последнего может быть длиннее.
  • Персонаж, содержащий многоуровневые компоненты, разделяется от большего размера к меньшему для создания компонентов первого уровня, компонентов второго уровня, компонентов третьего уровня и т. д.

Иерархический анализ символа в (1) представлении в квадратных скобках:

(((+(+))+(⿱夂貢)(+(+(+))))+),[a] 5 layers of components.

или в древовидной структуре:

                    
                  /    \
                       
              /    \
                 (⿱夂貢)
            /  \    /  \
                   
              /  \     /  \
                     
                         /  \
                           

Уровень анализа или разделения китайского иероглифа зависит от реальных приложений.

При плоском анализе представлены только компоненты на листьях дерева, т.е.

: ,,,,,,,.

Данные анализа Cihai

[ редактировать ]

Ниже приведены данные анализа Цихая ( 辭海 ) с набором символов, состоящим из 16 339 традиционных и упрощенных китайских иероглифов. [8]

Цихай Анализ компонентов традиционного и упрощенного китайского иероглифа
уровень компонента различные компоненты общие компоненты
1 3061 32065
2 1302 34296
3 539 16777
4 195 3872
5 48 396
6 12 184
7 3 6

В большинстве случаев компонент больше штриха и меньше всего символа (в сочетании с некоторыми другими компонентами образует символ). Условием того, чтобы одиночный штрих был компонентом, является: занимает относительно независимое место, обычно занимаемое компонентом из нескольких штрихов в символе. Например: верхняя черта в иероглифе , нижняя в , левая в , правая ㇟ в , центральная ㇔ в и внешняя ㇆ в . В особых случаях однострочных символов, таких как и , штрих является компонентом и символом. [9]

Классификация компонентов

[ редактировать ]

Компоненты персонажа и нехарактерные компоненты

[ редактировать ]

Компонент, который может независимо формировать персонаж, — это компонент персонажа или компонент независимого формирования персонажа ( 成字部件 ). Например, компонент независимо формирует символ и является компонентом символов , и ; и компонент также является символом сам по себе и компонентом в , и . [1]

является . формирования , , не являющимся Компонент иероглифа иероглифом , который сформировать иероглиф , или компонентом зависимого не может самостоятельно компонентом в Ни иероглифом . ни не является современном китайском языке [1]

Примитивные компоненты и составные компоненты

[ редактировать ]

Компонент, который не может быть (дальнейше) разделен на более мелкие компоненты по правилам, является примитивным компонентом, или базовым компонентом ( 基礎部件 , 基础部件 ). Примитивные компоненты — это компоненты конечного уровня иерархического деления. Например, компоненты и в символьном формате и в символьном . [4]

Компонент, состоящий из двух или более примитивных компонентов, является составным компонентом ( синтетическим компонентом ). Например, компонент 咅(立+口) в символьном сопровождении , bu и bo , и компонент xiang(木+目) в xiang , Frost и Widow. . [4]

Иерархия компонентов

[ редактировать ]

Компонент, выделенный на первом уровне, называется компонентом первого уровня, компонент, выделенный на втором уровне, называется компонентом второго уровня и так далее. Компонент, выделенный на конечном уровне, называется компонентом конечного уровня, т. е. примитивным компонентом. Например, в примере с символом :

                   
                 /    \
                       (level-one components)
             /    \
                (⿱夂貢) (level-two components)
           /  \    /  \
                   (level-three components)
             /  \     /  \
                     (level-four components)
                        /  \
                           (level-five components)

конечные компоненты где или компонентами примитивными компонентами являются уровня конечного and .

Однотактные компоненты и многотактные компоненты

[ редактировать ]

Деталь, образованная одним штрихом, называется однотактной деталью. Например, штрих в характере 丛, удар ㇑ в иероглифе 引, удар ㇓ в характере 系, удар ㇔ в характере 良, штрих ㇆ в иероглифе . [4]

Компонент, образованный более чем одним штрихом, называется многотактным компонентом. Например, компонент в символе , в символе и в .

Примитивные компоненты

[ редактировать ]

Среди 16 339 традиционных, упрощенных и неупрощенных иероглифов в Цихае 675 примитивных компонентов; среди 11 834 символов, исключая упрощенные традиционные символы, имеется 648 примитивных компонентов. [10] В китайских иероглифов информационном словаре [11] Среди 7785 стандартных иероглифов материкового Китая выделено в общей сложности 623 примитивных компонента.

Примитивные компоненты с наибольшим количеством комбинаций символов в Cihai.
серийный номер компоненты персонажи составлены частота
1 рот 2409 20.3579%
2 один 1279 10.8089%
3 трава 812 6.8622%
4 дерево 791 6.6841%
5 люди 774 6.5404%
6 день 766 6.4736%
7 691 5.8391%
8 679 5.7383%
9 восемь 642 5.4252%
10 земля 597 5.0457%

(Разделен из 11 834 упрощенных и неупрощенных символов из Цихая ). [10]

Стандарты компонентов

[ редактировать ]

Компоненты китайских символов широко используются в методах ввода кодировки клавиатуры с китайскими символами. Различные методы кодирования ввода имеют разные способы разделения компонентов. Поэтому необходимо сформулировать нормы или стандарты, касающиеся компонентов китайского иероглифа.

«Стандарт китайского символьного компонента набора символов GB13000.1 для обработки информации» ( 信息处理用 GB13000.1 字符集汉字部件规范 ) — это стандарт, выпущенный 1 февраля 1997 года Национальной языковой комиссией Китая. Он включает «Список примитивных компонентов китайских иероглифов». Список содержит 560 примитивных компонентов. Все 20 902 китайских иероглифа CJK в наборе символов GB13000.1 могут быть сформированы с помощью этих компонентов. Этот стандарт в основном предназначен для обработки информации в Китае. [12]

Еще одним важным стандартом является «Спецификация общих компонентов современных китайских иероглифов и названий компонентов », сформулированная Национальной языковой комиссией в 2009 году. [13] [14] Он включает в себя список из 514 примитивных компонентов часто используемых символов и названий компонентов. Этот стандарт в основном предназначен для обучения китайским иероглифам и сопоставления словарей.

Именование компонентов

[ редактировать ]

Правила именования компонентов включают в себя следующее: [15]

Если компонент является символом, то назовите его этим символом, например: (kϒu) и (tϔ). Если у иероглифа более одного звука, используйте более распространенный, например: компонент « » называется zhōng , а не zhòng .

Если компонент не является символом, то если у него есть имя, то используйте существующее имя. Например, (ти шу, 提手 ) и (бо гай, 宝盖 ). Если компонент имеет более одного имени, используйте обычно используемое имя, например, скорее называется шуанг ли рен ( 双立人 ), чем шуангрен пан ( 双人旁 ).

Для компонента без названия следует определить разговорное и разумное название. Один из способов — обратиться к компоненту по его положению в обычных символах. Например: «голова персонажа » ( , 青字头 ), «рама персонажа » ( , 国字框 ).

Структуры китайских иероглифов

[ редактировать ]

Структура китайского иероглифа — это образец или правило, по которому иероглиф формируется из его компонентов (первого уровня). [4] Структуры китайских иероглифов включают в себя [5]

  • Однокомпонентная структура: иероглиф состоит из одного примитивного компонента, такого как , и .
  • Структура «лево-право» (⿰): иероглиф состоит из компонента слева и компонента справа, например , и .
  • Структура левый-средний-правый (⿲): иероглиф формируется из компонента слева, компонента справа и компонента посередине, например , и .
  • Структура «вверх-вниз» (⿱): иероглиф формируется компонентом, расположенным над другим компонентом, например , и .
  • Структура «вверх-средний-вниз» (⿳): иероглиф состоит из компонента вверху, компонента внизу и компонента посередине, например , и .
  • Полное окружение (⿴): например, страна , окружение и возвращение .
  • Левый-верхний-правый-окружающий (⿵): например, тот же , вопрос и направление .
  • Вверху слева внизу (⿷): например, район , мастер и ящик .
  • Окружение слева-снизу-права (⿶): например, , и .
  • В верхнем левом углу (⿸): например, Ли , Гуан и Цзюй .
  • В правом верхнем углу (⿹): например, Si , Ke и Oxygen .
  • Окружение слева внизу (⿺): например, ввод , сборка и вопрос .
  • перекрытие (⿻) или многокадровое окружение: например, сидеть , ездить , уединяться , предзнаменование .

Принципы анализа структуры первого уровня китайского иероглифа можно распространить на другие уровни. Например, символ находится в структуре «лево-право», а левый компонент — в структуре «вверх-вниз».

Деформация компонентов

[ редактировать ]

Иногда, чтобы сделать глиф более красивым и разумным по структуре, может потребоваться изменить форму компонента в соответствии с окружением персонажа. Деформация деталей может производиться двумя способами:

  1. Измените форму отдельных штрихов.
  2. Весь компонент сплющен или сужен. [16]

Деформация хода внутри компонента

[ редактировать ]

Инсультная деформация включает в себя следующие ситуации: [16]

  • Когда нижняя черта левого компонента ㇐ ( хэн , горизонтальная) или ㇐ пересекается с ㇑ ( шу , вертикальная), ㇐ обычно меняется на ㇀ ( ти ). Например: атака, город, гордость, класс, конвергенция, Солнце, специальный, ось , исключение: ось седла .
  • Когда «半、羊、辛 в качестве левого компонента используется », последняя черта ㇑( шу ) должна быть заменена на ㇓( пирог ). Например: « 判、翔、辣 ».
  • Если последняя черта компонента — ㇏ ( na ), а компонент находится с левой стороны или в окружающей структуре, то ㇏ часто необходимо заменить на ㇔ ( диан , точка). Например: « 林、劝、因 ».
  • Если соседние штрихи имеют два или более (параллельных) ㇏ ( na ), обычно оставляют только один ㇏, а остальные заменяют на ㇔ (точки). Например: « 秦、这、炎、餐 ».
  • Если компонент « » находится на другом компоненте, крючок следует удалить. Например: « 朵般鉛 ».
  • Когда « 九、儿、几 » находится слева от других компонентов, крюк горизонтального изгиба часто заменяется подъемным. Например: « 鳩、頹、微 ».
  • Когда последний удар левого радикала представляет собой ㇟ (крючок вертикального изгиба), его часто заменяют на ㇙ (вертикальный подъем). Например: « 切、顾、改、耀 ».
  • Когда « » (рука) используется с левой стороны, вертикальный крючок можно заменить на ㇓ ( пирог ). Например: « 拜、掰 ».

Сужение или уплощение компонентов

[ редактировать ]

Сужение или уплощение компонентов призвано сделать структуру всего персонажа гармоничной и стройной. « Возьмем , к примеру, » (собака):

  • В верхних и нижних структурах необходимо сплющить. Например: « 哭、器 ».
  • В левой и правой структуре необходимо сужать. Например: « 狀、獄 ».

Пианпанг

[ редактировать ]

( радикал ; пианпанг ) и радикалы ( радикал ) являются компонентами.

Первоначально левая часть комбинированного китайского иероглифа называлась пиан , а правая — пан . принято называть левую и правую, верхнюю и нижнюю, внешнюю и внутреннюю части комбинированных иероглифов В настоящее время пианпангами . Таким образом, анализ комбинированных символов аналогичен анализу компонентов первого уровня. Пиангпанг обычно несет звуковую или смысловую информацию. Их называют «звуковой стороной» (также называемой «звуковым символом») и «смысловой стороной» (также называемой «значительным символом») соответственно. [17]

Радикалы — это компоненты, используемые для сортировки и извлечения китайских иероглифов. В соответствии со структурой глифов китайских иероглифов за основу для сортировки и поиска символов берутся общие компоненты группы иероглифов. И эти компоненты называются радикалами. В пиктофонетических символах радикалы в основном представляют собой пианпанги, представляющие значение. [6]

Оптимизация компонентов

[ редактировать ]

Ху Цяому сказал: [18] «(Примитивные) компоненты китайских иероглифов должны быть сокращены, а компоненты китайских иероглифов должны быть сделаны как можно более независимыми иероглифами; те, которые не могут быть иероглифами, должны быть универсальными и легко произносимыми. Это может быть более важным, чем сокращение количества иероглифов. количество штрихов и символов. В некоторые упрощенные символы добавлены новые компоненты китайских иероглифов. Например, « 书农长 » и так далее. Хотя традиционный иероглиф имеет больше штрихов, его можно очень четко сказать: « + ». Когда мы упрощаем китайские иероглифы, нам следует избегать новых невыразимых и необычных компонентов. "

Компоненты — важные структурные единицы китайских иероглифов. Оптимизация компонентов китайских иероглифов, чтобы сделать их более краткими, стандартизированными, простыми в изучении и использовании, является важной задачей оптимизации китайских иероглифов, и предстоит пройти долгий путь. [18] [19]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ «(⿱ 夂貢 )» представляет правый компонент , который не отображается в Юникоде.

Цитируемые работы

[ редактировать ]
  • CP, Commercial Press (сборник) (2021 г.) на китайском языке: Commercial Press). (  978-7-5176-0774-8 .
  • Фу, Юнхэ (1999). Обработка китайской информации на китайском языке) (3-е изд.). (  9-787540-640804 .
  • редакторы)) (1988). Информационный словарь китайских иероглифов (на китайском языке: Science Press). Ли, Гунъи (李 Gongyi, Лю Рушуй (  7-03-000862-6 .
  • Национальная комиссия по языку, Министерство образования, Китай (1998). Стандарт компонентов китайских символов GB 13000.1. Набор символов для обработки информации PDF) . (  7-80126-314-6 . Проверено 3 сентября 2023 г. {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  • Национальная языковая комиссия, Министерство образования, Китай (2009 г.). Спецификация общих компонентов современных китайских символов и названий компонентов (PDF) . Дата обращения : 3 сентября 2023 г. . {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  • Су, Пэйчэн (苏 Пэйчэн) (2014. Основы современных китайских иероглифов ) (3-е изд.). Пекин: Commercial Press, стр. 84. (на китайском языке  978-7-100-10440-1 .
  • Чжан, Сяохэн (2004). «Трудности в применении «Стандарта китайских символов набора символов GB 13000.1 для обработки информации» для ввода китайских символов. Журнал обработки китайской информации 18 (2004) (4). ): 60–65.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 925e449a3cd7e310335a3f5b076c7f45__1719223080
URL1:https://arc.ask3.ru/arc/aa/92/45/925e449a3cd7e310335a3f5b076c7f45.html
Заголовок, (Title) документа по адресу, URL1:
Chinese character components - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)