Jump to content

Модзикё

(Перенаправлено из Модзикё )
Модзикё
Конжак Модзикё
Слово зеркало прошлого и настоящего
Разработчик(и) Тадахиса Исикава
( Тадахиса Исикава )
Токио Фуруя
( Токио Фуруя )
Институт Модзикё
( Ассоциация исследования зеркала слова )
Первоначальный выпуск 1.0 / июль 1997 г .; 27 лет назад ( 1997-07 )
Финальный выпуск
4.0 / 15 декабря 2018 г .; 5 лет назад ( 15 декабря 2018 )
Операционная система Microsoft Windows
Размер 51 МБ
Доступно в японский
Тип Набор символов в комплекте со шрифтами и картой символов.
Лицензия Собственный
Веб-сайт модзикё .org

Модзикё ( японский : 文字鏡 ), также известный под своим полным именем Конджаку Модзикё ( 今昔文字鏡 , букв. « () зеркало символов прошлого и настоящего » ) , представляет собой схему кодирования символов , созданную для обеспечения полного указателя символов, используемых в китайская корейская , японская , Чу , вьетнамская Ном и другие исторические китайские логографические системы письма. Институт Модзикё ( 文字鏡研究会 , Mojikyō Kenkyūkai ) , опубликовавший набор символов, также опубликовал компьютерное программное обеспечение и шрифты TrueType , сопровождающие его. Институт Модзикё под председательством Тадахиса Исикава ( 石川忠久 ) , [1] Первоначально набор символов, соответствующее программное обеспечение и данные распространялись на компакт-дисках, продаваемых в магазинах «Кинокуния» . [2]

Концептуализированный в 1996 году, [3] первая версия компакт-диска была выпущена в июле 1997 года. [4] Какое-то время Институт Модзикё также предлагал веб-подписку под названием « Mojiky WEB» ( 文字鏡WEB ), в которой были более современные символы. [5]

По состоянию на сентябрь 2006 г. , Модзикё закодировал 174 975 символов. [6] Среди них 150 366 символов (≈86%) тогда принадлежали расширенному китайско-японскому-корейско-вьетнамскому языку (CJKV). [примечание 2] семья. [5] Многие символы Модзикё считаются устаревшими или малоизвестными и не кодируются никаким другим набором символов, включая наиболее широко используемый международный стандарт кодирования текста — Unicode .

Первоначально это был платный проприетарный программный продукт, с 2015 года Институт Модзикё начал загружать свои последние выпуски в Интернет-архив как бесплатное программное обеспечение . [7] как памятник одному из его разработчиков, Токио Фуруя ( 古家時雄 ) , который умер в том же году. [3] 15 декабря 2018 г. вышла версия 4.0. На следующий день Исикава объявил, что без Фуруи это будет последний релиз Модзикё . [3]

Помещение

[ редактировать ]

Кодировка Модзикё китайской была создана для обеспечения полного указателя символов, используемых в , японской , корейской системах письма и вьетнамских сценариях Тё Ном логографических . Он также кодирует большое количество символов в древних письменностях, таких как письмо на кости оракула , письмо на печати и санскрит ( сиддхам ). Для многих символов это единственная кодировка символов , позволяющая их кодировать, и ее данные часто используются в качестве отправной точки для Unicode . предложений [8] [9] Однако Модзикё имеет гораздо более свободные стандарты кодирования, чем Юникод, что приводит к тому, что Модзикё имеет множество закодированных символов сомнительного или даже непреднамеренно вымышленного происхождения. [10] [11] Таким образом, хотя многие символы Модзикё, не входящие в Unicode , подходят для добавления в Unicode, не все могут стать символами Unicode из-за разных стандартов доказательства, требуемых каждым из них.

Шрифты Mojikyō ( 文字鏡フォント ) представляют собой шрифты TrueType , которые поставляются в ZIP-файле каждый и имеют размер около 2–5 мегабайт ; разные шрифты содержат разное количество символов. [примечание 3] Также включен исполняемый файл Windows , реализующий графическую карту символов , « Карта символов Модзикё » ( 文字鏡MAP ), МОЧРМАП .EXE . [примечание 4] [примечание 5] MOCHRMAP.EXE позволяет пользователям просматривать шрифты Mojikyō , а также копировать и вставлять символы вместо их ввода на клавиатуре. В отличие от обычной карты символов Windows или, если уж на то пошло, KCharSelect , которые поддерживают шрифты TrueType, MOCHRMAP.EXE отображает пронумерованный Модзикё слот кодировки запрошенного символа. [12] [примечание 6] Для того, чтобы MOCHRMAP.EXE Для работы Mojikyō . должны быть установлены все шрифты [примечание 7]

Кодирование

[ редактировать ]

При обращении к символу, закодированному в Mojikyō , часто используется формат MJXXXXXX, аналогичный формату U+XXXX, используемому для Unicode. Например, хентайгана U+1B008 𛀈 ХЕНТАЙГАНА БУКВА I-3 имеет кодировку Модзикё MJ090007 и кодировку Юникода U+1B008. [13] Разница, однако, состоит в том, что кодировки Mojikyō , отображаемые таким образом, являются десятичными , а кодировка Unicode U+ — шестнадцатеричной .

С самых первых дней существования Unicode Модзикё одновременно влиял на стандарт и находился под его влиянием. Глифы, происходящие из Модзикё, впервые появляются в предложении, поданном Группе идеографических докладчиков (IRG). [примечание 8] который отвечает за поддержку всех блоков CJK в Юникоде, [14] [15] 18 апреля 2002 г. [16] В мае 2007 года Модзикё сыграл второстепенную роль в серии успешных предложений по кодированию тангутского письма в Unicode; [17] [примечание 9] К октябрю 2002 года в Модзикё уже было закодировано 6000 тангутских символов. [6]

В базе данных Unihan стандарта Unicode Модзикё называется «Японской коллекцией КОКУДЗИ » ( 日本国字集 ), [18] сокращенно «ЖК». [19] [20] Например, U+2B679 𫙹 ЕДИНАЯ ИДЕОГРАФИЯ CJK-2B679 , [примечание 10] иероглиф , читаемый по-японски как burizādo ( метель , букв. « метель » ) , имеет J-источник. [примечание 11] равен JK-66038. Все символы Юникода с J-источником с префиксом JK происходят из Модзикё . [21] [примечание 12] По словам Кена Лунде , эксперта в области кодировок символов и восточноазиатских языков , начиная с версии Unicode 13.0, 782 иероглифов в Unicode происходят из Mojikyō , разделенных примерно поровну между двумя блоками : CJK Unified Ideographs Extension C с 367 и CJK Unified Ideographs. Расширение E , с 415. [20] [22] Не все символы Юникода, имеющие происхождение Модзикё тот же репрезентативный глиф (J-источники с префиксом JK), имеют в таблице кодов , что и в шрифте Модзикё ; [примечание 13] Форма некоторых персонажей была изменена перед окончательным кодированием, поскольку расследование показало, что формы, присвоенные Институтом Модзикё, были неправильными. [11] [примечание 14]

По состоянию на сентябрь 2006 г. он закодировал 174 975 символов. [6] Среди них 150 366 символов тогда принадлежали расширенному CJKV. [примечание 2] семья. [5] Многие из закодированных символов считаются устаревшими или иным образом неясными и не кодируются никаким другим набором символов, включая международный стандарт Unicode. Каждый персонаж Модзикё имеет уникальный номер, а символы организованы в блоки.

Модзикё помещает символы CJKV в разные блоки в соответствии с их традиционным Канси радикалом . Общие радикалы, содержащие особенно большое количество символов, такие как радикалы 9 ( ) и 162 ( ), разделяются далее по порядку штрихов. [примечание 15]

Никакой унификации

[ редактировать ]

В отличие от Unicode, Модзикё намеренно избегает объединения Хань ; не предпринимается никаких попыток обеспечить компактность кодировки, а также не делается попытка сохранить все общие символы ниже U + FFFF, как это есть в Unicode.

Unicode, с другой стороны, сортирует свой CJK на блоки в зависимости от того, насколько они распространены: наиболее распространенные обычно помещаются в базовую многоязычную плоскость , [примечание 14] тогда как те, которые редки или малоизвестны, отнесены к дополнительным планам .

Например, в Radical 9 есть два символа, а в Юникоде — один: MJ054435 ( ) и MJ059031 ( ), оба представлены в Юникоде как U+4EE4 CJK ЕДИНАЯ ИДЕОГРАФИЯ-4EE4 .

Лицензия

[ редактировать ]

Mojikyō — это проприетарное программное обеспечение с ограниченной лицензией. Первоначально Институт Модзикё пытался предотвратить использование своих символьных данных и угрожал тем, кто публиковал таблицы преобразования в его набор символов и из него. В июле 2010 года Институт Модзикё отказался от своих юридических усилий, направленных на то, чтобы помешать хотя бы одному японскому пользователю публиковать таблицы преобразования или конвертировать символы, закодированные в Модзикё, в Unicode или другие наборы символов. [23] Простые данные, иногда включающие формы букв, во многих юрисдикциях считаются общей собственностью, поскольку они не соответствуют порогу оригинальности . [примечание 16]

Однако из-за этого наследия GlyphWiki [ ja ] запретила данные Модзикё с 2020 года. [24]

Собранные системы письменности

[ редактировать ]

Мертвый или устаревший

[ редактировать ]

См. также

[ редактировать ]
  1. ^ «Об » Институте Модзикё (на японском языке). Архивировано 3 февраля 2001 года . Проверено 6 июля 2020 года .
  2. ^ Добро пожаловать в мир характерных зеркал! [Добро пожаловать в мир Модзикё !] (на японском языке). Кинокуния КК. Архивировано из оригинала 4 марта 2005 года . Проверено 5 июля 2020 г.
  3. ^ Jump up to: а б с Исикава, Тадахиса (август 2015 г.). « о твоей смерти» Токио Фуруя, мы скорбим (на японском языке) . Проверено 8 июля 2020 г. .
  4. ^ Конжак Модзикё Слово зеркало прошлого и настоящего (на японском языке), июль 1997 г., ISBN.  9784314900034
  5. ^ Jump up to: а б с Что такое Конджаку Модзигами? [О Модзикё] (на японском языке). Кинокуния КК. Архивировано из оригинала 27 апреля 2010 года . Проверено 5 июля 2020 г.
  6. ^ Jump up to: а б с Что такое Конджаку Модзигами? [Что такое Модзикё ?] (на японском языке). Кинокуния КК. Архивировано из оригинала 5 февраля 2005 года . Проверено 5 июля 2020 г.
  7. ^ "Поиск: создатель:"Институт МОДЗИКЁ" " . Интернет-архив . Проверено 6 июля 2020 г.
  8. ^ Такада, Томокадзу; Яда, Цутому; Сайто, Тацуя (18 сентября 2015 г.). Предложение по хентайгане (PDF) . Перевод Кобаяши, Тацуо ; Кобаяши, Дэниел. Общество обработки информации Японии . Л2/15-239 . Проверено 5 июля 2020 г. - через Консорциум Unicode .
  9. ^ Хиура, Хидеки; Кобаяши, Тацуо ; и др. (31 октября 2003 г.). Селектор вариантов идеографа и идентификатор коллекции вариантов . Инициатива открытой интернационализации. Л2/03-413 . Проверено 5 июля 2020 г. - через Консорциум Unicode .
  10. ^ Такада, Томокадзу и др . ; Ода, Тецудзи . (26 августа 2013 г.) Протокол 3-й подгруппы по рассмотрению текстовой информации в 2013 г. [Протокол заседания третьей рабочей подгруппы по изучению информации о персонажах 2013 г. ( 25 )] PDF) , Heisei Правительство Японии (на японском языке), получено 6 июля 2020 г. . ( мы опросили людей, участвующих в проекте, и узнали, что WG2 N36981, предложенный Нидерландами, использует шрифт Mojigami, но исследовательская группа Mojigami не участвовала, и были сомнения по поводу содержания предложения. [Согласно интервью с представителем Института Модзикё, шрифт Модзикё используется в WG2 N36981, предложенном Нидерландами, но сам Институт Модзикё не участвует в этом предложении; кроме того, у него есть сомнения по поводу некоторых частей этого предложения; .]
  11. ^ Jump up to: а б Сузуки, Тошия [ Тошия Судзуки ] (30 июля 2009 г.). Исследование графических символов «Коллекции Инь Чжоу Цзиньбунь» в применении к интегрированным китайским иероглифам [Исследование глифов, собранных из «Индекса коллекции надписей периода Инь-Чжоу», для отправки в CJK Unified Ideographs]. Технический отчет IPSJ SIG языке 2009-DD-72 (7). (на японском : 2 – через Интернет-архив . Однако, поскольку работа по стандартизации Extended C длилась восемь лет, а примеры стали обязательными постфактум, официально обнародованные полномочия для кандзи Extended C сильно отличаются от первоначальных. Это стало реальностью. . Например, Япония первоначально подала заявку на около 1000 символов кандзи, выбранных Исследовательской группой Модзигами. ] [...] Поскольку примеры использования полномочий проверялись независимо от зеркала персонажа, многие формы глифов были изменены по сравнению с кандзи зеркала персонажа. [Поскольку усилия по стандартизации CJK Unified Ideographs Extension C длились восемь долгих лет, а примеры кандзи были запрошены после их кодирования, официально обнародованный стандарт кандзи Extension C сильно отличается от исходного стандарта. Например, мы, Правительство Японии первоначально подало заявку на получение около 1000 кандзи, отобранных Институтом Модзикё [.] [...] Поскольку проверка кандзи выполнялась независимо от Института Модзикё, формы символов часто менялись по сравнению с версией того же Модзикё. кодовая точка.]
  12. ^ Исикава, Тадахиса (25 мая 1999 г.). «Полное руководство по кандзи в прошлом и настоящем» [Кандзи на вашем компьютере, Made Easy — Полное руководство по модзикё]. Проверено 6 июля 2020 г.
  13. ^ Информационный список персонажей MJ [Таблица кодировок символов MJ] (на японском языке). Агентство по продвижению информационных технологий . Архивировано из оригинала 29 сентября 2018 года . Проверено 5 июля 2020 г.
  14. ^ «Стандартное приложение Unicode № 45: Идеограммы U-источника» . Стандарт Юникод . Консорциум Юникод.
  15. ^ «Приложение E: История объединения Хань» (PDF) . Стандарт Юникод . Консорциум Юникод. Март 2020.
  16. ^ «Расширение CJK C1 из Японии» . Группа идеографического докладчика . IRG#19 N895 – через Китайского университета Гонконга . факультет компьютерных наук и инженерии N895-Япония_C1
  17. ^ Кук, Ричард (9 мая 2007 г.). Предложение кодировать тангутские символы в плоскости UCS 1 (PDF) . Инициатива по кодированию сценариев Калифорнийского университета в Беркли . п. 4. L2/07-143 – через Консорциум Unicode .
  18. ^ Дженкинс, Джон Х.; Кук, Ричард; Лунде, Кен, ред. (5 марта 2020 г.), «kIRG JSource» , Стандартное приложение Unicode № 38 , Консорциум Unicode
  19. ^ Кобаяши, Тацуо (3 декабря 2001 г.). «Список японских иероглифов, которые могут быть предложены в расширении-C» . ISO/IEC JTC1/SC2/WG2/IRG N853.
  20. ^ Jump up to: а б Кен Лунде [@ken_lunde] (6 июля 2020 г.). «В частности, все 782 идеограммы с префиксом JK действительно взяты из 今昔文字鏡 согласно IRG N862. Большинство из них были закодированы в #ExtensionC, а отставшие были закодированы в #ExtensionE». ( Твиттер ) . Проверено 6 июля 2020 г. - через Twitter .
  21. ^ Кен Лунде [@ken_lunde] (6 июля 2020 г.). «Иероглифы J-Source с префиксом JK пришли из 今昔文字鏡, которые находятся в расширениях C и E (упоминание о расширении D было просто тем, что то, что стало расширением E, изначально планировалось стать расширением D)» ( твит ). Архивировано из оригинала 7 июля 2020 года . Проверено 6 июля 2020 г. - через Twitter .
  22. ^ Кен Лунде [@ken_lunde] (6 июля 2020 г.). «367 иероглифов с префиксом JK находятся в расширении C, а остальные 415 — в расширении E». ( Твиттер ) . Проверено 6 июля 2020 г. - через Twitter .
  23. ^ « Объявление: Война окончена». Китайская школа «Лягушечный павильон» [ Кандзи- школа Сэйватея ] (на японском языке) (изд. 28 января 2016 г.). 21 июля 2010 года . Проверено 7 июля 2020 г.
  24. ^ «Лицензия на наши данные и статьи» . GlyphWiki (изд. 9 июня 2010 г.) Проверено 6 июля 2020 г. . Konjaku Mojigami и связанные с ней продукты и данные не могут использоваться GlyphWiki по лицензии. Я не могу. Сам глиф, включенный в номер модзигами (уникальная часть), и шрифт глифа, а также информация, которую можно определить как созданную путем ссылки или использования, не могут использоваться в качестве авторитетных данных при регистрации на Glyph Wiki. Это не так. возможно, поэтому мы просим вашего сотрудничества. [ Конджаку Модзикё вышеупомянутой лицензией GlyphWiki. Ни номер слота кодирования Модзикё , ни внешний вид самого глифа в шрифтах Модзикё , сопутствующие продукты и связанные с ними данные лицензируются таким образом, что они несовместимы с нашей , ни какая-либо информация. все, что можно считать собранным со ссылкой на продукт Mojikyō , может быть использовано при вводе данных в GlyphWiki. Мы категорически не можем принимать данные Mojikyō . Пожалуйста, сотрудничайте с нами.]

Примечания

[ редактировать ]
  1. ^ Пока что отсутствует кодировка Unicode , поэтому здесь она аппроксимируется с помощью CSS и U+30BB КАТАКАНА БУКВА SE .
  2. ^ Jump up to: а б В корейском языке ханджа упоминаются . Для вьетнамского языка Nom .
  3. ^ Скачать файл MojikyoCmap400ALL49TTF.7z с официального сайта
  4. ^ Английское название из заголовка окна, создаваемого при запуске исполняемого файла; Японское название от значка исполняемого файла.
  5. ^ Также называется «Cmap Модзикё».
  6. ^ Смотрите скриншоты на официальном сайте.
  7. ^ В каталог системных шрифтов. C:\Windows\Шрифты .
  8. ^ В 2019 году IRG была переименована в Группу идеографических исследований.
  9. ^ История кодирования тангутского письма довольно сложна, см. Тангут (блок Unicode) § История , где представлен полный список всех связанных предложений и временная шкала.
  10. ^ Последовательность идеографического описания : ⿰魚嵐
  11. ^ Это имя столбца в базе данных Unihan ; ⟨J⟩ здесь является сокращением от «источник японских символов». Полное имя столбца: kIRG_JSource. При объединении Хань таких источников девять. см. в §3.1 UAX#38 . Полный список и дополнительную информацию
  12. ^ Существуют и другие префиксы J-Source, например J4, что означает, что символ происходит из JIS X 0213:2004 .
  13. ^ То есть глиф, состоящий из одних и тех же радикалов в одних и тех же позициях.
  14. ^ Jump up to: а б Ошибки в больших коллекциях иероглифов, конечно, нередки. Такие ошибки даже случайно случаются в хорошо финансируемых государственных коллекциях, таких как знаменитые кандзи из неизвестных источников в комитета по промышленным стандартам Японского JIS X 0208 стандарте кодирования двухбайтовых символов . Все эти кандзи ошибки JIS X 0208 ( символы-призраки , 幽霊文字 ; например, ) попали в Юникод, несмотря на то, что они не являются «настоящими» кандзи.
  15. ^ Для доказательства см. список в Карте символов Модзикё, МОЧРМАП.EXE .
  16. ^ См. также: вымышленная запись ; ул. ловушка .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4e5ff925cf5e191bc2d7988f0c30f525__1720739820
URL1:https://arc.ask3.ru/arc/aa/4e/25/4e5ff925cf5e191bc2d7988f0c30f525.html
Заголовок, (Title) документа по адресу, URL1:
Mojikyō - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)