Модзикё
Разработчик(и) | Тадахиса Исикава ( Тадахиса Исикава ) Токио Фуруя ( Токио Фуруя ) Институт Модзикё ( Ассоциация исследования зеркала слова ) |
---|---|
Первоначальный выпуск | 1.0 / июль 1997 г |
Финальный выпуск | 4.0 / 15 декабря 2018 г |
Операционная система | Microsoft Windows |
Размер | 51 МБ |
Доступно в | японский |
Тип | Набор символов в комплекте со шрифтами и картой символов. |
Лицензия | Собственный |
Веб-сайт | модзикё |
Модзикё ( японский : 文字鏡 ), также известный под своим полным именем Конджаку Модзикё ( 今昔文字鏡 , букв. « () зеркало символов прошлого и настоящего » ) , представляет собой схему кодирования символов , созданную для обеспечения полного указателя символов, используемых в китайская корейская , японская , Чу , вьетнамская Ном и другие исторические китайские логографические системы письма. Институт Модзикё ( 文字鏡研究会 , Mojikyō Kenkyūkai ) , опубликовавший набор символов, также опубликовал компьютерное программное обеспечение и шрифты TrueType , сопровождающие его. Институт Модзикё под председательством Тадахиса Исикава ( 石川忠久 ) , [1] Первоначально набор символов, соответствующее программное обеспечение и данные распространялись на компакт-дисках, продаваемых в магазинах «Кинокуния» . [2]
Концептуализированный в 1996 году, [3] первая версия компакт-диска была выпущена в июле 1997 года. [4] Какое-то время Институт Модзикё также предлагал веб-подписку под названием « Mojiky WEB» ( 文字鏡WEB ), в которой были более современные символы. [5]
По состоянию на сентябрь 2006 г. [update], Модзикё закодировал 174 975 символов. [6] Среди них 150 366 символов (≈86%) тогда принадлежали расширенному китайско-японскому-корейско-вьетнамскому языку (CJKV). [примечание 2] семья. [5] Многие символы Модзикё считаются устаревшими или малоизвестными и не кодируются никаким другим набором символов, включая наиболее широко используемый международный стандарт кодирования текста — Unicode .
Первоначально это был платный проприетарный программный продукт, с 2015 года Институт Модзикё начал загружать свои последние выпуски в Интернет-архив как бесплатное программное обеспечение . [7] как памятник одному из его разработчиков, Токио Фуруя ( 古家時雄 ) , который умер в том же году. [3] 15 декабря 2018 г. вышла версия 4.0. На следующий день Исикава объявил, что без Фуруи это будет последний релиз Модзикё . [3]
Помещение
[ редактировать ]Кодировка Модзикё китайской была создана для обеспечения полного указателя символов, используемых в , японской , корейской системах письма и вьетнамских сценариях Тё Ном логографических . Он также кодирует большое количество символов в древних письменностях, таких как письмо на кости оракула , письмо на печати и санскрит ( сиддхам ). Для многих символов это единственная кодировка символов , позволяющая их кодировать, и ее данные часто используются в качестве отправной точки для Unicode . предложений [8] [9] Однако Модзикё имеет гораздо более свободные стандарты кодирования, чем Юникод, что приводит к тому, что Модзикё имеет множество закодированных символов сомнительного или даже непреднамеренно вымышленного происхождения. [10] [11] Таким образом, хотя многие символы Модзикё, не входящие в Unicode , подходят для добавления в Unicode, не все могут стать символами Unicode из-за разных стандартов доказательства, требуемых каждым из них.
Состав
[ редактировать ]Шрифты Mojikyō ( 文字鏡フォント ) представляют собой шрифты TrueType , которые поставляются в ZIP-файле каждый и имеют размер около 2–5 мегабайт ; разные шрифты содержат разное количество символов. [примечание 3] Также включен исполняемый файл Windows , реализующий графическую карту символов , « Карта символов Модзикё » ( 文字鏡MAP ), МОЧРМАП .EXE . [примечание 4] [примечание 5] MOCHRMAP.EXE позволяет пользователям просматривать шрифты Mojikyō , а также копировать и вставлять символы вместо их ввода на клавиатуре. В отличие от обычной карты символов Windows или, если уж на то пошло, KCharSelect , которые поддерживают шрифты TrueType, MOCHRMAP.EXE отображает пронумерованный Модзикё слот кодировки запрошенного символа. [12] [примечание 6] Для того, чтобы MOCHRMAP.EXE Для работы Mojikyō . должны быть установлены все шрифты [примечание 7]
Кодирование
[ редактировать ]При обращении к символу, закодированному в Mojikyō , часто используется формат MJXXXXXX, аналогичный формату U+XXXX, используемому для Unicode. Например, хентайгана U+1B008 𛀈 ХЕНТАЙГАНА БУКВА I-3 имеет кодировку Модзикё MJ090007 и кодировку Юникода U+1B008. [13] Разница, однако, состоит в том, что кодировки Mojikyō , отображаемые таким образом, являются десятичными , а кодировка Unicode U+ — шестнадцатеричной .
С самых первых дней существования Unicode Модзикё одновременно влиял на стандарт и находился под его влиянием. Глифы, происходящие из Модзикё, впервые появляются в предложении, поданном Группе идеографических докладчиков (IRG). [примечание 8] который отвечает за поддержку всех блоков CJK в Юникоде, [14] [15] 18 апреля 2002 г. [16] В мае 2007 года Модзикё сыграл второстепенную роль в серии успешных предложений по кодированию тангутского письма в Unicode; [17] [примечание 9] К октябрю 2002 года в Модзикё уже было закодировано 6000 тангутских символов. [6]
В базе данных Unihan стандарта Unicode Модзикё называется «Японской коллекцией КОКУДЗИ » ( 日本国字集 ), [18] сокращенно «ЖК». [19] [20] Например, U+2B679 𫙹 ЕДИНАЯ ИДЕОГРАФИЯ CJK-2B679 , [примечание 10] иероглиф , читаемый по-японски как burizādo ( метель , букв. « метель » ) , имеет J-источник. [примечание 11] равен JK-66038. Все символы Юникода с J-источником с префиксом JK происходят из Модзикё . [21] [примечание 12] По словам Кена Лунде , эксперта в области кодировок символов и восточноазиатских языков , начиная с версии Unicode 13.0, 782 иероглифов в Unicode происходят из Mojikyō , разделенных примерно поровну между двумя блоками : CJK Unified Ideographs Extension C с 367 и CJK Unified Ideographs. Расширение E , с 415. [20] [22] Не все символы Юникода, имеющие происхождение Модзикё тот же репрезентативный глиф (J-источники с префиксом JK), имеют в таблице кодов , что и в шрифте Модзикё ; [примечание 13] Форма некоторых персонажей была изменена перед окончательным кодированием, поскольку расследование показало, что формы, присвоенные Институтом Модзикё, были неправильными. [11] [примечание 14]
Блоки
[ редактировать ]По состоянию на сентябрь 2006 г. [update] он закодировал 174 975 символов. [6] Среди них 150 366 символов тогда принадлежали расширенному CJKV. [примечание 2] семья. [5] Многие из закодированных символов считаются устаревшими или иным образом неясными и не кодируются никаким другим набором символов, включая международный стандарт Unicode. Каждый персонаж Модзикё имеет уникальный номер, а символы организованы в блоки.
Модзикё помещает символы CJKV в разные блоки в соответствии с их традиционным Канси радикалом . Общие радикалы, содержащие особенно большое количество символов, такие как радикалы 9 ( 人 ) и 162 ( ⻌ ), разделяются далее по порядку штрихов. [примечание 15]
Никакой унификации
[ редактировать ]В отличие от Unicode, Модзикё намеренно избегает объединения Хань ; не предпринимается никаких попыток обеспечить компактность кодировки, а также не делается попытка сохранить все общие символы ниже U + FFFF, как это есть в Unicode.
Unicode, с другой стороны, сортирует свой CJK на блоки в зависимости от того, насколько они распространены: наиболее распространенные обычно помещаются в базовую многоязычную плоскость , [примечание 14] тогда как те, которые редки или малоизвестны, отнесены к дополнительным планам .
Например, в Radical 9 есть два символа, а в Юникоде — один: MJ054435 ( 令 ) и MJ059031 ( 令 ), оба представлены в Юникоде как U+4EE4 令 CJK ЕДИНАЯ ИДЕОГРАФИЯ-4EE4 .
Лицензия
[ редактировать ]Mojikyō — это проприетарное программное обеспечение с ограниченной лицензией. Первоначально Институт Модзикё пытался предотвратить использование своих символьных данных и угрожал тем, кто публиковал таблицы преобразования в его набор символов и из него. В июле 2010 года Институт Модзикё отказался от своих юридических усилий, направленных на то, чтобы помешать хотя бы одному японскому пользователю публиковать таблицы преобразования или конвертировать символы, закодированные в Модзикё, в Unicode или другие наборы символов. [23] Простые данные, иногда включающие формы букв, во многих юрисдикциях считаются общей собственностью, поскольку они не соответствуют порогу оригинальности . [примечание 16]
Однако из-за этого наследия GlyphWiki запретила данные Модзикё с 2020 года. [24]
Собранные системы письменности
[ редактировать ]Жизнь
[ редактировать ]- Китайский — Гусь
- Японский — кандзи , кана (включая хентайгану )
- Корейский — Ханджа
- Латинский алфавит с диакритическими знаками
- Кириллица с диакритическими знаками
Мертвый или устаревший
[ редактировать ]- Древний китайский
- У нас есть четыре
- Вьетнамский — сценарий Nom
- Санскрит – Сиддхам
- Тангутское письмо
- Суй скрипт
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Об » Институте Модзикё (на японском языке). Архивировано 3 февраля 2001 года . Проверено 6 июля 2020 года .
- ^ Добро пожаловать в мир характерных зеркал! [Добро пожаловать в мир Модзикё !] (на японском языке). Кинокуния КК. Архивировано из оригинала 4 марта 2005 года . Проверено 5 июля 2020 г.
- ^ Jump up to: а б с Исикава, Тадахиса (август 2015 г.). « о твоей смерти» Токио Фуруя, мы скорбим (на японском языке) . Проверено 8 июля 2020 г. .
- ^ Конжак Модзикё Слово зеркало прошлого и настоящего (на японском языке), июль 1997 г., ISBN. 9784314900034
- ^ Jump up to: а б с Что такое Конджаку Модзигами? [О Модзикё] (на японском языке). Кинокуния КК. Архивировано из оригинала 27 апреля 2010 года . Проверено 5 июля 2020 г.
- ^ Jump up to: а б с Что такое Конджаку Модзигами? [Что такое Модзикё ?] (на японском языке). Кинокуния КК. Архивировано из оригинала 5 февраля 2005 года . Проверено 5 июля 2020 г.
- ^ "Поиск: создатель:"Институт МОДЗИКЁ" " . Интернет-архив . Проверено 6 июля 2020 г.
- ^ Такада, Томокадзу; Яда, Цутому; Сайто, Тацуя (18 сентября 2015 г.). Предложение по хентайгане (PDF) . Перевод Кобаяши, Тацуо ; Кобаяши, Дэниел. Общество обработки информации Японии . Л2/15-239 . Проверено 5 июля 2020 г. - через Консорциум Unicode .
- ^ Хиура, Хидеки; Кобаяши, Тацуо ; и др. (31 октября 2003 г.). Селектор вариантов идеографа и идентификатор коллекции вариантов . Инициатива открытой интернационализации. Л2/03-413 . Проверено 5 июля 2020 г. - через Консорциум Unicode .
- ^ Такада, Томокадзу и др . ; Ода, Тецудзи . (26 августа 2013 г.) Протокол 3-й подгруппы по рассмотрению текстовой информации в 2013 г. [Протокол заседания третьей рабочей подгруппы по изучению информации о персонажах 2013 г. ( 25 )] PDF) , Heisei Правительство Японии (на японском языке), получено 6 июля 2020 г. .
( мы опросили людей, участвующих в проекте, и узнали, что WG2 N36981, предложенный Нидерландами, использует шрифт Mojigami, но исследовательская группа Mojigami не участвовала, и были сомнения по поводу содержания предложения. [Согласно интервью с представителем Института Модзикё, шрифт Модзикё используется в WG2 N36981, предложенном Нидерландами, но сам Институт Модзикё не участвует в этом предложении; кроме того, у него есть сомнения по поводу некоторых частей этого предложения; .]
- ^ Jump up to: а б Сузуки, Тошия [ Тошия Судзуки ] (30 июля 2009 г.). Исследование графических символов «Коллекции Инь Чжоу Цзиньбунь» в применении к интегрированным китайским иероглифам [Исследование глифов, собранных из «Индекса коллекции надписей периода Инь-Чжоу», для отправки в CJK Unified Ideographs]. Технический отчет IPSJ SIG языке 2009-DD-72 (7). (на японском : 2 – через Интернет-архив .
Однако, поскольку работа по стандартизации Extended C длилась восемь лет, а примеры стали обязательными постфактум, официально обнародованные полномочия для кандзи Extended C сильно отличаются от первоначальных. Это стало реальностью. . Например, Япония первоначально подала заявку на около 1000 символов кандзи, выбранных Исследовательской группой Модзигами. ] [...] Поскольку примеры использования полномочий проверялись независимо от зеркала персонажа, многие формы глифов были изменены по сравнению с кандзи зеркала персонажа. [Поскольку усилия по стандартизации CJK Unified Ideographs Extension C длились восемь долгих лет, а примеры кандзи были запрошены после их кодирования, официально обнародованный стандарт кандзи Extension C сильно отличается от исходного стандарта. Например, мы, Правительство Японии первоначально подало заявку на получение около 1000 кандзи, отобранных Институтом Модзикё [.] [...] Поскольку проверка кандзи выполнялась независимо от Института Модзикё, формы символов часто менялись по сравнению с версией того же Модзикё. кодовая точка.]
- ^ Исикава, Тадахиса (25 мая 1999 г.). «Полное руководство по кандзи в прошлом и настоящем» [Кандзи на вашем компьютере, Made Easy — Полное руководство по модзикё]. Проверено 6 июля 2020 г.
- ^ Информационный список персонажей MJ [Таблица кодировок символов MJ] (на японском языке). Агентство по продвижению информационных технологий . Архивировано из оригинала 29 сентября 2018 года . Проверено 5 июля 2020 г.
- ^ «Стандартное приложение Unicode № 45: Идеограммы U-источника» . Стандарт Юникод . Консорциум Юникод.
- ^ «Приложение E: История объединения Хань» (PDF) . Стандарт Юникод . Консорциум Юникод. Март 2020.
- ^ «Расширение CJK C1 из Японии» . Группа идеографического докладчика . IRG#19 N895 – через Китайского университета Гонконга . факультет компьютерных наук и инженерии
N895-Япония_C1
- ^ Кук, Ричард (9 мая 2007 г.). Предложение кодировать тангутские символы в плоскости UCS 1 (PDF) . Инициатива по кодированию сценариев Калифорнийского университета в Беркли . п. 4. L2/07-143 – через Консорциум Unicode .
- ^ Дженкинс, Джон Х.; Кук, Ричард; Лунде, Кен, ред. (5 марта 2020 г.), «kIRG JSource» , Стандартное приложение Unicode № 38 , Консорциум Unicode
- ^ Кобаяши, Тацуо (3 декабря 2001 г.). «Список японских иероглифов, которые могут быть предложены в расширении-C» . ISO/IEC JTC1/SC2/WG2/IRG N853.
- ^ Jump up to: а б Кен Лунде [@ken_lunde] (6 июля 2020 г.). «В частности, все 782 идеограммы с префиксом JK действительно взяты из 今昔文字鏡 согласно IRG N862. Большинство из них были закодированы в #ExtensionC, а отставшие были закодированы в #ExtensionE». ( Твиттер ) . Проверено 6 июля 2020 г. - через Twitter .
- ^ Кен Лунде [@ken_lunde] (6 июля 2020 г.). «Иероглифы J-Source с префиксом JK пришли из 今昔文字鏡, которые находятся в расширениях C и E (упоминание о расширении D было просто тем, что то, что стало расширением E, изначально планировалось стать расширением D)» ( твит ). Архивировано из оригинала 7 июля 2020 года . Проверено 6 июля 2020 г. - через Twitter .
- ^ Кен Лунде [@ken_lunde] (6 июля 2020 г.). «367 иероглифов с префиксом JK находятся в расширении C, а остальные 415 — в расширении E». ( Твиттер ) . Проверено 6 июля 2020 г. - через Twitter .
- ^ « Объявление: Война окончена». Китайская школа «Лягушечный павильон» [ Кандзи- школа Сэйватея ] (на японском языке) (изд. 28 января 2016 г.). 21 июля 2010 года . Проверено 7 июля 2020 г.
- ^ «Лицензия на наши данные и статьи» . GlyphWiki (изд. 9 июня 2010 г.) Проверено 6 июля 2020 г. .
Konjaku Mojigami и связанные с ней продукты и данные не могут использоваться GlyphWiki по лицензии. Я не могу. Сам глиф, включенный в номер модзигами (уникальная часть), и шрифт глифа, а также информация, которую можно определить как созданную путем ссылки или использования, не могут использоваться в качестве авторитетных данных при регистрации на Glyph Wiki. Это не так. возможно, поэтому мы просим вашего сотрудничества. [ Конджаку Модзикё вышеупомянутой лицензией GlyphWiki. Ни номер слота кодирования Модзикё , ни внешний вид самого глифа в шрифтах Модзикё , сопутствующие продукты и связанные с ними данные лицензируются таким образом, что они несовместимы с нашей , ни какая-либо информация. все, что можно считать собранным со ссылкой на продукт Mojikyō , может быть использовано при вводе данных в GlyphWiki. Мы категорически не можем принимать данные Mojikyō . Пожалуйста, сотрудничайте с нами.]
Примечания
[ редактировать ]- ^ Пока что отсутствует кодировка Unicode , поэтому здесь она аппроксимируется с помощью CSS и U+30BB セ КАТАКАНА БУКВА SE .
- ^ Jump up to: а б В корейском языке ханджа упоминаются . Для вьетнамского языка Nom .
- ^ Скачать файл MojikyoCmap400ALL49TTF.7z с официального сайта
- ^ Английское название из заголовка окна, создаваемого при запуске исполняемого файла; Японское название от значка исполняемого файла.
- ^ Также называется «Cmap Модзикё».
- ^ Смотрите скриншоты на официальном сайте.
- ^ В каталог системных шрифтов. C:\Windows\Шрифты .
- ^ В 2019 году IRG была переименована в Группу идеографических исследований.
- ^ История кодирования тангутского письма довольно сложна, см. Тангут (блок Unicode) § История , где представлен полный список всех связанных предложений и временная шкала.
- ^ Последовательность идеографического описания : ⿰魚嵐
- ^ Это имя столбца в базе данных Unihan ; ⟨J⟩ здесь является сокращением от «источник японских символов». Полное имя столбца:
kIRG_JSource
. При объединении Хань таких источников девять. см. в §3.1 UAX#38 . Полный список и дополнительную информацию - ^ Существуют и другие префиксы J-Source, например J4, что означает, что символ происходит из JIS X 0213:2004 .
- ^ То есть глиф, состоящий из одних и тех же радикалов в одних и тех же позициях.
- ^ Jump up to: а б Ошибки в больших коллекциях иероглифов, конечно, нередки. Такие ошибки даже случайно случаются в хорошо финансируемых государственных коллекциях, таких как знаменитые кандзи из неизвестных источников в комитета по промышленным стандартам Японского JIS X 0208 стандарте кодирования двухбайтовых символов . Все эти кандзи ошибки JIS X 0208 ( символы-призраки , 幽霊文字 ; например, 彁 ) попали в Юникод, несмотря на то, что они не являются «настоящими» кандзи.
- ^ Для доказательства см. список в Карте символов Модзикё, МОЧРМАП.EXE .
- ^ См. также: вымышленная запись ; ул. ловушка .
Внешние ссылки
[ редактировать ]- Наборы символов
- Кодировки азиатских языков
- Кодировки японского языка
- 1997 г. заведения в Японии
- Компании-разработчики программного обеспечения, основанные в 1997 году.
- Методы ввода CJK
- Компьютеры на китайском языке
- Компьютеры на японском языке
- Компьютер на корейском языке
- Индийские вычисления
- Языковое программное обеспечение для Windows
- Шрифты CJK
- Шрифты символов
- Латинские шрифты
- Тангутское письмо
- Бесплатное ПО только для Windows