Модзикё
![]() | |
![]() | |
Разработчик(и) | Тадахиса Исикава ( Тадахиса Исикава ) Токио Фуруя ( Токио Фуруя ) Институт Модзикё ( Ассоциация исследования зеркала персонажей ) |
---|---|
Первоначальный выпуск | 1.0 / июль 1997 г |
Финальный выпуск | 4.0
/ 15 декабря 2018 г |
Операционная система | Microsoft Windows |
Размер | 51 МБ |
Доступно в | японский |
Тип | Набор символов в комплекте со шрифтами и картой символов. |
Лицензия | Собственный |
Веб-сайт | модзикё |
Модзикё ( японский : 文字鏡 ), также известный под своим полным именем Конджаку Модзикё ( 今昔文字鏡 , букв. « () зеркало символов прошлого и настоящего » ) , представляет собой схему кодирования символов , созданную для обеспечения полного указателя символов, используемых в китайская корейская , японская , Чу , вьетнамская Ном и другие исторические китайские логографические системы письма. Институт Модзикё ( 文字鏡研究会 , Mojikyō Kenkyūkai ) , опубликовавший набор символов, также опубликовал компьютерное программное обеспечение и шрифты TrueType , сопровождающие его. Институт Модзикё под председательством Тадахиса Исикава ( 石川忠久 ) , [ 1 ] Первоначально набор символов, соответствующее программное обеспечение и данные распространялись на компакт-дисках, продаваемых в магазинах «Кинокуния» . [ 2 ]
Концептуализированный в 1996 году, [ 3 ] первая версия компакт-диска была выпущена в июле 1997 года. [ 4 ] Какое-то время Институт Модзикё также предлагал веб-подписку под названием « Mojiky WEB» ( 文字鏡WEB ), в которой были более современные символы. [ 5 ]
По состоянию на сентябрь 2006 г. [update], Модзикё закодировал 174 975 символов. [ 6 ] Среди них 150 366 символов (≈86%) тогда принадлежали расширенному китайско-японскому-корейско-вьетнамскому языку (CJKV). [ примечание 2 ] семья. [ 5 ] Многие символы Модзикё считаются устаревшими или малоизвестными и не кодируются никаким другим набором символов, включая наиболее широко используемый международный стандарт кодирования текста — Unicode .
Первоначально это был платный проприетарный программный продукт, с 2015 года Институт Модзикё начал загружать свои последние выпуски в Интернет-архив как бесплатное программное обеспечение . [ 7 ] как памятник , Токио Фуруи , разработчиков в честь одного из его который умер в том же году. [ 3 ] 15 декабря 2018 г. вышла версия 4.0. На следующий день Исикава объявил, что без Фуруи это будет последний релиз Модзикё . [ 3 ]
Помещение
[ редактировать ]Кодировка Модзикё китайской была создана для обеспечения полного указателя символов, используемых в , японской , корейской системах письма и вьетнамских сценариях Тё Ном логографических . Он также кодирует большое количество символов в древних письменностях, таких как письмо на кости оракула , письмо на печати и санскрит ( сиддхам ). Для многих символов это единственная кодировка символов , позволяющая их кодировать, и ее данные часто используются в качестве отправной точки для Unicode . предложений [ 8 ] [ 9 ] Однако Модзикё имеет гораздо более свободные стандарты кодирования, чем Юникод, что приводит к тому, что Модзикё имеет множество закодированных символов сомнительного или даже непреднамеренно вымышленного происхождения. [ 10 ] [ 11 ] Таким образом, хотя многие символы Модзикё, не входящие в Unicode , подходят для добавления в Unicode, не все могут стать символами Unicode из-за разных стандартов доказательства, требуемых каждым из них.
Состав
[ редактировать ]Шрифты Mojikyō шрифты , представляют собой TrueType которые поставляются в ZIP-файле каждый и имеют размер около 2–5 мегабайт . Различные шрифты содержат разное количество символов; [ примечание 3 ] Также включен исполняемый файл Windows , реализующий графическую карту символов , « Карта символов Модзикё » ( 文字鏡MAP ), МОЧРМАП .EXE . [ примечание 4 ] [ примечание 5 ] MOCHRMAP.EXE позволяет пользователям просматривать шрифты Mojikyō , а также копировать и вставлять символы вместо их ввода на клавиатуре. В отличие от обычной карты символов Windows или, если уж на то пошло, KCharSelect , которые поддерживают шрифты TrueType, MOCHRMAP.EXE отображает пронумерованный Модзикё слот кодировки запрошенного символа. [ 12 ] [ примечание 6 ] Для того, чтобы MOCHRMAP.EXE Для работы Mojikyō . должны быть установлены все шрифты [ примечание 7 ]
Кодирование
[ редактировать ]При обращении к символу, закодированному в Mojikyō , часто используется формат MJXXXXXX, аналогичный формату U+XXXX, используемому для Unicode. Например, хентайгана U+1B008 𛀈 ХЕНТАЙГАНА БУКВА I-3 имеет кодировку Модзикё MJ090007 и кодировку Юникода U+1B008. [ 13 ] Разница, однако, состоит в том, что кодировки Mojikyō , отображаемые таким образом, являются десятичными , а кодировка Unicode U+ — шестнадцатеричной .
С самых первых дней существования Unicode Модзикё одновременно влиял на стандарт и находился под его влиянием. Глифы, происходящие от Модзикё, впервые появляются в предложении, поданном Группе идеографических докладчиков (IRG). [ примечание 8 ] который отвечает за поддержку всех блоков CJK в Юникоде, [ 14 ] [ 15 ] 18 апреля 2002 г. [ 16 ] В мае 2007 года Модзикё сыграл второстепенную роль в серии успешных предложений по кодированию тангутского письма в Unicode; [ 17 ] [ примечание 9 ] К октябрю 2002 года в Модзикё уже было закодировано 6000 тангутских символов. [ 6 ]
В базе данных Unihan стандарта Unicode Модзикё называется «Японской коллекцией КОКУДЗИ » ( 日本国字集 ), [ 18 ] сокращенно «ЖК». [ 19 ] [ 20 ] Например, U+2B679 𫙹 ЕДИНАЯ ИДЕОГРАФИЯ CJK-2B679 , [ примечание 10 ] иероглиф , читаемый по-японски как burizādo ( метель , букв. « метель » ) , имеет J-источник. [ примечание 11 ] равен JK-66038. Все символы Юникода с J-источником с префиксом JK происходят из Модзикё . [ 21 ] [ примечание 12 ] По словам Кена Лунде , эксперта в области кодировок символов и восточноазиатских языков , начиная с версии Unicode 13.0, 782 иероглифов в Unicode происходят из Mojikyō , разделенных примерно поровну между двумя блоками : CJK Unified Ideographs Extension C с 367 и CJK Unified Ideographs. Расширение E , с 415. [ 20 ] [ 22 ] Не все символы Юникода, имеющие происхождение Модзикё тот же репрезентативный глиф (J-источники с префиксом JK), имеют в таблице кодов , что и в шрифте Модзикё ; [ примечание 13 ] Форма некоторых персонажей была изменена перед окончательным кодированием, поскольку расследование показало, что формы, присвоенные Институтом Модзикё, были неправильными. [ 11 ] [ примечание 14 ]
Блоки
[ редактировать ]По состоянию на сентябрь 2006 г. [update] он закодировал 174 975 символов. [ 6 ] Среди них 150 366 символов тогда принадлежали расширенному CJKV. [ примечание 2 ] семья. [ 5 ] Многие из закодированных символов считаются устаревшими или иным образом неясными и не кодируются никаким другим набором символов, включая международный стандарт Unicode. Каждый персонаж Модзикё имеет уникальный номер, а символы организованы в блоки.
Модзикё помещает символы CJKV в разные блоки в соответствии с их традиционным Канси радикалом . Общие радикалы, содержащие особенно большое количество символов, такие как радикалы 9 ( 人 ) и 162 ( ⻌ ), разделяются далее по порядку штрихов. [ примечание 15 ]
Никакой унификации
[ редактировать ]В отличие от Unicode, Модзикё намеренно избегает объединения Хань ; не предпринимается никаких попыток обеспечить компактность кодировки, а также не делается попытка сохранить все общие символы ниже U + FFFF, как это есть в Unicode.
Unicode, с другой стороны, сортирует свой CJK на блоки в зависимости от того, насколько они распространены: наиболее распространенные обычно помещаются в базовую многоязычную плоскость , [ примечание 14 ] тогда как те, что редки или малоизвестны, отнесены к дополнительным планам .
Например, в Radical 9 есть два символа, а в Юникоде — один: MJ054435 ( 令 ) и MJ059031 ( 令 ), оба представлены в Юникоде как U+4EE4 令 CJK ЕДИНАЯ ИДЕОГРАФИЯ-4EE4 .
Лицензия
[ редактировать ]Mojikyō — это проприетарное программное обеспечение с ограниченной лицензией. Первоначально Институт Модзикё пытался предотвратить использование своих символьных данных и угрожал тем, кто публиковал таблицы преобразования в его набор символов и из него. В июле 2010 года Институт Модзикё отказался от своих юридических усилий, направленных на то, чтобы помешать хотя бы одному японскому пользователю публиковать таблицы преобразования или конвертировать символы, закодированные в Модзикё, в Unicode или другие наборы символов. [ 23 ] Простые данные, иногда включающие формы букв, во многих юрисдикциях считаются общей собственностью, поскольку они не соответствуют порогу оригинальности . [ примечание 16 ]
Однако из-за этого наследия GlyphWiki запретила данные Модзикё с 2020 года. [ 24 ]
Собранные системы письменности
[ редактировать ]Жизнь
[ редактировать ]- Китайский — Гусь
- Японский — кандзи , кана (включая хентайгану )
- Корейский — Ханджа
- Латинский алфавит с диакритическими знаками
- Кириллица с диакритическими знаками
Мертвый или устаревший
[ редактировать ]- Древний китайский
- Это тайваньский
- Вьетнамский — сценарий Nom
- Санскрит – Сиддхам
- Тангутское письмо
- Суй скрипт
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Об » Институте Модзикё (на японском языке). Архивировано 3 февраля 2001 года . Проверено 6 июля 2020 года .
- ^ Добро пожаловать в мир характерных зеркал! [Добро пожаловать в мир Модзикё !] (на японском языке). Кинокуния КК. Архивировано из оригинала 4 марта 2005 года . Проверено 5 июля 2020 г.
- ^ Jump up to: а б с Исикава, Тадахиса (август 2015 г.). « о твоей смерти» Токио Фуруя, мы скорбим (на японском языке) . Проверено 8 июля 2020 г. .
- ^ Конжак Модзикё Слово зеркало прошлого и настоящего (на японском языке), июль 1997 г., ISBN. 9784314900034
- ^ Jump up to: а б с Что такое Конджаку Модзигами? [О Модзикё] (на японском языке). Кинокуния КК. Архивировано из оригинала 27 апреля 2010 года . Проверено 5 июля 2020 г.
- ^ Jump up to: а б с Что такое Конджаку Модзигами? [Что такое Модзикё ?] (на японском языке). Кинокуния КК. Архивировано из оригинала 5 февраля 2005 года . Проверено 5 июля 2020 г.
- ^ "Поиск: создатель:"Институт МОДЗИКЁ" " . Интернет-архив . Проверено 6 июля 2020 г.
- ^ Такада, Томокадзу; Яда, Цутому; Сайто, Тацуя (18 сентября 2015 г.). Предложение по хентайгане (PDF) . Перевод Кобаяши, Тацуо ; Кобаяши, Дэниел. Общество обработки информации Японии . Л2/15-239 . Проверено 5 июля 2020 г. - через Консорциум Unicode .
- ^ Хиура, Хидеки; Кобаяши, Тацуо ; и др. (31 октября 2003 г.). Селектор вариантов идеографа и идентификатор коллекции вариантов . Инициатива открытой интернационализации. Л2/03-413 . Проверено 5 июля 2020 г. - через Консорциум Unicode .
- ^ Такада, Томокадзу и др . ; Ода, Тецудзи . (26 августа 2013 г.) Протокол 3-й подгруппы по рассмотрению текстовой информации в 2013 г. [Протокол заседания третьей рабочей подгруппы по изучению информации о персонажах 2013 г. ( 25 ] (PDF) , Heisei Правительство Японии (на японском языке), дата обращения 6 июля 2020 г.
) в результате интервью с соответствующими сторонами было установлено, что WG2, предложенная Нидерландами N36981 использует шрифт Mojigami, но исследовательская группа Mojigami не участвовала, и есть сомнения по поводу содержания предложения. [Согласно интервью с представителем Института Модзикё, шрифт Модзикё используется в WG2 N36981, предложенном Нидерландами, но сам Институт Модзикё не участвует в этом предложении; кроме того, у него есть сомнения по поводу некоторых частей этого предложения; .]
- ^ Jump up to: а б Сузуки, Тошия [ Тошия Судзуки ] (30 июля 2009 г.). Исследование графических символов «Коллекция коллекции Инь Чжоу Цзиньбунь», которые были применены к интегрированным китайским иероглифам. [Исследование глифов, собранных из «Индекса коллекции надписей периода Инь-Чжоу», для отправки в CJK Unified Ideographs]. Технический отчет IPSJ SIG языке 2009-DD-72 (7). (на японском : 2 - через Интернет-архив Однако ,
поскольку работа по стандартизации расширенного C длилась восемь лет, а примеры стали обязательными постфактум, официально обнародованные полномочия для кандзи Extended C сильно отличаются от первоначальных. Например, Япония первоначально подала заявку на около 1000 кандзи, выбранных Исследовательской группой Модзикё. ] [...] Поскольку примеры использования полномочий проверялись независимо от зеркала персонажа, многие формы глифов были изменены по сравнению с кандзи зеркала персонажа. [Поскольку работа по стандартизации CJK Unified Ideographs Extension C длилась восемь долгих лет, а примеры кандзи запрашивались после их кодирования, официально обнародованный стандарт кандзи Extension C сильно отличается от исходного стандарта. Например, мы, Правительство Японии первоначально подало заявку на получение около 1000 кандзи, отобранных Институтом Модзикё[.] [...] Поскольку проверка кандзи проводилась независимо от Института Модзикё, формы символов часто менялись по сравнению с версией того же кода Модзикё.]
- ^ Исикава, Тадахиса (25 мая 1999 г.). «Полное руководство по кандзи в прошлом и настоящем» [Кандзи на вашем компьютере, Made Easy — Полное руководство по модзикё]. Проверено 6 июля 2020 г.
- ^ Информационный список персонажей MJ [Таблица кодировок символов MJ] (на японском языке). Агентство по продвижению информационных технологий . Архивировано из оригинала 29 сентября 2018 года . Проверено 5 июля 2020 г.
- ^ «Стандартное приложение Unicode № 45: Идеограммы U-источника» . Стандарт Юникод . Консорциум Юникод.
- ^ «Приложение E: История объединения Хань» (PDF) . Стандарт Юникод . Консорциум Юникод. Март 2020.
- ^ «Расширение CJK C1 из Японии» . Группа идеографического докладчика . IRG#19 N895 – через Китайского университета Гонконга . факультет компьютерных наук и инженерии
N895-Япония_C1
- ^ Кук, Ричард (9 мая 2007 г.). Предложение кодировать тангутские символы в плоскости UCS 1 (PDF) . Инициатива по кодированию сценариев Калифорнийского университета в Беркли . п. 4. L2/07-143 – через Консорциум Unicode .
- ^ Дженкинс, Джон Х.; Кук, Ричард; Лунде, Кен, ред. (5 марта 2020 г.), «kIRG JSource» , Стандартное приложение Unicode № 38 , Консорциум Unicode
- ^ Кобаяши, Тацуо (3 декабря 2001 г.). «Список японских иероглифов, которые могут быть предложены в расширении-C» . ISO/IEC JTC1/SC2/WG2/IRG N853.
- ^ Jump up to: а б Кен Лунде [@ken_lunde] (6 июля 2020 г.). «В частности, все 782 идеограммы с префиксом JK действительно взяты из 今昔文字鏡 согласно IRG N862. Большинство из них были закодированы в #ExtensionC, а отставшие были закодированы в #ExtensionE». ( Твиттер ) . Проверено 6 июля 2020 г. - через Twitter .
- ^ Кен Лунде [@ken_lunde] (6 июля 2020 г.). «Иероглифы J-Source с префиксом JK произошли от 今昔文字鏡, которые находятся в расширениях C и E (упоминание о расширении D было просто тем, что то, что стало расширением E, изначально планировалось стать расширением D)» ( твит ). Архивировано из оригинала 7 июля 2020 года . Проверено 6 июля 2020 г. - через Twitter .
- ^ Кен Лунде [@ken_lunde] (6 июля 2020 г.). «367 иероглифов с префиксом JK находятся в расширении C, а остальные 415 — в расширении E». ( Твиттер ) . Проверено 6 июля 2020 г. - через Twitter .
- ^ « Объявление: Война окончена». Китайская школа «Лягушечный павильон» [ Кандзи- школа Сэйватея ] (на японском языке) (изд. 28 января 2016 г.). 21 июля 2010 года . Проверено 7 июля 2020 г.
- ^ «Лицензия на наши данные и статьи» . GlyphWiki (изд. 9 июня 2010 г.) Проверено 6 июля 2020 г. .
Konjaku Mojigami и связанные с ней продукты и данные не могут использоваться GlyphWiki по лицензии. Сам глиф, включенный в номер модзигами (уникальная часть), и шрифт глифа, а также информация, которую можно определить как созданную путем ссылки или использования, не могут использоваться в качестве авторитетных данных при регистрации на Glyph Wiki. Это не так. возможно, поэтому мы просим вашего сотрудничества. [ Конджаку Модзикё вышеуказанной лицензией GlyphWiki. Ни номер слота кодирования Модзикё , ни внешний вид самого глифа в Модзикё и связанные с ним продукты и связанные данные лицензируются таким образом, что они несовместимы с нашей шрифтах , ни какая-либо информация. все, что можно считать собранным со ссылкой на продукт Mojikyō , может быть использовано при вводе данных в GlyphWiki. Мы категорически не можем принимать данные Mojikyō . Пожалуйста, сотрудничайте с нами. нас.]
Примечания
[ редактировать ]- ^ Пока что отсутствует кодировка Unicode , поэтому здесь она аппроксимируется с помощью CSS и U+30BB セ КАТАКАНА БУКВА SE .
- ^ Jump up to: а б В корейском языке ханджа упоминаются . Для вьетнамского языка Nom .
- ^ Скачать файл MojikyoCmap400ALL49TTF.7z с официального сайта
- ^ Английское название из заголовка окна, создаваемого при запуске исполняемого файла; Японское название от значка исполняемого файла.
- ^ Также называется «Cmap Модзикё».
- ^ Смотрите скриншоты на официальном сайте.
- ^ В каталог системных шрифтов. C:\Windows\Шрифты .
- ^ В 2019 году IRG была переименована в Группу идеографических исследований.
- ^ История кодирования тангутского письма довольно сложна, см. Тангут (блок Unicode) § История , где представлен полный список всех связанных предложений и временная шкала.
- ^ Последовательность идеографического описания : ⿰魚嵐
- ^ Это имя столбца в базе данных Unihan ; ⟨J⟩ здесь является сокращением от «источник японских символов». Полное имя столбца
kIRG_JSource
. В рамках объединения Хань таких источников девять. см. в §3.1 UAX#38 . Полный список и дополнительную информацию - ^ Существуют и другие префиксы J-Source, например J4, что означает, что символ происходит из JIS X 0213:2004 .
- ^ То есть глиф, состоящий из одних и тех же радикалов в одних и тех же позициях.
- ^ Jump up to: а б Ошибки в больших коллекциях иероглифов, конечно, нередки. Такие ошибки даже случайно случаются в хорошо финансируемых государственных коллекциях, таких как знаменитые кандзи из неизвестных источников в комитета по промышленным стандартам Японского JIS X 0208 стандарте кодирования двухбайтовых символов . Все эти кандзи ошибки JIS X 0208 ( символы-призраки , 幽霊文字 ; например, 彁 ) попали в Юникод, несмотря на то, что они не являются «настоящими» кандзи.
- ^ Для доказательства см. список в Карте символов Модзикё, МОЧРМАП.EXE .
- ^ См. также: вымышленная запись ; ул. ловушка .
Внешние ссылки
[ редактировать ]- Наборы символов
- Кодировки азиатских языков
- Кодировки японского языка
- 1997 г. заведения в Японии
- Компании-разработчики программного обеспечения, основанные в 1997 году.
- Методы ввода CJK
- Компьютеры на китайском языке
- Компьютеры на японском языке
- Компьютер на корейском языке
- Индийские вычисления
- Языковое программное обеспечение для Windows
- Шрифты CJK
- Шрифты символов
- Латинские шрифты
- Тангутское письмо
- Бесплатное ПО только для Windows