CEDICT
Тема этой статьи Википедии может не соответствовать общему правилу по известности . ( июнь 2023 г. ) |
Проект CEDICT был начат Полом Денисовски в 1997 году и поддерживается командой mdbg.net под названием CC-CEDICT с целью предоставить полный китайско - английский словарь с произношением на языке пиньинь китайских иероглифов .
Содержание
[ редактировать ]CEDICT — текстовый файл ; другие программы (или просто Блокнот , или egrep для его поиска и отображения необходимы , или аналогичный). Этот проект используется несколькими другими китайско-английскими проектами. База данных Unihan использует данные CEDICT для получения большей части информации о соединениях символов, но они являются вспомогательными и явно не являются частью основной базы данных Unicode. [1]
Функции:
- Традиционный китайский и упрощенный китайский
- Пиньинь (несколько произношений)
- Американский английский (несколько)
- По состоянию на 22 января 2024 г. [update], у него было 122 444 записи в UTF-8 . [2]
Основной формат записи CEDICT:
Traditional Simplified [pin1 yin1] /American English equivalent 1/equivalent 2/ 漢字 汉字 [han4 zi4] /Chinese character/CL:個|个/
Пример простого поиска в egrep:
$ egrep -i 有勇無謀 cedict.txt 有勇無謀 有勇无谋 [you3 yong3 wu2 mou2] /bold but not very astute/
История
[ редактировать ]Год | Событие |
---|---|
1991 | словаря EDICT Проект японского был начат Джимом Брином . |
1997 | Проект CEDICT, начатый Полом Денисовски, по модели EDICT. Продолжил Эрик Петерсон. |
2007 | MDBG запустила новый проект под названием CC-CEDICT , который продолжает проект CEDICT с новой лицензией: Creative Commons Attribution-Share Alike 3.0 License , позволяющей использовать ее большему количеству проектов. [3] Кроме того, был настроен рабочий процесс [1] для оптимизации процесса подачи, рассмотрения и обработки новых записей. |
Связанные проекты
[ редактировать ]CEDICT указал путь некоторым другим проектам:
- HanDeDict (~ 156 000 записей на китайском языке)
- CFDICT (~ 44 000 записей) для французского языка
- Некоторые старые данные CEDICT также можно найти в словаре Adsotrans .
- Февраль 2012 г.: запуск ChE-DICC , бесплатного испанско-китайского словаря (в настоящее время бета-версия).
- Май 2017 г.: CHDICT (11 000 записей) для венгерского языка.
- CC-Canto — это Pleco Software добавление чтения на кантонском языке в транскрипции Джютпинг к CC-CEDICT. [4]
- Кантонский CEDICT включает кантонский язык в транскрипции Йельского университета и содержит специфические для кантонского диалекта слова, многие из которых были взяты из «Словаря кантонского сленга». [5] возможно нарушение авторских прав . [6]
Ссылки
[ редактировать ]- ^ «Поиск в базе данных Unihan» . unicode.org .
- ^ «Англо-китайский словарь MDBG» . www.mdbg.net .
- ^ Первоначальная лицензия CEDICT предназначалась только для некоммерческого использования и не позволяла добавлять записи без разрешения.
- ^ «CC-Canto — кантонский словарь для всех» . кантонский язык.орг .
- ^ http://writecantonese8.wordpress.com/2012/02/04/cantonese-cedict-project/ «Позже мне посоветовали объединить данные из кантонского Stardict , который представляет собой электронную версию «Словаря кантонского сленга», на кантонский CEDICT"
- ^ «СтарДикт» . Stardict.sourceforge.net . Проверено 18 ноября 2011 г.
Внешние ссылки
[ редактировать ]- редактора CC-CEDICT Домашняя страница проекта
- дополнительная информация о форматировании CC-CEDICT