Эскрипторий
![]() | |
![]() | |
Первоначальный выпуск | 2018 |
---|---|
Стабильная версия | v0.14.0 [1] / 24 октября 2023 г. |
Репозиторий | |
Операционная система | независимый от платформы |
eScriptorium — это платформа для ручной или автоматической сегментации и распознавания текста исторических рукописей и гравюр.
Подробности
[ редактировать ]
Программное обеспечение имеет открытый исходный код и поэтому может быть свободно установлено на ваши компьютеры. Он разработан в Парижском университете наук и литературы в рамках проектов Scripta. [2] и УСТОЙЧИВОСТЬ [3] за счет взносов других учреждений, частично финансируемых программой финансирования ЕС Horizon 2020 и грантом Фонда Эндрю У. Меллона .
Отсканированные страницы рукописей и распечаток можно импортировать в eScriptorium и экспортировать в виде текста в различных форматах (текст, ALTO или PAGE XML , TEI ). Текстовые области с текстовыми строками на изображениях сначала распознаются вручную или автоматически (сегментация). Затем текстовые строки транскрибируются вручную или автоматически. [4]
Как автоматическую сегментацию, так и распознавание текста можно обучить, используя созданные вручную или исправленные примеры ( основанная истина ). Созданными таким образом новыми моделями можно поделиться с другими и, следовательно, их можно легко использовать повторно. [5]
В основе eScriptorium лежит бесплатное программное обеспечение OCR Kraken от Бенджамина Кисслинга, производное от программного обеспечения OCRopus , которое подходит для рукописных и печатных текстов, а также поддерживает такие сценарии, как иврит и арабский язык, которые пишутся справа налево. [6]
Сопоставимыми программами, предлагающими функции, аналогичные eScriptorium, являются OCR4All. [7] и Транскриб .
Индивидуальные ссылки
[ редактировать ]- ^ "v0.14.0" . Проверено 21 января 2024 г.
- ^ «Scripta-PSL. История и практика письма» . Проверено 13 марта 2022 г.
- ^ «УСТОЙЧИВОСТЬ - Инфраструктура исследований в области религиоведения» . Проверено 13 марта 2022 г.
- ^ «Документация eScriptorium» . Проверено 21 января 2024 г.
- ^ «Экспорт данных — Документация eScriptorium» . Проверено 21 января 2024 г.
- ^ «ланч/кракен: механизм оптического распознавания символов для всех языков» . Проверено 13 марта 2022 г.
- ^ «OCR4all | для ТЕКСТА» . Проверено 20 июня 2023 г.
Внешние ссылки
[ редактировать ]