Jump to content

Анализируемый макет и текстовый объект

Анализируемый макет и текстовый объект ( ALTO ) — это открытая XML- схема, разработанная финансируемым ЕС проектом METAe. [1]

Стандарт изначально был разработан для описания оптического распознавания текста и информации о макете страниц оцифрованных материалов. Целью было описать макет и текст в форме, позволяющей восстановить исходный внешний вид на основе оцифрованной информации – аналогично подходу операции сохранения изображения без потерь.

ALTO часто используется в сочетании со стандартом кодирования и передачи метаданных (METS) для описания всего оцифрованного объекта и создания ссылок на файлы ALTO, например, описания последовательности чтения.

Стандарт хранится в Библиотеке Конгресса с 2010 года и поддерживается редакционной коллегией, созданной в то же время.

Со времени окончательной версии стандарта ALTO в июне 2004 года (версия 1.0) ALTO поддерживался CCS CCS Content Conversion Specialists GmbH, Гамбург, до версии 1.4.

Структура

[ редактировать ]

Файл ALTO состоит из трех основных разделов, являющихся дочерними элементами корня. <alto> элемент: [2]

  • <Description> Раздел содержит метаданные о самом файле ALTO и информацию об обработке того, как файл был создан.
  • <Styles> раздел содержит стили текста и абзацев с их индивидуальными описаниями:
    • <TextStyle> есть описания шрифтов
    • <ParagraphStyle> содержит описания абзацев, например информацию о выравнивании
  • <Layout> Раздел содержит информацию о содержимом. Он подразделяется на <Page> элементы.
<?xml version="1.0"?>
<alto>
  <Description>
    <MeasurementUnit/>
    <sourceImageInformation/>
    <Processing/>
  </Description>
  <Styles>
    <TextStyle/>
    <ParagraphStyle/>
  </Styles>
  <Layout>
    <Page>
      <TopMargin/>
      <LeftMargin/>
      <RightMargin/>
      <BottomMargin/>
      <PrintSpace/>
    </Page>
  </Layout>
</alto>

Поддержка программного обеспечения

[ редактировать ]

См. также

[ редактировать ]
  1. ^ Стехно, Биргит; Эггер, Александр; Ретти, Грегор (апрель 2003 г.). «METAe — автоматическое кодирование оцифрованных текстов». Литературно-лингвистическая информатика . 18 (1): 77–88. дои : 10.1093/llc/18.1.77 .
  2. ^ Структура файлов ALTO.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: adbcb1c2f5a229543aa312d4ca027776__1710732420
URL1:https://arc.ask3.ru/arc/aa/ad/76/adbcb1c2f5a229543aa312d4ca027776.html
Заголовок, (Title) документа по адресу, URL1:
Analyzed Layout and Text Object - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)