Схема пешеходного перехода
— Пересечение схемы это таблица, в которой показаны эквивалентные элементы (или «поля») более чем в одной схеме базы данных . Он сопоставляет элементы одной схемы с эквивалентными элементами другой схемы.
или параллельно с ними Таблицы переходов часто используются внутри корпоративных систем , особенно когда несколько систем взаимодействуют или когда система включает в себя устаревшие системные данные. В контексте интерфейсов они функционируют как внутренний механизм извлечения, преобразования и загрузки (ETL).
Например, это переход метаданных от стандартов MARC к Dublin Core :
MARC-поле | Дублинский основной элемент | |
---|---|---|
260 центов (дата публикации, распространения и т. д.) | → | Дата.Создано |
522 (Примечание о географическом охвате) | → | Покрытие.Пространственное |
300 долларов США (физическое описание) | → | Формат. Экстент |
Переходы показывают людям, куда поместить данные из одной схемы в другую. Они часто используются библиотеками, архивами, музеями и другими учреждениями культуры для перевода данных в или из стандартов MARC, Dublin Core, Text Encoding Initiative (TEI) и других схем метаданных. Например, в каталоге архива есть запись MARC, описывающая рукопись. Предположим, архив делает цифровую копию этой рукописи и хочет разместить ее в сети вместе с информацией из каталога. В этом случае ему придется перевести данные из записи каталога MARC в другой формат, например схему описания объекта метаданных , который можно просмотреть на веб-странице. Поскольку MARC имеет поля, отличные от MODS, необходимо принять решение о том, куда поместить данные в MODS. Этот тип «перевода» из одного формата в другой часто называют «сопоставлением метаданных» или «сопоставлением полей» и связан с « сопоставлением данных » и « семантическим сопоставлением ».
Пешеходные переходы также имеют ряд технических возможностей. Они помогают базам данных использовать различные схемы метаданных для обмена информацией. Они помогают сборщикам метаданных создавать объединенные каталоги. Они позволяют поисковым системам выполнять поиск в нескольких базах данных одновременно с помощью одного запроса.
Проблемы с пешеходными переходами
[ редактировать ]Одна из самых больших проблем для пешеходных переходов заключается в том, что не существует двух схем метаданных, которые были бы на 100% эквивалентны. В одной схеме может быть поле, которого нет в другой схеме, или поле, разделенное на два разных поля в другой схеме; вот почему вы часто теряете данные при преобразовании сложной схемы в более простую. Например, при сопоставлении MARC с Simple Dublin Core вы теряете различие между типами заголовков:
MARC-поле | Дублинский основной элемент | |
---|---|---|
210 Сокращенное название | → | Заголовок |
222 Ключевое название | → | Заголовок |
240 Униформа Название | → | Заголовок |
242 Переведенное название | → | Заголовок |
245 Заявление о названии | → | Заголовок |
246 Вариант названия | → | Заголовок |
Simple Dublin Core имеет только один элемент «Title», поэтому все различные типы заголовков MARC объединяются без дальнейших различий. Это называется отображением «многие к одному». Именно поэтому, переведя эти заголовки в Simple Dublin Core, вы не сможете перевести их обратно в MARC. Как только они станут Simple Dublin Core, вы потеряете информацию MARC о том, какие типы заголовков они представляют, поэтому при сопоставлении из Simple Dublin Core обратно в MARC все данные в элементе «Title» сопоставляются с базовым MARC 245. Поле «Заголовок». [1]
Дублинский основной элемент | MARC-поле | |
---|---|---|
Заголовок | → | 245 Заявление о названии |
Заголовок | → | 245 Заявление о названии |
Заголовок | → | 245 Заявление о названии |
Заголовок | → | 245 Заявление о названии |
Заголовок | → | 245 Заявление о названии |
Заголовок | → | 245 Заявление о названии |
Вот почему пешеходные переходы называются «латеральными» (односторонними) отображениями одной схемы на другую. Для перехода от схемы А к схеме Б и от схемы Б к схеме А потребуются отдельные пешеходные переходы. [2]
Трудности в картографировании
[ редактировать ]Другие проблемы с отображением возникают, когда:
- В одной схеме есть один элемент, который необходимо разделить, чтобы разные его части помещались в несколько других элементов второй схемы (отображение «один ко многим»).
- Одна схема позволяет элементу повторяться более одного раза, а другая позволяет этому элементу появляться только один раз с несколькими терминами в нем.
- Схемы имеют разные форматы данных (например, Джон Доу или Доу, Джон ).
- Элемент в одной схеме индексируется, но эквивалентный элемент в другой схеме не индексируется.
- Схемы могут использовать разные контролируемые словари.
- Схемы со временем меняют свои стандарты
Некоторые из этих проблем не поддаются устранению. Как говорит Карен Койл в статье « Метаданные цитирования пешеходного перехода: опыт Калифорнийского университета » ,
«Чем больше у нас опыта работы с метаданными, тем яснее становится, что совершенство метаданных недостижимо, и любой, кто попытается это сделать, будет сильно разочарован. Когда метаданные передаются между двумя или более несвязанными источниками, появляются элементы данных, которые невозможно согласовать. идеальным образом. Ключом к успешному переходу метаданных является разумная гибкость. Очень важно сосредоточиться на важных целях и быть готовым к компромиссу для достижения практического завершения проектов». [3]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «От Дублинского ядра до пешеходного перехода MARC», Управление развития сети и стандартов MARC, Библиотека Конгресса.
- ^ Каплан, Присцилла (2003). Основы метаданных для всех библиотекарей . Чикаго: Американская библиотечная ассоциация. стр. 39 . ISBN 0838908470 .
- ^ в «Метаданных на практике» Дайан И. Хиллманн и Элейн Л. Уэстбрукс, ред., Американская библиотечная ассоциация, Чикаго, 2004, стр. 91.