ЭИДР
Формирование | 2010 |
---|---|
Тип | 501(c)(6) некоммерческая членская корпорация |
Штаб-квартира | Редвуд-Сити, Калифорния |
Исполнительный директор | Холли Чой |
Веб-сайт | баран |
Реестр идентификаторов развлечений , или EIDR , — это глобальная система уникальных идентификаторов для широкого спектра аудиовизуальных объектов, включая кинофильмы, теле- и радиопрограммы. Система идентификации преобразует идентификатор в запись метаданных , которая связана с заголовками верхнего уровня, редакциями, DVD-дисками , кодировками, клипами и коллажами . EIDR также предоставляет идентификаторы поставщикам видеоуслуг, например вещательным и кабельным сетям.
По состоянию на июнь 2020 года EIDR содержит более двух миллионов записей, в том числе почти 400 тысяч фильмов и почти миллион серий из более чем 40 000 сериалов. [1]
EIDR — это реализация идентификатора цифрового объекта (DOI).
История [ править ]
Системы идентификации медиаактивов существуют уже несколько десятилетий. Общей мотивацией их создания является обеспечение возможности управления медиаактивами посредством присвоения уникального идентификатора набору метаданных, представляющих существенные характеристики каждого актива. Со временем такие системы имеют тенденцию размножаться, и каждая из них возникает для решения определенного набора проблем. В результате между системами существуют значительные различия в том, как классифицируются активы, какие метаданные связаны с каждым активом, а также в самом определении актива. Приведем несколько примеров: должна ли « режиссерская версия » фильма отличаться от оригинального театрального релиза? Как следует учитывать региональные различия (например, перевод названия или диалога на иностранные языки)? Дополнительные сложности включают процедуры (и необходимые учетные данные) для добавления новых активов, редактирования существующих активов и создания производных активов.
EIDR был создан для решения этих проблем, а также других, возникающих в рабочих процессах с видеоактивами , как в контексте B2B , так и в рамках внутренней постпроизводственной деятельности производителей контента. EIDR имеет следующие характеристики:
- Центральный реестр доступен всем участникам
- Возможность легко регистрировать новые активы
- Идентификатор актива, который является неизменяемым (и, в частности, в отношении изменений владельца актива или местоположения метаданных или самого актива).
- Обнаружение/предотвращение создания дубликатов одного и того же актива
- Возможность создания набора видеоматериалов на основе абстрактного произведения (например, оригинального театрального выпуска, режиссерской версии, языковых вариантов)
- Возможность группировать видеоресурсы по более общим связям (например, эпизоды сезона телесериала).
- Основной набор метаданных для дифференциации активов, даже если они тесно связаны.
- Масштабируемый, неизменяемый, постоянный
EIDR призван дополнить, а не заменить существующие системы идентификации активов. Напротив, ключевой особенностью является разрешение записи EIDR включать ссылки на идентификатор этого актива в других системах. Эта функция особенно полезна для кино- и телеархивов, позволяя им легко сопоставлять свои фонды с другими источниками работ и метаданных о них. По своей конструкции EIDR не копирует функции других систем идентификации активов, например, коммерческих систем, которые стремятся повысить ценность за счет расширенных метаданных (например, сводки сюжетов, подробности производства). Отслеживание информации о собственности и правах также не является целью, однако ее можно реализовать в виде приложений, использующих идентификатор EIDR.
Модель контента [ править ]
EIDR построен на наборе записей (которые далее подразделяются на поля), которые хранятся в центральном реестре. На эти записи ссылаются извне DOI, которые назначаются при создании записи, и после этого каждый идентификатор становится неизменным. Система разрешения идентификаторов, лежащая в основе DOI, — это система дескрипторов , поэтому каждый собственный идентификатор контента EIDR представляет собой дескриптор, отформатированный с возрастающей специфичностью для обработки стандартов DOI и EIDR.
Формат идентификатора контента [ править ]
Каноническая форма идентификатора контента EIDR представляет собой экземпляр дескриптора и имеет формат:
- 10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C
где
- 10.5240 — это префикс DOI для актива EIDR. «10» указывает на то, что дескриптор является DOI; другие префиксы присваиваются другим типам активов (например, научным публикациям ). Цифры между "." и «/» образуют субпрефикс, который указывает, какое регистрационное агентство в Международном фонде DOI (IDF) имеет права управлять этими дескрипторами. «5240» присвоен Ассоциации EIDR.
- XXXX-XXXX-XXXX-XXXX-XXXX-C — это суффикс DOI. Каждый «X» обозначает шестнадцатеричную цифру (AF), а «C» — это ISO 7064 Mod 37,36. [2] контрольная цифра .
Существует также 96-битная компактная двоичная форма, предназначенная для встраивания в небольшие полезные данные, такие как водяные знаки . Эта форма генерируется из канонического формата следующим образом:
- 16-битный субпрефикс: генерируется путем интерпретации субпрефикса как двоичного значения, например B'0001010001111000'
- 80-битный суффикс: часть суффикса, не являющаяся контрольной суммой, представленная 10 байтами.
Форма единого имени ресурса для идентификатора EIDR указана в РФК 7302 .
Для использования в Интернете идентификатор контента EIDR может быть представлен как URI в одной из следующих форм:
- https://doi.org/10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C : это идентификатор EIDR, представленный в виде ссылки на прокси-сервер DOI (он будет перенаправлен из DOI в реестр EIDR)
- информация: doi : 10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C [устарело] : это идентификатор EIDR, представленный как URI «информации», соответствующий RFC 4452 (помните, что все идентификаторы EIDR также являются идентификаторами DOI, но не наоборот) .
Типы записей [ править ]
Существует четыре типа записей контента, каждый из которых связан с зарезервированным префиксом:
- Идентификатор контента (10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C): связан с развлекательным объектом, например фильмом или сериалом. Записи контента являются иерархическими, что позволяет выражать отношения, например, в виде серий, дочерними элементами которых будут времена года, а потомками — отдельные эпизоды. Поддерживаются многие другие отношения, как описано ниже. Записи контента составляют основную часть данных в реестре EIDR.
- Идентификатор стороны (10.5237/XXXX-XXXX): идентифицирует таких лиц, как владельцы регистрации, производители контента и распространители.
- Идентификатор видеосервиса (10.5239/XXXX-XXXX): Идентифицирует видеосервис, в просторечии известный как «канал» или «сеть»: (обычно) линейная последовательность контента, запланированная для трансляции в определенное время (например, идентификатор сервиса для Cartoon Network — 10.5239/8BE5-E3F6). Видеосервисы имеют иерархическую структуру: например, у родителя может быть несколько детей, чтобы учитывать региональные или языковые различия).
- Идентификатор пользователя (10.5238/[0-9a-zA-Z_.#()]{2-32}): идентифицирует пользователя с помощью строки из 2–32 буквенно-цифровых и выбранных специальных символов (здесь показано с помощью синтаксиса Perl ). Пользователь — это, прежде всего, административное понятие, подчиненное Сторонам (от которых они наследуют права доступа). В отличие от других DOI EIDR, идентификатор пользователя можно использовать только внутри EIDR (например, API программирования).
Все субпрефиксы 5237, 5238, 5239 и 5240 присвоены ассоциации EIDR.
Записи контента [ править ]
Записи контента — это объекты, классифицированные по типам и связям. Каждый из них имеет три различных (ортогональных) типа типа:
- Тип объекта : всего их 10. Во-первых, это базовый тип, который имеет минимальное количество полей, необходимых для описания записи контента. Остальные девять являются производными от базового типа и содержат дополнительные поля для описания более сложных объектов.
- Структурный тип : они различают представления произведения и перечислены в порядке возрастания специфичности:
- Абстракция : используется для объектов, не имеющих реальности, таких как контейнер серии или основная концепция оригинального произведения. Это соответствует Международному стандартному коду музыкальных произведений (ISWC) для музыкальных произведений, Международному стандартному текстовому коду (ISTC) для текстовых произведений или Международному стандартному аудиовизуальному номеру (ISAN) для аудиовизуальных произведений.
- Исполнение : используется для элементов, которые являются конкретными версиями произведения, например, оригинальный театральный выпуск, режиссерская версия фильма или версия телешоу, подвергнутая местной цензуре. Это примерно соответствует Международному стандартному коду записи (ISRC) для музыкальных произведений и некоторым вариантам использования версии ISAN (V-ISAN) для аудиовизуальных произведений.
- Цифровой : конкретное цифровое представление произведения, например формате MPEG-2 кодирование фильма в . Это соответствует некоторым вариантам использования V-ISAN.
- Тип референта : тип контента, независимый от конкретного проявления (например, фильм, показанный по телевидению, по-прежнему остается фильмом):
- Серия : Абстракция, содержащая упорядоченные или неупорядоченные отдельные элементы.
- Сезон : второй уровень группировки ниже серии, обычно охватывающий временной интервал.
- ТВ : Контент, который впервые появился в эфире.
- Фильм : длинный контент, впервые появившийся в кинотеатре или театре.
- Короткометражный : вольное определение для освещения произведений продолжительностью 40 минут или меньше, таких как музыкальные клипы , театральные кинохроники , короткометражные театральные мультфильмы или мультфильмы DTV.
- Интернет : контент, впервые появившийся в Интернете. Это отличается от контента, размещенного где-либо еще в Интернете.
- Интерактивный материал : Контент, который не является строго аудиовизуальным. Он охватывает меню DVD, наложения интерактивного телевидения, настраиваемые проигрыватели и т. д.
- Сборник : Контент, состоящий из множества других ресурсов, которые невозможно описать более точно, например бокс-сет франшизы фильма.
- Дополнительный : этот тип предназначен для вторичного контента, основной целью которого является поддержка, расширение или продвижение другого контента. Примеры включают трейлеры, отрывки и рекламные документальные фильмы («создание» произведений).
Основные метаданные [ править ]
Следующие поля (взятые из большего набора) содержат данные базового объекта записи контента:
- Структурный тип : например, абстракция
- Режим : например, AudioVisual (для фильма или телепрограммы); «Аудио» для радиопрограммы; «Визуал» для бесшумной работы.
- Тип ссылки : например, фильм
- Название : основное название. Титулы и альтернативные титулы дополнительно различаются по:
- Язык : язык названия, выраженный в виде ISO 639-1. кода
- Класс : выпуск или региональный
- Альтернативное название 1..N : одно или несколько альтернативных названий (часто региональные или языковые варианты).
- Исходный язык : язык оригинальной версии, выраженный в виде кода ISO 639-1.
- Связанная организация 1..N : Идентификатор(а) партии продюсера, студии и т. д.
- Дата выпуска : дата, когда название было первоначально выпущено.
- Страна происхождения : код ISO 3166-1 альфа 2 с расширениями для несуществующих стран.
- Приблизительная длина : выражается в виде XML-схемы xs:duration. [3] тип данных
- Альтернативный идентификатор 1..N : один или несколько эквивалентных идентификаторов, выраженных в другой системе идентификации активов (см. обсуждение ниже).
- Кредиты : предоставляются только скелетные титры, обычно ограничивающиеся режиссером и четырьмя главными актерами. Как уже отмечалось, у EIDR нет цели конкурировать с проприетарными системами с богатыми метаданными (например, сводками сюжетов). Основная цель — помочь устранить неоднозначность названия, а также помочь в проверке и устранении дублирования.
- Регистрант : сторона, создавшая эту запись контента (например, «10.5237/superparty»).
- Дата создания : дата создания этой записи контента.
- Статус : обычно «действителен» (есть особые случаи для удаленных записей)
- Дата последнего изменения : время последнего изменения этой записи содержимого.
Удаленные записи контента [ править ]
Идентификатор EIDR должен быть всегда разрешимым, поэтому при нормальных обстоятельствах соответствующая запись контента будет постоянной. Существует два механизма для устранения ошибок или других необычных обстоятельств. Предпочтительным является псевдоним, при котором идентификатор EIDR прозрачно перенаправляется на другую запись контента. Псевдонимы обычно используются для работы с активом, регистрируемым дважды.
Другой механизм — использование надгробных записей. Это используется, когда запись контента повреждена или случайно зарегистрирован недействительный актив по иным причинам. В этом случае идентификатор будет сопоставлен со специальной записью-захоронением. Приложения могут распознать захоронение, поскольку в его поле идентификатора EIDR будет установлено отличительное значение « 10.5240/0000-0000-0000-0000-0000-X ». Обратите внимание, что «X» означает 24-ю букву латинского алфавита ( ASCII 0x58 или Unicode U+0058).
Альтернативный идентификатор [ править ]
Наличие богатого набора альтернативных идентификаторов контента — одна из основных целей EIDR. Это позволяет использовать идентификаторы EIDR повсюду в рабочих процессах с контентом; если необходим альтернативный идентификатор, его можно найти в метаданных идентификатора EIDR. EIDR поддерживает включение как собственных, так и других стандартных (например, ISAN) идентификаторов. При необходимости могут быть добавлены дополнительные альтернативные идентификаторы (например, если стороны хотят поддерживать новые рабочие процессы). Ниже приведен пример альтернативных идентификаторов для актива EIDR 10.5240/EA73-79D7-1B2B-B378-3A73-M (фильм « Бегущий по лезвию» ). Если альтернативный идентификатор можно разрешить алгоритмически, например, разместив его соответствующим образом в URL-адресе шаблона, EIDR делает эту ссылку доступной.
Альтернативный идентификатор | 0000-0000-14A9-0000-К-0000-0000-Е |
Тип: ОДИНОЧНЫЙ | |
Альтернативный идентификатор № 2 | 89 |
Тип: ИВА | |
Альтернативный идентификатор № 3 | B000SW4DLM |
Тип: Собственный домен: amazon.com | |
Альтернативный идентификатор № 4 | 12886 |
Тип: Собственный домен: flixster.com | |
Альтернативный идентификатор № 5 | 15042 |
Тип: Собственный домен: thecinemasource.com | |
Альтернативный идентификатор №6 | тт0083658 |
Тип: IMDB. Отношение: IsSameAs. | |
Альтернативный идентификатор № 7 | E0087486000 |
Тип: Собственный домен: spe.sony.com/MPM | |
Альтернативный идентификатор № 8 | 3929 |
Тип: Собственный домен: spe.sony.com/ProductID | |
Альтернативный идентификатор № 9 | 2002029 |
Тип: Собственный домен: warnerbros.com/MPM | |
Альтернативный идентификатор № 10 | 389785 |
Тип: Собственный домен veronicamagazine.nl | |
Альтернативный идентификатор № 11 | B001EC2J1G |
Тип: Собственный домен: amazon.com | |
Альтернативный идентификатор № 12 | 150002645 |
Тип: Собственный домен: bfi.org.uk |
Альтернативные идентификаторы делятся на непатентованные и проприетарные. Первые имеют выделенные предопределенные типы (например, выданные ISAN, IMDb и IVA), тогда как все проприетарные идентификаторы относятся к типу «Собственные» и дополнительно различаются связанным доменом DNS. По состоянию на июль 2017 года через EIDR напрямую доступно более 2 миллионов альтернативных идентификаторов.
Отношения между объектами [ править ]
Объекты контента могут быть связаны друг с другом согласно следующей таблице. Эти отношения выражаются как дополнительные поля в записи контента и, таким образом, относятся к этому объекту. Обратите внимание, что объект-субъект является дочерним, а целевой — родительским (например, субъект <тип-отношения>Of родительский). Дополнительные ограничения указаны в таблице.
Отношения наследования : объект, на котором существует связь, может наследовать основные поля метаданных от объекта, на который ссылается связь. Для объекта может существовать только одно отношение наследования. Эти отношения создают древовидную структуру, основанную на идентификаторе EIDR для абстракции. | |
isSeasonOf | Группа эпизодов сериала, выпущенных в течение непрерывного промежутка времени (например, года трансляции), например 10.5240/AB95-8734-5D98-A282-2DF0-C («Сезон 9»), представляет собой сезон 10.5240/C272-DA64-E2B5-0A78. -2AC3-Z («Секретные материалы») |
isEpisodeOf | например, 10.5240/E008-224D-0397-0560-6300-8 («Солнечные дни») — это эпизод 10.5240/AB95-8734-5D98-A282-2DF0-C («9-й сезон»). |
isEditOf | Экземпляр названия с уникальными характеристиками, которые отличают его от любой другой версии. Например, 10.5240/7290-C8AD-12BA-4F93-3B07-7 («Бегущий по лезвию: Режиссерская версия») является редакцией 10.5240/EA73-79D7-1B2B-B378-3A73-M. |
isManifestationOf | Манифестация — это более конкретный экземпляр произведения, который можно продавать, передавать, передавать или воспроизводить. Родителем проявления должно быть редактирование. Например, 10.5240/9CE1-DE39-5F3E-073D-4307-7 — это ультрафиолетовый стандарт CFF (стандартное разрешение, английский звук и субтитры) для «Бегущего по лезвию: Режиссерская версия». Это проявление абстрактной работы 10.5240/EA73-79D7-1B2B-B378-3A73-M . |
isClipOf | Один (и только один) непрерывный фрагмент актива. |
Отношения зависимости : объекты, на которые ссылается связь, имеют сильное влияние на основную природу объекта, на котором существует связь. Это означает, что объекты, указанные в отношении, должны учитываться при проверке дубликатов при создании или изменении объекта. Эти отношения создают ориентированные графы внутри деревьев и между ними. | |
isCompositeOf | Одно произведение, состоящее из частей нескольких других записей. |
isCompilationOf | Собрание множества целых произведений, которое более точно не поддается описанию. |
Легкие отношения : Наследственности нет; объекты, на которые они ссылаются, не влияют на основную природу объекта, к которому относятся отношения. Эти отношения используются в основном при перемещении по дереву объектов и соединении деревьев объектов друг с другом, создавая ориентированный граф элементов этих деревьев. | |
isPackagingOf | Для создания коллекции активов, выпущенных вместе, например 10.5240/F219-975E-5990-4570-BA75-2 («Ханна Монтана и Майли...») — это упаковка 10.5240/9ABE-2BF1-ACE7-EBA2-8E57. -Н . |
isPromotionOf | Рекламные объекты, такие как трейлер. |
isSupplementTo | Вспомогательный материал, который можно найти на DVD, например, отрывок или закулисный фильм. |
isAlternateContentFor | Контент, синхронизированный с основным ресурсом, например звук или альтернативный ракурс камеры. |
Использование в стандартах и приложениях [ править ]
EIDR включен во многие стандарты. Некоторые из наиболее важных из них перечислены здесь:
- SMPTE /AMWA : Рекомендуемая практика SMPTE RP 2079. [4] стандартизирует использование EIDR в медиаконтейнерах MXF , лежащих в основе профессиональных рабочих процессов с контентом, включая AMWA AS-03. [5] и АС-11 [6] спецификации. Рекомендуемая практика SMTPE 2021-5 [7] позволяет передавать идентификатор EIDR везде, где BXF используется для обмена данными между системами вещания.
- Европейский вещательный союз (EBU) : EBUCore [8] — это общий базовый набор описательных и технических метаданных, описывающих медиаресурсы (аудио, видео, неподвижные изображения, субтитры и т. д.). Сотрудники EBU и EIDR создали сопоставление EBUCore для базовых записей с корневыми объектами EIDR: ... EIDR и EBU работают вместе в рабочей группе SMPTE Core над определением описательных метаданных для спецификаций и рабочих процессов на основе SMPTE. EIDR — один из стандартов, поддерживаемых ядром EBU.
- DVB : EIDR упоминается в проектах спецификаций DVB для сопутствующих экранов. [9] (тм-см-css-0017r14).
- MPEG : EIDR был предложен в качестве идентификатора контента в формате приложения для сохранения мультимедиа. [10] это определяется для использования в архивах.
- CableLabs (США) : EIDR является частью метаданных CableLabs. [11] стандарт для распространения видео по запросу. EIDR — это один идентификатор программы, который может присутствовать в SCTE-35 2013 г. [12] дескриптор сегментации, стандарт, используемый при распределении IP по кабелю. EIDR также используется в продуктах динамической вставки рекламы (DAI) с использованием SCTE 130. [13] стандартная архитектура.
- EIDR и альтернативные идентификаторы . Чтобы обеспечить совместимость EIDR с широким спектром систем, EIDR включает поле «AlternateID» для перекрестных ссылок на существующие системы идентификаторов. Альтернативные идентификаторы могут включать, например, CRID (RFC 4078), ISAN, ISRC, UPC или URI , а также коммерческие системы идентификации, такие как Ad-ID , Baseline, IMDb и т. д. В настоящее время около половины записей EIDR содержат идентификатор. по крайней мере из еще одной системы.
- Сопоставление других стандартных метаданных и идентификаторов с EIDR . Другие системы метаданных и идентификаторов могут быть напрямую сопоставлены с EIDR:
- EN 15907 и EN 15744 : Эти стандарты находятся под эгидой Европейского комитета по стандартизации CEN/TC 372 и сайта Filmstandards.org. [14] Лучшие практики и сопоставления доступны для корневых объектов EN 15907 и EN 15744. EIDR также работает с киноархивами, чтобы расширить совместимость с этими стандартами до более детального уровня, включая проект с Британским институтом кино (BFI) по регистрации их записей на основе EN 15907 в EIDR.
- Международный стандартный аудиовизуальный номер (ISAN) : ISAN широко используется в системах управления правами и сбора данных. Доступно полное сопоставление регистрации ISAN с регистрацией EIDR. Британское агентство регистрации аудиовизуальных данных, совместное предприятие EIDR и ISAN-UK, предоставляет услуги совместной регистрации для обоих идентификаторов. Предшественники этой службы использовались для получения идентификаторов EIDR и ISAN для вещательного контента от ITV (коммерческой телесети в Соединенном Королевстве).
Идентификаторы EIDR находят свое применение во все большем количестве коммерческих приложений. Ниже приведены некоторые преимущества использования EIDR:
- Интеграция Warner Brothers-Xbox : EIDR использовался для улучшения реализации системы электронных продаж (EST) для доставки игр Warner Theatrical клиентам Microsoft Xbox Live . Для работы электронного магазина необходимо, чтобы несколько групп внутри Warner Brothers координировали свою деятельность с командой Xbox. Исходящая часть цепочки распространения включала публикацию «Аваилов» (названий, доступных для продажи) и отслеживание выполнения заказов; входящая сторона включала размещение заказов. Другие функции, такие как отчеты, охватывали обе стороны цепочки сбыта. Первоначальная система требовала ручного вмешательства и контроля, особенно на границах между организациями. Примером необходимости ручной обработки может быть проверка того, что была доставлена правильная версия ресурса (которая может различаться в зависимости от субтитров или контента). В новой системе Warner Brothers создала новый идентификатор EIDR для каждого варианта контента, который использовался на всех последующих этапах обработки. Это устранило двусмысленность и облегчило автоматизацию входящих и исходящих этапов. Еще одним преимуществом стала возможность создания отчетов «на лету».
- Интеграция Swisscom EPG : Swisscom предоставляет услугу платного телевидения в Швейцарии. В 2014 году компания завершила внедрение электронного руководства по программированию (EPG) для своих клиентов на основе EIDR. [15] Это сквозная система, в которой идентификаторы EIDR используются для представления активов, отображаемых в EPG. Ключевым элементом системы было то, что идентификаторы EIDR также использовались в метаданных справочника, предоставленных Swisscom сайтом media-press.tv. Это включало создание системы присвоения идентификаторов EIDR активам, которых еще не было в реестре. Ключевым преимуществом использования EIDR является отсутствие необходимости преобразования между различными системами идентификаторов.
Оперативное и административное управление [ править ]
EIDR находится в ведении некоммерческой ассоциации EIDR, основанной в октябре 2010 года компаниями MovieLabs , CableLabs , Comcast и Rovi . С тех пор членство неуклонно росло: по состоянию на конец 2014 года в нем насчитывалось 79 членов, разделенных на уровни «Спонсоры отрасли» и «Вкладчики отрасли». Самой быстрорастущей категорией являются неамериканские компании, на долю которых сейчас приходится около 20% членов.Ассоциация EIDR управляет двумя реестрами EIDR: Production и Sandbox. Первый является официальным сайтом, а второй зарезервирован для тестирования и разработки. Обе системы доступны публично в Интернете, но содержимое «песочницы» не гарантировано является правильным, полным и даже не относится к существующим активам. Только члены ассоциации EIDR могут вносить изменения в реестр.
Регистрация [ править ]
Регистрация новых активов может осуществляться индивидуально или массово (до 100 000 активов одновременно). В любом случае рабочий процесс включает в себя комбинацию автоматизированных (для выполнения четко определенных, но утомительных задач) и ручных (где требуется человеческое суждение) процессов. Он также является итеративным, поскольку первоначальный процесс сопоставления может выявить множество пробелов и ошибок, которые необходимо устранить.
Регистрация новых активов — сложный процесс, требующий некоторой подготовки, особенно в случае массовой подачи. Автоматизированные процессы проверят синтаксис, проверят наличие основных метаданных и соблюдение любых зависимостей (например, записей сериалов, созданных перед составляющими эпизодами). Действия вручную включают проверку того, что с активом связаны правильные Стороны. Одним из наиболее важных шагов является обеспечение того, чтобы новый актив еще не существовал в реестре: это описано в следующем разделе.
Чтобы зарегистрировать новый актив, пользователь должен быть связан со стороной, которой оператор EIDR предоставил роль «Регистрант». Лицом, подавшим заявку на регистрацию, может быть основной агент, например студия или кодирующая компания, но это также может быть Сторона, выполняющая массовую регистрацию объектов бэк-каталога, или Сторона, действующая от имени кого-либо другого. Также требуется, чтобы регистрант был членом EIDR. В целом право собственности на контент, полномочия метаданных и возможность регистрации — это отдельные и несвязанные понятия.
Дедупликация [ править ]
Это относится к пометке активов, передаваемых в реестр, как относящихся к одной из следующих трех категорий:
- Актив-кандидат уникален (по отношению к существующим активам реестра).
- Актив-кандидат является дубликатом существующей записи.
- Актив-кандидат имеет высокую вероятность оказаться дубликатом.
Эта оценка основана на применении (большого) набора правил к активу-кандидату, в результате чего выставляется числовая оценка. Группирование происходит в результате сравнения оценки с двумя пороговыми значениями:
- Низкий порог : любой ресурс с оценкой ниже этого значения не считается дубликатом. Это единственный случай, когда предлагаемое добавление или изменение записи будет успешным.
- Высокий порог : любой ресурс с оценкой выше этого значения считается (почти наверняка) дубликатом. Предложенное добавление/изменение записи не будет продолжено, и будет возвращен статус ошибки. Зарегистрированные лица обычно используют уже существующий идентификатор элемента, который они пытались зарегистрировать, и могут добавлять недостающую информацию и альтернативные идентификаторы к существующей записи.
Считается, что активы, находящиеся между нижним и верхним порогом, имеют высокую вероятность дублирования: предлагаемое добавление/изменение записи не будет продолжено до тех пор, пока оно не будет проверено вручную оперативным персоналом EIDR.
Архитектура [ править ]
Компоненты системы EIDR показаны ниже.
Основные функциональные блоки следующие:
- Основной реестр : этот модуль представляет собой настройку и настройку репозитория цифровых объектов CNRI. Он выполняет различные функции, включая регистрацию, генерацию уникальных идентификаторов, индексацию, управление хранилищем объектов и контроль доступа.
- Репозиторий : хранит и обеспечивает доступ к зарегистрированным объектам; для EIDR эти объекты представляют собой коллекции метаданных, а не сами медиа-активы. Метаданные включают стандартную информацию об объекте, взаимоотношениях и настройках контроля доступа.
- REST AP I: интерфейс REST , обеспечивающий доступ ко всему набору неадминистративных функций реестра. Службы могут выполнять индивидуальные или пакетные вызовы, которые могут отправляться синхронно или асинхронно. Общий синтаксис запроса позволяет извлекать (а в некоторых случаях и изменять) записи реестра, удовлетворяющие набору критериев, заданных вызывающей стороной.
- EIDR SDK : предоставляется разработчикам для облегчения создания сторонних приложений (обычно для поддержки B2B или внутреннего рабочего процесса). Он включает в себя Java SDK, .NET SDK и примеры программ, созданных на основе этих двух SDK. Использование SDK рекомендуется вместо прямых вызовов REST API.
- Инструменты командной строки : это простые приложения Java и .NET, созданные на основе SDK, каждое из которых предоставляет одну функцию, такую как разрешение, запрос, сопоставление и регистрация.
- Веб-интерфейс пользователя : веб-интерфейс пользователя, предназначенный главным образом для поиска, поиска и просмотра иерархии объектов. Он также поддерживает простую регистрацию.
- DOI Proxy : используя префикс дескриптора, он перенаправляет запросы разрешения EIDR DOI в реестр EIDR.
- Система обработки : предоставляет службы распределенного поиска и разрешения.
Связь с DOI и системой дескрипторов [ править ]
Идентификатор EIDR — это специализированный пример идентификатора цифрового объекта (DOI), который, в свою очередь, построен на основе системы дескрипторов, разработанной Корпорацией национальных исследовательских инициатив (CNRI). Специфические для EIDR аспекты нижних уровней описаны более подробно ниже.
Идентификатор цифрового объекта (аспекты EIDR) [ править ]
Цифровой идентификатор объекта, стандартизированный как ISO 26324, [16] стремится однозначно идентифицировать широкий спектр цифровых артефактов, включая книги, записи, данные исследований и другой цифровой контент. Цель состоит не только в том, чтобы идентификаторы были уникальными, но и постоянными и неизменяемыми. В отличие от URL-адресов, идентификаторы DOI остаются неизменными, даже если объекты перемещаются в другое место или переходят в собственность другой организации. Вот некоторые характеристики DOI:
- Международный фонд DOI (IDF) обеспечивает соблюдение ранее согласованных правил в отношении входящих в его состав регистрационных агентств (например, EIDR) для обеспечения преемственности. В частности, если RA прекращает работу, имена, которые он размещает, будут переданы другому RA.
- IDF определяет правила, которым должны соответствовать все имена DOI (какие типы объектов могут быть названы конкретным RA).
- Система DOI предоставляет модель данных, основанную на словаре данных, для обеспечения структурированных средств выражения метаданных (и межобъектных отношений).
- Система DOI имеет собственный высокоизбыточный и распределенный набор дескрипторов и прокси-серверов.
- Все префиксы DOI имеют форму «10.NNNN», где 10 — это индикатор каталога, а «NNNN» — это код регистранта в диапазоне 1–65535 (например, использование записей контента EIDR — 10.5240).
Модель данных DOI предоставляет средства для связывания метаданных с каждым объектом, а также политики, регулирующие их использование. По словам Справочника DOI, метаданные могут включать «имена, идентификаторы, описания, типы, классификации, местоположения, время, измерения, отношения и любой другой вид информации, связанной с [объектом]». Метаданные передаются между следующими объектами:
- Поставщик ресурсов : обычно владелец медиа-ресурса, который отвечает за ввод метаданных в систему.
- Регистрационное агентство : организации, которые служат хранилищем активов (и связанных с ними метаданных). Как уже отмечалось, DOI поддерживает объединение независимых RA, каждый из которых отвечает за набор активов. EIDR является одним из таких RA. Другие включают CrossRef для научных статей, DataCite для данных исследований и OPOCE для официальных публикаций Европейского Союза.
- Пользователь службы : субъекты, делающие запросы к RA, получают метаданные, связанные с активами. Структура разрешения DOI отвечает за отправку запроса соответствующему RA (пользователю службы это не обязательно знать).
Для обеспечения совместимости между RA в DOI существует концепция ядра метаданных. Это основной набор метаданных, который должны иметь все объекты, хранящиеся в структуре DOI. Полный набор можно найти в справочнике DOI. Функциональная совместимость — это большая тема, выходящая за рамки EIDR, но следующая подгруппа особенно актуальна для активов EIDR:
- референт : объект, поддерживаемый в системе DOI.
- referenceName : имя референта (например, название фильма)
- PrimaryReferentType : для EIDR это включает в себя создание (например, развлекательные активы) и сторону (например, их создателя).
- структурный тип : это взаимоисключающие категории, определяющие форму актива. Двумя особенно важными для EIDR активами являются абстракция (объект, такой как фильм, который может существовать в нескольких формах) и производительность (конкретный экземпляр объекта, например, режиссерская версия).
- PrincipalAgent : для творений — сущность, основная ответственность за их существование.
- RegistrationAuthorityCode : обозначает агентство, выдавшее DOI. Это будет EIDR RA для активов EIDR.
Метаданные EIDR доступны в стандартном формате метаданных ядра DOI, а также в форматах, специфичных для EIDR. DOI для схемы метаданных DOI: дои : 10.1000/276 .
Система обработки (аспекты EIDR) [ править ]
DOI, в свою очередь, реализуется поверх Handle System — распределенной, хорошо масштабируемой службы разрешения имен. Дескриптор определяется как:
- <дескриптор> ::= <дескриптор полномочий по именованию> "/" <дескриптор локального имени>
Орган именования является глобально уникальным и определяет как административное пространство, так и синтаксис дескриптора локального имени. Для EIDR в приведенном выше определении «10.5240» — это орган именования EIDR, который отвечает за разрешение суффикса (в том числе за его соответствие ожидаемому синтаксису для актива EIDR). Диапазон допустимых органов именования более общий, чем тот, который используется DOI (или EIDR).
Распределенный характер Handle System позволяет размещать каждое локальное пространство имен на нескольких географически распределенных сервисных сайтах. Это федеративная модель, в которой каждое локальное пространство имен имеет полный контроль над размещением и работой своих сайтов обслуживания. Более того, каждый сайт службы может содержать несколько серверов разрешения: запросы, направленные на конкретный сайт службы, будут распределяться равномерно по входящим в него серверам.
Модель данных Handle System проста, но гибка. С каждым дескриптором может быть связано произвольное количество значений. Со временем эти ценности могут создаваться, изменяться и уничтожаться. Каждая такая база данных имеет следующие атрибуты:
- индекс : целое число без знака, которое идентифицирует значение данных среди других, которые могут существовать для этого дескриптора.
- type : строка UTF-8, идентифицирующая тип. Система типов является расширяемой, и общие типы сохраняются как дескрипторы в органе именования «0.TYPE». Ограничений на создание новых типов нет, однако рекомендуется использовать разрешимые дескрипторы в качестве имен типов. Общие типы включают URL-адрес для одного косвенного обращения, «10320/loc» для набора альтернатив разрешения на основе контекста и различные административные типы для управления системой дескрипторов, все из которых основаны на разрешении дескрипторов.
- данные : само значение, представленное как последовательность октетов, которые интерпретируются в контексте связанного типа.
- разрешение : права доступа к этому конкретному значению. Обратите внимание, что разные значения данных дескриптора могут иметь разные разрешения.
- TTL : целое число, указывающее, как долго значение может кэшироваться.
- временная метка : целое число (выраженное в миллисекундах эпохи Unix), которое записывает время последнего обновления значения.
- ссылка : список ссылок на другие значения дескрипторов. Обычно они используются для добавления учетных данных (например, цифровой подписи).
Доступ к системе управления осуществляется через проводной протокол, определенный в RFC 3652; Приложениям EIDR не нужно беспокоиться об этом из-за многоуровневого уровня протоколов.
См. также [ править ]
Дальнейшее чтение [ править ]
- Р. Крун, Р. Дрюри, А. Ли, С. МакКонначи. «Идентификация контента аудиовизуальных архивов». Журнал Международной ассоциации звуковых и аудиовизуальных архивов, лето 2015 г. (№ 45).
- Р. Кроон. «Наведение порядка в цифровых идентификаторах». Журнал СМИ и развлечений, зима 2014–2015 гг.: 148–150.
- Р. Дрюри, Д. Дульчинос. «Трансформация развлечений с помощью технологий». Журнал СМИ и развлечений, зима 2013–2014 гг.: 81–88.
- Д. Агранов, В. Мишель, Т. Вакаи. «Упрощенная интеграция и управление метаданными контента с использованием реестра идентификаторов развлечений (EIDR)». SCTE Cable-Tec Expo 2012.
Внешние ссылки [ править ]
Ссылки [ править ]
- ^ «Комикс о Бэтмене принес 1,075 миллиона долларов и переписывает рекорд » Рейтер . 26 февраля 2010 г. Проверено 18 августа 2023 г.
- ^ ISO/IEC 7064:2003 : Информационные технологии. Методы обеспечения безопасности. Системы проверки символов. 2002 г.
- ^ Схема W3C XML, часть 2: Типы данных, второе издание
- ^ СМПТЕ РП 2079 . Имя DOI и представление идентификатора EIDR.
- ^ Спецификация доставки программы Advanced Media Workflow Association AS-03 MXF .
- ^ Ассоциация Advanced Media Workflow AS-11 MFX для спецификации вклада .
- ^ СМПТЭ РП 2021-5:2013 . Использование Ad-ID и EIDR в качестве альтернативных идентификаторов в SMPTE BXF и ATSC PMCP.
- ^ ЭБУ ТЕХ 3293 . НАБОР БОДОВЫХ МЕТАДАННЫХ EBU Версия 1.5.
- ^ Документ DVB A167-2 . Цифровое видеовещание (DVB);Сопутствующие экраны и потоки; Часть 2: Идентификация контента и синхронизация мультимедиа, июль 2014 г. с. 52.
- ^ ISO/IEC CD 23000-15 . Информационные технологии. Формат мультимедийных приложений (MPEG-A). Часть 15. Формат приложений для сохранения мультимедиа.
- ^ MD-SP-AMIv3.0-I02-121210. Архивировано 2 апреля 2015 г. в Wayback Machine . Спецификация интерфейса управления активами CableLabs 3.0.
- ^ ANSI/SCTE 35 2013 . Сигнальное сообщение о вставке цифровой программы для кабеля.
- ^ SCTE 130-10 2013 . Вставка цифровых программ – интерфейсы рекламных систем, часть 10.
- ^ Справочник семинаров TC 372 . Как появились EN 15744 и EN 15907.
- ^ Пресс-релиз . Swisscom завершает первое в Европе внедрение реестра Entertainment ID с помощью media-press.tv.
- ^ ISO 26324:2012 : Информация и документация. Система идентификаторов цифровых объектов, 2012.