Jump to content

Массовая оцифровка

Массовая оцифровка — это термин, используемый для описания «крупномасштабных проектов оцифровки различного масштаба». Такие проекты включают в себя усилия по оцифровке физических книг в массовом масштабе, чтобы сделать знания открытыми и общедоступными, и это становится возможным благодаря выбору объектов культуры, их подготовке, сканированию и созданию необходимой цифровой инфраструктуры, включая цифровые библиотеки . Эти проекты часто реализуются учреждениями культуры и частными организациями, однако отдельные лица также могут попытаться провести массовую оцифровку. Массовые попытки оцифровки происходят довольно часто; миллионы файлов (книги, фотографии, образцы цветов и т. д.) каждый день загружаются в крупные публичные или частные онлайн-архивы. Эта практика перевода физического в цифровое в массовой сфере меняет способ нашего взаимодействия со знаниями. Историю массовой оцифровки можно проследить еще в середине 1800-х годов с появлением микрофильмов и технических инфраструктур, таких как Интернет , фермы данных и хранение компьютерных данных делает эти усилия технологически возможными. Этот, казалось бы, простой процесс оцифровки физических знаний или даже продуктов имеет огромные последствия, которые можно изучить.

История инициатив массовой оцифровки

[ редактировать ]

Вымышленные соображения

[ редактировать ]

Возможно, одним из наиболее примечательных соображений массовой оцифровки в художественном смысле являются рассуждения о Вавилонской Хорхе Луиса Борхеса библиотеке . В этом рассказе Борхес описывает видение библиотеки, в которой были доступны все возможные варианты книг. [1] Хотя Борхес описывает практику сохранения и архивирования всех знаний в физическом пространстве (библиотеке), вымышленное видение Борхеса уже реализовано в цифровом смысле. Бесконечные копии онлайн-книг находятся в свободном доступе через интернет-архивы или библиотечные базы данных. Подобный рассказ на самом деле был довольно распространенным и умело передает идею о том, что «мечта и практика массовой оцифровки культурных произведений существуют уже десятилетия». [2]

Невымышленные соображения

[ редактировать ]

Некоторые из самых ранних программ оцифровки начались еще до эпохи Интернета и включают адаптацию таких технологий, как микрофильмы, в 19 веке. Технические возможности микрофильмов позволили ему стать важным средством сохранения и расширения библиотечных материалов, а также его особенностью «графически драматизировать масштабные вопросы». Микрофильм был также известен как микрофотография , разработанный в 1839 году, и его возможности демонстрируют (возможно, впервые) способность хранить большие объемы информации, в данном случае фотографий, на физически небольшом пространстве. Обсуждая возможности микрофильмов, наблюдатель заметил, что "все архивы страны могут быть уложены в табакерку". Такие заметки мастерски демонстрируют, как можно использовать техническую инфраструктуру микрофильмов для массового архивирования и хранения. Поль Отле , бельгийский писатель, которого часто считают одним из основателей информатики, в своей работе 1906 года «обрисовал преимущества микрофильмов как стабильного и долгосрочного формата исправления, который можно использовать для расширения охвата литературы». Sur une forme nouvelle du livre: le livre microphotographique». Его утверждение оказалось верным: Библиотека Конгресса в начале 20 века и другие организации использовали микрофильмы для «оцифровки» культурных объектов, таких как рукописи, книги, изображения и газеты.

Техническая инфраструктура

[ редактировать ]

Микрофильм

[ редактировать ]

Микрофильмы представляют собой сдвиг в инфраструктуре хранения данных: огромное количество изображений может храниться в физически небольшом пространстве, а затем расширяться для просмотра с помощью устройства для микрофильмирования. Микрофильмы в сочетании со средством просмотра микрофильмов использовались для оцифровки, сохранения и просмотра объектов в массовом масштабе. Интересно отметить, что перед использованием машины студентам требовалась помощь персонала; доступ к цифровым материалам сейчас — это быстрый и простой процесс, который можно выполнить самостоятельно. Более подробную информацию о микрофильмах можно найти на вкладке «Нехудожественные соображения» на этой странице.

Серверные фермы

[ редактировать ]

Еще одним крупным сдвигом в инфраструктуре хранения данных стало появление серверных ферм. Веб-сайты полагаются на фермы серверов для «масштабируемости, надежности и доступа к интернет-контенту с малой задержкой». По словам Бернса, [ автор не указан ] эти технологии необходимы при построении высокопроизводительной инфраструктуры доставки контента. Переход от микрофильмов к сложным фермам серверов с собственными схемами демонстрирует инфраструктурные требования, которые со временем возникают при массовой оцифровке. Здесь массовая цифровизация не только облегчается, но и существует в этом месте. [ нужны разъяснения ] Без ферм серверов невозможно было бы хранить данные или получать к ним доступ в необходимом масштабе для проектов массовой оцифровки. Однако важно отметить, что фермы серверов не действуют в одиночку при хранении данных. значительно помогают в хранении данных Другие веб-инфраструктуры, например жесткие диски персонального компьютера, . Инструменты и службы шифрования также помогают защитить и защитить данные в конфиденциальных или внутренних проектах массовой оцифровки.

Базы данных

[ редактировать ]

Базы данных часто рассматриваются как «дом» для различных массовых проектов по оцифровке. Базы данных, такие как Google Книги , позволяют просматривать всю коллекцию оцифрованных объектов. В случае с Google Книгами база данных позволяет пользователю искать, исследовать и просматривать примерно 40 миллионов наименований, что соответствует примерно 30 % от предполагаемого количества всех когда-либо опубликованных книг, которые команда Google отсканировала и загрузила . существуют в таких базах данных; руки сканера можно случайно отсканировать и выложить, в отличие от самой страницы книги. Подобные ошибки в общедоступных и зачастую постоянных базах данных ставят под сомнение эффективность человеческих усилий в проектах массовой оцифровки.

Другие базы данных позволяют исследователям со всего мира загружать или просматривать данные для научных исследований. В этом случае необработанные данные научных экспериментов, анонимизированные в целях конфиденциальности участников, загружаются и хранятся в массовом масштабе. Ярким примером таких баз данных для исследовательских целей является база данных системы обмена данными о детском языке ( CHILDES ). В этой базе данных хранятся необработанные данные для изучения языка, а также видео, аудио, стенограммы и обезличенная информация об участниках. Базы данных, в которых хранятся опубликованные исследовательские статьи, также существуют и включают такие сайты, как PubMed , ScienceDirect , JSTOR и EBSCO .

Базы данных в сочетании с фермами серверов и другими веб-инфраструктурами обеспечивают решающее сотрудничество в научной сфере. Здесь массовая оцифровка расширилась от оцифровки физических объектов (таких как книги) до оцифровки взаимодействий для научных исследований.

Подразумеваемое

[ редактировать ]
  1. ^ Борхес, Хорхе Луис (2001). Прологи к Вавилонской библиотеке. Мадрид: Редакционный альянс. ISBN   84-206-3875-7 . OCLC   57893246 .
  2. ^ Тилструп, Нанна Бонде (2019). Политика массовой цифровизации . Кембридж. ISBN  978-0-262-35005-1 . OCLC   1078691226 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  • Ауэрбах, Дж.; Гительман, Л. (13 июня 2007 г.). «Микрофильм, сдерживание и холодная война». Американская литературная история . 19 (3): 745–768. дои : 10.1093/alh/ajm022 . ISSN   0896-7148
  • Лютер, Фредерик. Микрофильм: История, 1839–1900. Аннаполис, Мэриленд: Национальная ассоциация микрофильмов, 1959.
  • Гольдшмидт и Отлет П. (1906). О новой форме книги: микрофотокниге . [Международный институт библиографии].
  • Ла Худ, Чарльз Г. «Микрофильм для Библиотеки Конгресса». Колледжские и исследовательские библиотеки 34.4 (1973): 291–294.
  • Дункан, Вирджиния Л. и Фрэнсис Э. Парсонс. «Использование микрофильмов в промышленной исследовательской библиотеке». Spec Libr 61.6 (1970): 288–290.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 26664ee094737a1879c8f961110b1167__1709460480
URL1:https://arc.ask3.ru/arc/aa/26/67/26664ee094737a1879c8f961110b1167.html
Заголовок, (Title) документа по адресу, URL1:
Mass digitization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)