Jump to content

Венецианская машина времени

Венецианская машина времени — это крупный международный проект, запущенный Федеральной политехнической школой Лозанны (EPFL) и Венецианским университетом Ка Фоскари в 2012 году. Целью проекта является создание совместной многомерной модели Венеции путем создания открытого цифрового архива культурной жизни города. наследие, охватывающее более 1000 лет эволюции. [ 1 ] Целью проекта является отслеживание циркуляции новостей, денег, коммерческих товаров, миграции, художественных и архитектурных моделей, среди прочего, для создания больших данных прошлого . [ 2 ] Его выполнение будет представлять собой самую большую базу данных венецианских документов, когда-либо созданную. [ 3 ] Проект является примером новой области научной деятельности, возникшей в эпоху цифровых технологий : цифровые гуманитарные науки .

Широкое признание критиков проекта привело к тому, что в апреле 2016 года в Европейскую комиссию было подано предложение европейского аналога . [ 4 ] Венецианская машина времени составляет технологическую основу предлагаемой европейской машины времени . [ 5 ]

Первая полная реконструкция Венеции, показывающая эволюцию города между 900 и 2000 годами, была показана на Венецианской биеннале архитектуры в 2018 году. [ 6 ] Модель Венецианской машины времени 1750 года также использовалась на выставке в Гран-Пале в Париже в сентябре 2018 года. [ 7 ]

Организация и финансирование

[ редактировать ]

Проект «Венецианская машина времени» был запущен EPFL и Венецианским университетом Ка Фоскари в 2012 году. Он включает в себя сотрудничество крупнейших венецианских родовых учреждений: Государственного архива Венеции, Библиотеки Марчианы , Института Венето и Фонда Чини . В настоящее время проект поддерживается Европейским проектом электронной инфраструктуры READ (Распознавание и обогащение архивных документов), проектом SNF Linked Books и проектом ANR-SNF GAWS . В международный совет входят известные ученые из Стэнфорда , Колумбии, Принстона и Оксфорда. В 2014 году Фонд Ломбард Одье присоединился к проекту «Венецианская машина времени» в качестве финансового партнера. [ 8 ]

Технологии и инструменты

[ редактировать ]

Государственные архивы Венеции содержат огромное количество рукописной документации на языках, развивавшихся от средневековья до 20 века. По оценкам, 80 км полок заполнены административными документами, созданными более тысячи лет назад: от свидетельств о рождении, свидетельств о смерти и налоговых деклараций до карт и проектов городского планирования. Эти документы часто очень деликатны и иногда находятся в хрупком состоянии сохранности. Разнообразие, количество и точность венецианских административных документов уникальны в западной истории. Объединив эту массу информации, можно реконструировать большие сегменты прошлого города: полные биографии, политическую динамику или даже внешний вид зданий и целых кварталов.

Сканирование

[ редактировать ]

Бумажные документы превращаются в цифровые изображения высокого разрешения с помощью сканирующих машин. Различные типы документов накладывают различные ограничения на тип используемых сканирующих устройств и на скорость сканирования документа. В сотрудничестве с промышленностью EPFL работает над полуавтоматическим роботизированным сканирующим устройством, способным оцифровывать около 1000 страниц в час. Будет построено несколько таких установок для создания эффективного конвейера оцифровки, адаптированного к древним документам. Другое решение, которое в настоящее время изучается в EPFL, предполагает сканирование книг вообще без перелистывания страниц. Этот метод использует рентгеновское синхротронное излучение, создаваемое ускорителем частиц . [ 9 ]

Транскрипция

[ редактировать ]

Графическая сложность и разнообразие рукописных документов делают транскрипцию сложной задачей. Для Венецианской машины времени ученые в настоящее время разрабатывают новые алгоритмы , которые могут преобразовывать изображения в вероятные слова. Изображения автоматически разбиваются на фрагменты изображений, которые потенциально представляют собой слова. Каждое фрагмент изображения сравнивается с другими фрагментами изображения и классифицируется в соответствии с формой слова, которое оно содержит. Каждый раз, когда расшифровывается новое слово, это позволяет распознать миллионы других слов в базе данных.

Обработка текста

[ редактировать ]

Затем строки вероятных слов преобразуются текстовым процессором в возможные предложения . Этот шаг выполняется с использованием, среди других инструментов, алгоритмов, основанных на анализе структуры белка, которые могут выявлять повторяющиеся закономерности.

Подключение данных

[ редактировать ]

Настоящее богатство венецианских архивов заключается в связности их документации. Несколько ключевых слов связывают различные типы документов, что делает данные доступными для поиска. Эти перекрестные ссылки на внушительные объемы данных организуют информацию в гигантские графики взаимосвязанных данных. Ключевые слова в предложениях связаны друг с другом в гигантские графики, что позволяет создавать перекрестные ссылки на огромные объемы данных, тем самым позволяя появляться новым аспектам информации.

Лаборатория цифровых гуманитарных наук EPFL объявила 1 марта 2016 года о разработке REPLICA , новой поисковой системы для изучения и расширения использования венецианского культурного наследия, которая будет доступна в сети к концу 2016 года. [ 10 ]

  • Междисциплинарность и интернационализм . Крупнейшие венецианские родовые институты, академические институты и профессора, представляющие разные дисциплины и разные институты со всего мира, сотрудничают для достижения этих коллективных усилий. На странице «Венецианской машины времени» описаны триста исследователей и студентов из разных дисциплин (естественные науки, инженерия, информатика, архитектура, история и история искусств), которые сотрудничали в этом проекте.
  • Развитие технологий . Программа сталкивается с множеством технических проблем, связанных с преобразованием уникального и обширного культурного наследия в цифровой архив. Массовая оцифровка требует не только систематического сканирования древних рукописей, но и автоматической обработки различных стилей рукописного письма, а также анализа латыни и некоторых других языков по мере их развития с течением времени. Исследователи из EPFL, работающие над проектом «Венецианская машина времени», например, представили методологию анализа языковых изменений, изучая архивы швейцарских газет за 200 лет. [ 11 ]
  • Демократизация знаний и культуры . Проект направлен на то, чтобы открыть знания и историю для более широкой аудитории через виртуальную базу данных, к которой может получить доступ каждый, тем самым укрепляя связь между учеными и широкой общественностью. Более того, цифровые гуманитарные науки, наоборот, направлены на снижение барьеров на пути предоставления и обмена знаниями и данными, позволяя более широкой общественности внести свой вклад в усилия по сбору данных. Элитная группа ученых и специалистов больше не должна быть единственной, кто может вносить и рассеивать культурные и исторические знания, и цифровые гуманитарные науки стремятся уменьшить это.
  • Перекошенная аудитория . Весь проект, а также связанное с ним развитие технологий, судя по всему, предназначен исключительно для западной аудитории. И Венецианская машина времени, и последующая Европейская машина времени сосредоточены на европейской истории, культуре и наследии. Пока ничего не было сделано для включения культурной истории большего числа регионов (хотя проект и цифровые гуманитарные науки все еще находятся на ранних стадиях), но все же это свидетельствует о том, что европейской истории уделяется больше внимания. [ нужна ссылка ]
  • Выбор контента . Ученые и исследователи, работающие над проектом, который разрабатывает наборы данных, по-прежнему имеют право выбирать информацию, представляемую аудитории, что противоречит цели инициативы по демократизации знаний. Участвующие ученые имеют право контролировать содержание и образовательную информацию венецианской базы данных.
  • Скрытая бизнес-возможность . Предыдущие подобные инициативы предполагают, что создание связи между учеными и широкой общественностью представляет собой бизнес-возможность для тех, кто контролирует такую ​​платформу данных. Например, Google Книги и Google Scholar помогли реализовать долгосрочную стратегию Google по изменению привычек пользователей искать книги как научного, так и популярного чтения и сделать цифровые технологии ключевым средством поиска знаний, информации и исторического прошлого. [ 12 ]
  • Этические проблемы, связанные с большими данными . Хотя собираемые данные в основном касаются населения, жившего в прошлом, тем не менее возникают те же этические проблемы, что и в случае с большими данными. Анонимность сбора данных не всегда гарантирована, например, «если шаблоны поведения человека достаточно уникальны, внешняя информация может быть использована для обратной связи данных с человеком». [ 13 ] поскольку технологии продолжают развиваться, нынешние процедуры анонимизации, вероятно, будут сокращаться По словам Джошуа Фэрфилда, . Исследователи могут обнаружить, что требование согласия от соответствующих семей является экономически неэффективным. [ 14 ]

Другие последствия

[ редактировать ]
  • Программа направлена ​​на разработку многочисленных инструментов и технологий, которые ставят под сомнение роль историков и гуманистов в целом. Алан Лю и Уильям Дж. Томас III идентифицируют себя в своей книге «Гуманитарные науки в эпоху цифровых технологий». [ 15 ] внести свой вклад в смену парадигмы, когда технологические инструменты становятся все более незаменимыми, и считают, что гуманитарии должны формировать долгосрочное цифровое будущее гуманитарных наук и, следовательно, должны проявлять инициативу, чтобы избежать создания для них цифровой инфраструктуры.

См. также

[ редактировать ]
  1. ^ «Коротко – ВТМ» .
  2. ^ Эбботт, Элисон (2017). «Машина времени», реконструирующая социальные сети древней Венеции» . Природа . 546 (7658): 341–344. Бибкод : 2017Natur.546..341A . дои : 10.1038/546341а . ПМИД   28617482 .
  3. ^ Каплан, Фредерик (2015). «Венецианская машина времени». Материалы симпозиума ACM по документальной инженерии 2015 года . п. 73. дои : 10.1145/2682571.2797071 . ISBN  9781450333078 . S2CID   7114931 .
  4. ^ Каплан, Фредерик (29 апреля 2016 г.). «Флагман Венецианской машины времени» . Европейская комиссия . Проверено 9 мая 2017 г.
  5. ^ Каплан, Фредерик (2015). «Венецианская машина времени». Материалы симпозиума ACM по документальной инженерии 2015 года . п. 73. дои : 10.1145/2682571.2797071 . ISBN  9781450333078 . S2CID   7114931 .
  6. ^ http://padiglioneevenezia.it/casi/venice-time-machine/ [ мертвая ссылка ]
  7. ^ «Ослепительная Венеция!» .
  8. ^ «Партнеры – ВТМ» .
  9. ^ Маргаритондо, Джорджио; Каплан, Фредерик; Ху, Юкуан; Печенини, Ева; Стампанони, Марко; Альбертин, Фаузия (2015). «Рентгеновская спектрометрия и визуализация древних административных рукописных документов» (PDF) . Рентгеновская спектрометрия . 44 (3): 93–98. Бибкод : 2015XRS....44...93A . дои : 10.1002/xrs.2581 . S2CID   93245100 .
  10. ^ «Реплика» . 22 июля 2019 г. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  11. ^ Каплан, Фредерик; Борнет, Сирил; Бантинкс, Винсент (2017). «Изучение лингвистических изменений в газетах за 200 лет посредством анализа устойчивых слов» . Границы цифровых гуманитарных наук . 4 : 2. дои : 10.3389/fdigh.2017.00002 .
  12. ^ Гардинер, Эйлин; Мусто, Рональд Г. (2015). Цифровые гуманитарные науки: учебник для студентов и ученых . Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. п. 149. ИСБН  978-1-107-01319-3 .
  13. ^ де Монжуа, Ив-Александр; Идальго, Сезар А.; Верлейсен, Мишель; Блондель, Винсент Д. (2013). «Уникальный в толпе: конфиденциальность человеческого передвижения» . Научные отчеты . 3 : 1376. Бибкод : 2013NatSR...3E1376D . дои : 10.1038/srep01376 . ПМК   3607247 . ПМИД   23524645 .
  14. ^ Фэрфилд, Джошуа; Штейн, Ханна (2014). «Большие данные, большие проблемы: новые проблемы этики науки о данных и журналистики». Журнал этики СМИ . 29 : 38–51. дои : 10.1080/08900523.2014.863126 . S2CID   145698329 .
  15. ^ Лю, Алан; Томас III, Уильям Г. (2012). «Гуманитарные науки в эпоху цифровых технологий» . Внутри высшего образования .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 259e21e9399be47b162cab03a7f0c1d5__1708109880
URL1:https://arc.ask3.ru/arc/aa/25/d5/259e21e9399be47b162cab03a7f0c1d5.html
Заголовок, (Title) документа по адресу, URL1:
Venice Time Machine - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)