Венецианская машина времени
Венецианская машина времени — это крупный международный проект, запущенный Федеральной политехнической школой Лозанны (EPFL) и Венецианским университетом Ка Фоскари в 2012 году. Целью проекта является создание совместной многомерной модели Венеции путем создания открытого цифрового архива культурной жизни города. наследие, охватывающее более 1000 лет эволюции. [ 1 ] Целью проекта является отслеживание циркуляции новостей, денег, коммерческих товаров, миграции, художественных и архитектурных моделей, среди прочего, для создания больших данных прошлого . [ 2 ] Его выполнение будет представлять собой самую большую базу данных венецианских документов, когда-либо созданную. [ 3 ] Проект является примером новой области научной деятельности, возникшей в эпоху цифровых технологий : цифровые гуманитарные науки .
Широкое признание критиков проекта привело к тому, что в апреле 2016 года в Европейскую комиссию было подано предложение европейского аналога . [ 4 ] Венецианская машина времени составляет технологическую основу предлагаемой европейской машины времени . [ 5 ]
Первая полная реконструкция Венеции, показывающая эволюцию города между 900 и 2000 годами, была показана на Венецианской биеннале архитектуры в 2018 году. [ 6 ] Модель Венецианской машины времени 1750 года также использовалась на выставке в Гран-Пале в Париже в сентябре 2018 года. [ 7 ]
Организация и финансирование
[ редактировать ]Проект «Венецианская машина времени» был запущен EPFL и Венецианским университетом Ка Фоскари в 2012 году. Он включает в себя сотрудничество крупнейших венецианских родовых учреждений: Государственного архива Венеции, Библиотеки Марчианы , Института Венето и Фонда Чини . В настоящее время проект поддерживается Европейским проектом электронной инфраструктуры READ (Распознавание и обогащение архивных документов), проектом SNF Linked Books и проектом ANR-SNF GAWS . В международный совет входят известные ученые из Стэнфорда , Колумбии, Принстона и Оксфорда. В 2014 году Фонд Ломбард Одье присоединился к проекту «Венецианская машина времени» в качестве финансового партнера. [ 8 ]
Технологии и инструменты
[ редактировать ]Государственные архивы Венеции содержат огромное количество рукописной документации на языках, развивавшихся от средневековья до 20 века. По оценкам, 80 км полок заполнены административными документами, созданными более тысячи лет назад: от свидетельств о рождении, свидетельств о смерти и налоговых деклараций до карт и проектов городского планирования. Эти документы часто очень деликатны и иногда находятся в хрупком состоянии сохранности. Разнообразие, количество и точность венецианских административных документов уникальны в западной истории. Объединив эту массу информации, можно реконструировать большие сегменты прошлого города: полные биографии, политическую динамику или даже внешний вид зданий и целых кварталов.
Сканирование
[ редактировать ]Бумажные документы превращаются в цифровые изображения высокого разрешения с помощью сканирующих машин. Различные типы документов накладывают различные ограничения на тип используемых сканирующих устройств и на скорость сканирования документа. В сотрудничестве с промышленностью EPFL работает над полуавтоматическим роботизированным сканирующим устройством, способным оцифровывать около 1000 страниц в час. Будет построено несколько таких установок для создания эффективного конвейера оцифровки, адаптированного к древним документам. Другое решение, которое в настоящее время изучается в EPFL, предполагает сканирование книг вообще без перелистывания страниц. Этот метод использует рентгеновское синхротронное излучение, создаваемое ускорителем частиц . [ 9 ]
Транскрипция
[ редактировать ]Графическая сложность и разнообразие рукописных документов делают транскрипцию сложной задачей. Для Венецианской машины времени ученые в настоящее время разрабатывают новые алгоритмы , которые могут преобразовывать изображения в вероятные слова. Изображения автоматически разбиваются на фрагменты изображений, которые потенциально представляют собой слова. Каждое фрагмент изображения сравнивается с другими фрагментами изображения и классифицируется в соответствии с формой слова, которое оно содержит. Каждый раз, когда расшифровывается новое слово, это позволяет распознать миллионы других слов в базе данных.
Обработка текста
[ редактировать ]Затем строки вероятных слов преобразуются текстовым процессором в возможные предложения . Этот шаг выполняется с использованием, среди других инструментов, алгоритмов, основанных на анализе структуры белка, которые могут выявлять повторяющиеся закономерности.
Подключение данных
[ редактировать ]Настоящее богатство венецианских архивов заключается в связности их документации. Несколько ключевых слов связывают различные типы документов, что делает данные доступными для поиска. Эти перекрестные ссылки на внушительные объемы данных организуют информацию в гигантские графики взаимосвязанных данных. Ключевые слова в предложениях связаны друг с другом в гигантские графики, что позволяет создавать перекрестные ссылки на огромные объемы данных, тем самым позволяя появляться новым аспектам информации.
Лаборатория цифровых гуманитарных наук EPFL объявила 1 марта 2016 года о разработке REPLICA , новой поисковой системы для изучения и расширения использования венецианского культурного наследия, которая будет доступна в сети к концу 2016 года. [ 10 ]
Прием
[ редактировать ]Хвалить
[ редактировать ]- Междисциплинарность и интернационализм . Крупнейшие венецианские родовые институты, академические институты и профессора, представляющие разные дисциплины и разные институты со всего мира, сотрудничают для достижения этих коллективных усилий. На странице «Венецианской машины времени» описаны триста исследователей и студентов из разных дисциплин (естественные науки, инженерия, информатика, архитектура, история и история искусств), которые сотрудничали в этом проекте.
- Развитие технологий . Программа сталкивается с множеством технических проблем, связанных с преобразованием уникального и обширного культурного наследия в цифровой архив. Массовая оцифровка требует не только систематического сканирования древних рукописей, но и автоматической обработки различных стилей рукописного письма, а также анализа латыни и некоторых других языков по мере их развития с течением времени. Исследователи из EPFL, работающие над проектом «Венецианская машина времени», например, представили методологию анализа языковых изменений, изучая архивы швейцарских газет за 200 лет. [ 11 ]
- Демократизация знаний и культуры . Проект направлен на то, чтобы открыть знания и историю для более широкой аудитории через виртуальную базу данных, к которой может получить доступ каждый, тем самым укрепляя связь между учеными и широкой общественностью. Более того, цифровые гуманитарные науки, наоборот, направлены на снижение барьеров на пути предоставления и обмена знаниями и данными, позволяя более широкой общественности внести свой вклад в усилия по сбору данных. Элитная группа ученых и специалистов больше не должна быть единственной, кто может вносить и рассеивать культурные и исторические знания, и цифровые гуманитарные науки стремятся уменьшить это.
Критика
[ редактировать ]- Перекошенная аудитория . Весь проект, а также связанное с ним развитие технологий, судя по всему, предназначен исключительно для западной аудитории. И Венецианская машина времени, и последующая Европейская машина времени сосредоточены на европейской истории, культуре и наследии. Пока ничего не было сделано для включения культурной истории большего числа регионов (хотя проект и цифровые гуманитарные науки все еще находятся на ранних стадиях), но все же это свидетельствует о том, что европейской истории уделяется больше внимания. [ нужна ссылка ]
- Выбор контента . Ученые и исследователи, работающие над проектом, который разрабатывает наборы данных, по-прежнему имеют право выбирать информацию, представляемую аудитории, что противоречит цели инициативы по демократизации знаний. Участвующие ученые имеют право контролировать содержание и образовательную информацию венецианской базы данных.
- Скрытая бизнес-возможность . Предыдущие подобные инициативы предполагают, что создание связи между учеными и широкой общественностью представляет собой бизнес-возможность для тех, кто контролирует такую платформу данных. Например, Google Книги и Google Scholar помогли реализовать долгосрочную стратегию Google по изменению привычек пользователей искать книги как научного, так и популярного чтения и сделать цифровые технологии ключевым средством поиска знаний, информации и исторического прошлого. [ 12 ]
- Этические проблемы, связанные с большими данными . Хотя собираемые данные в основном касаются населения, жившего в прошлом, тем не менее возникают те же этические проблемы, что и в случае с большими данными. Анонимность сбора данных не всегда гарантирована, например, «если шаблоны поведения человека достаточно уникальны, внешняя информация может быть использована для обратной связи данных с человеком». [ 13 ] поскольку технологии продолжают развиваться, нынешние процедуры анонимизации, вероятно, будут сокращаться По словам Джошуа Фэрфилда, . Исследователи могут обнаружить, что требование согласия от соответствующих семей является экономически неэффективным. [ 14 ]
Другие последствия
[ редактировать ]- Программа направлена на разработку многочисленных инструментов и технологий, которые ставят под сомнение роль историков и гуманистов в целом. Алан Лю и Уильям Дж. Томас III идентифицируют себя в своей книге «Гуманитарные науки в эпоху цифровых технологий». [ 15 ] внести свой вклад в смену парадигмы, когда технологические инструменты становятся все более незаменимыми, и считают, что гуманитарии должны формировать долгосрочное цифровое будущее гуманитарных наук и, следовательно, должны проявлять инициативу, чтобы избежать создания для них цифровой инфраструктуры.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Коротко – ВТМ» .
- ^ Эбботт, Элисон (2017). «Машина времени», реконструирующая социальные сети древней Венеции» . Природа . 546 (7658): 341–344. Бибкод : 2017Natur.546..341A . дои : 10.1038/546341а . ПМИД 28617482 .
- ^ Каплан, Фредерик (2015). «Венецианская машина времени». Материалы симпозиума ACM по документальной инженерии 2015 года . п. 73. дои : 10.1145/2682571.2797071 . ISBN 9781450333078 . S2CID 7114931 .
- ^ Каплан, Фредерик (29 апреля 2016 г.). «Флагман Венецианской машины времени» . Европейская комиссия . Проверено 9 мая 2017 г.
- ^ Каплан, Фредерик (2015). «Венецианская машина времени». Материалы симпозиума ACM по документальной инженерии 2015 года . п. 73. дои : 10.1145/2682571.2797071 . ISBN 9781450333078 . S2CID 7114931 .
- ^ http://padiglioneevenezia.it/casi/venice-time-machine/ [ мертвая ссылка ]
- ^ «Ослепительная Венеция!» .
- ^ «Партнеры – ВТМ» .
- ^ Маргаритондо, Джорджио; Каплан, Фредерик; Ху, Юкуан; Печенини, Ева; Стампанони, Марко; Альбертин, Фаузия (2015). «Рентгеновская спектрометрия и визуализация древних административных рукописных документов» (PDF) . Рентгеновская спектрометрия . 44 (3): 93–98. Бибкод : 2015XRS....44...93A . дои : 10.1002/xrs.2581 . S2CID 93245100 .
- ^ «Реплика» . 22 июля 2019 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Каплан, Фредерик; Борнет, Сирил; Бантинкс, Винсент (2017). «Изучение лингвистических изменений в газетах за 200 лет посредством анализа устойчивых слов» . Границы цифровых гуманитарных наук . 4 : 2. дои : 10.3389/fdigh.2017.00002 .
- ^ Гардинер, Эйлин; Мусто, Рональд Г. (2015). Цифровые гуманитарные науки: учебник для студентов и ученых . Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. п. 149. ИСБН 978-1-107-01319-3 .
- ^ де Монжуа, Ив-Александр; Идальго, Сезар А.; Верлейсен, Мишель; Блондель, Винсент Д. (2013). «Уникальный в толпе: конфиденциальность человеческого передвижения» . Научные отчеты . 3 : 1376. Бибкод : 2013NatSR...3E1376D . дои : 10.1038/srep01376 . ПМК 3607247 . ПМИД 23524645 .
- ^ Фэрфилд, Джошуа; Штейн, Ханна (2014). «Большие данные, большие проблемы: новые проблемы этики науки о данных и журналистики». Журнал этики СМИ . 29 : 38–51. дои : 10.1080/08900523.2014.863126 . S2CID 145698329 .
- ^ Лю, Алан; Томас III, Уильям Г. (2012). «Гуманитарные науки в эпоху цифровых технологий» . Внутри высшего образования .
Внешние ссылки
[ редактировать ]- Федеральная политехническая школа Лозанны
- Венецианский университет Ка Фоскари
- Большие данные
- Совместные проекты
- Совместное картографирование
- Документоориентированные базы данных
- Базы данных в Европе
- Проекты в Европе
- Цифровое сохранение
- Проекты, созданные в 2012 году
- 2012 заведения в Италии
- История Венеции
- Культура Венеции