Цель (проект)
Цель | |
---|---|
Расположение | Университет Гронингена, Нидерланды |
Учредил | январь 2009 г. |
Финансирование | Финансируется Европейским фондом регионального развития и партнерами. |
Веб-сайт | коврик |
Target — это название совместного исследовательского проекта, специализирующегося на обработке и управлении большими данными в северных Нидерландах. [ 1 ] Это государственно-частное сотрудничество, начатое в 2009 году и поддерживаемое государственными субсидиями. [ 2 ] Он управляется консорциумом из десяти партнеров из академической и компьютерной индустрии, координируемый Гронингенским университетом , и занимается исследованием управления данными научных проектов в области астрономии, наук о жизни, искусственного интеллекта и медицинской диагностики.
В проекте Target сотрудничают различные подразделения Гронингенского университета, его медицинский центр , IBM , Oracle , ASTRON и голландские ИТ-компании Elkoog/ Heeii и Nspyre.
Компьютерный центр Target расположен в Центре информационных технологий, вычислительном центре Гронингенского университета, и состоит из более чем 10 петабайт хранилища. [ 3 ] [ 4 ] на основе IBM GPFS технологии хранения данных , [ 5 ] кластер высокопроизводительных вычислений и грид-кластер , входящий в состав Европейской грид-инфраструктуры .

История
[ редактировать ]Проект был инициирован с целью передачи опыта астрономов в области массовой обработки данных в другие области науки. Target основывается на распределенной вычислительной среде под названием Astro-WISE. [ 6 ] [ 7 ] Сама система Astro-WISE возникла как инициатива рабочей группы по широкоугольной съемке OPTICON, которая была создана для рассмотрения стандартизированной европейской системы съемки для облегчения исследований, обработки и анализа данных с использованием данных нового поколения широкоугольных съемочных камер. [ 8 ] Проект Target стартовал в 2009 году после получения 32 миллионов евро. [ 9 ] финансирования сроком на пять лет со стороны Европейского фонда регионального развития , Министерства экономики Нидерландов (проект «Пикеен в дельте») и провинций Гронинген и Дренте. Проект реализуется под эгидой Альянса провинций Северных Нидерландов (SNN) и муниципалитета Гронингена.
Технологические находки
[ редактировать ]В начале проекта одной из целей была разработка единой интегрированной системы обработки, состоящей из файловой системы размером в несколько петабайт. [ 10 ] и несколько различных типов гридов и вычислительных кластеров. [ 11 ] В первые годы стало очевидно, что требования к различным дисциплинам электронной науки различны. В некоторых областях предпринимаются масштабные усилия по потоковой передаче данных, как, например, в Лофаре . В астрономии количество объектов данных может исчисляться миллиардами при ограниченном количестве столбцов данных. [ 12 ] В геномике количество строк невелико, но количество столбцов может быть огромным, исчисляемым сотнями тысяч. Другие области, такие как визуальный поиск текста в поисковой системе Monk для исторических рукописей, находятся на промежуточном положении с сотнями миллионов строк и тысячами измерений. Кроме того, приложения геномики часто требуют строгого контроля доступа, [ 13 ] тогда как другие дисциплины не имеют проблем с конфиденциальностью. Следовательно, различные подпроекты Target приняли прагматичный подход к тому, какие аспекты технологии WISE и компоненты аппаратной инфраструктуры Target применимы к их области.
Проекты
[ редактировать ]Target участвует в ряде научных проектов с интенсивным использованием данных в области астрономии, визуализации больших данных (сотрудничество с центром eScience в Амстердаме), [ 14 ] алгоритмы распознавания рукописного текста , медицинские исследования в области здорового старения, разработка инструментов диагностики болезни Паркинсона и многое другое.
Долгосрочный архив LOFAR
[ редактировать ]
Большая часть данных телескопа LOFAR хранится, доступна и архивируется в долгосрочном архиве LOFAR, разработанном ASTRON и Target. [ 15 ] [ 16 ] [ 17 ] Данные будут храниться в дата-центре Target и нескольких других европейских центрах.
Монах
[ редактировать ]
Монк — это система, разработанная Шомакером и его группой в Институте искусственного интеллекта (ALICE) Гронингенского университета . Он использует алгоритмы распознавания образов и машинного обучения для распознавания рукописного текста в различных существующих архивах. [ 18 ] [ 19 ] [ 20 ] В настоящее время в Monk загружен ряд книг из Национального архива Нидерландов, а также более 70 международных исторических коллекций, от западных, средневековых до рукописных китайских рукописей. Система применяет непрерывное («24/7») машинное обучение через Интернет, что дает фундаментальные результаты. [ нечеткий ] [ 21 ] Система MONK использует вычислительные ресурсы и ресурсы хранения данных Target. Недавно он стал частью сотрудничества, возглавляемого профессором Поповичем с факультета теологии и религиоведения Гронингенского университета , который будет использовать сочетание радиоуглеродного датирования, палеографии и методов распознавания текста/изображений, чтобы попытаться точно определить авторов. популярные рукописи свитков Мертвого моря . [ 22 ]
Линии жизни
[ редактировать ]LifeLines — это долгосрочный медицинский исследовательский проект, реализуемый Университетским медицинским центром Гронингена (UMCG) . Массив данных о генотипах и фенотипах будет собираться у 165 000 человек один раз в пять лет в течение общего периода в тридцать лет. Накопленные данные будут использоваться исследователями и медицинскими специалистами, чтобы получить представление о процессах, связанных со старением, и понять, почему возрастное ухудшение здоровья варьируется так широко. [ 23 ] Target предоставляет LifeLines инфраструктуру для хранения, доступа и обработки данных. Данные LifeLines, а также инфраструктуры SURFsara и Target использовались в проекте «Геном Нидерландов», реализуемом консорциумом UMCG , LUMC , Erasmus MC, UMCU , Свободного университета Амстердама . Результаты проекта с использованием полногеномного секвенирования для определения структуры популяции и демографической истории голландского населения были опубликованы в июне в журнале Nature Genetics . [ 24 ] [ 25 ]
ПРОБЛЕКИ
[ редактировать ]GLIMPS — это исследовательский проект , которым руководит К. Леендерс, профессор неврологии в UMCG . Целью проекта является поиск более быстрых и надежных инструментов диагностики болезни Паркинсона. [ 26 ] GLIMPS исследует возможности использования сложных алгоритмов на основе изображений и ПЭТ-сканирования для раннего выявления болезни Паркинсона. [ нужна ссылка ] Чтобы проверить эффективность таких алгоритмов, GLIMPS создает большую базу данных ПЭТ-сканирований, предоставленных многочисленными больницами в Нидерландах. Target отвечает за создание и поддержание базы данных GLIMPS, а также за обеспечение бесперебойной работы алгоритмов обработки изображений на своих вычислительных мощностях.
Другие
[ редактировать ]Кроме того, Target участвует в управлении данными для других астрономических проектов, таких как астрономическое исследование KiDs/VIKING. [ 27 ] [ 28 ] с помощью OmegaCAM, [ 29 ] [ 30 ] ESO МУЗА [ 31 ] прибор (установлен на Очень Большом Телескопе ) и MICADO (установлен на E-ELT ). Кроме того, ориентированный на данные подход к управлению данными, предложенный Target, был принят миссией ESA Euclid . [ 32 ] Дочерняя компания проекта Target Holding BV также управляет рядом коммерческих проектов с частным бизнесом на севере Нидерландов. [ 33 ]
Просветительская работа и просвещение общественности также входят в сферу компетенции проекта, и Target организовала множество общественных мероприятий. [ 34 ] 3D-кинотеатр «Инфоверсум» [ 35 ] [ 36 ] является побочным продуктом проекта Target и предоставляет средства для визуализации и объяснения научных данных для больших групп.
Ссылки
[ редактировать ]- ^ «Нидерландский проект может обработать и сохранить 1,5 петабайта» [Нидерландский проект может обработать и сохранить 1,5 петабайта]. nu.nl (на голландском языке). 2 сентября 2010 г.
- ^ Эдельман, Питер (2 июня 2009 г.). «Миллионы субсидий на программу интеллектуального анализа данных в Северных Нидерландах» . Биты и чипы.
- ^ Витольд, Кепински (19 ноября 2010 г.). «ИКТ-проект Гронингена готов к петабайтам данных». Вычислимый (на голландском языке).
- ^ Хейсман, Зандер (27 мая 2011 г.). «Apricus увеличивает мощность проекта Target» . Вычислимый (на голландском языке).
- ^ Тематические исследования IBM, демонстрация историй клиентов IBM. «Университет Гронингена открывает новые горизонты в научных исследованиях» . www-03.ibm.com/software/businesscasestudies/us/en/corp?OpenDocument&Site=corp&cty=en_us .
- ^ Бегеман, Кор; А.Н.Беликов; Д. Р. Боксхорн; Е.А.Валентайн (январь 2013 г.). «Информационная система, ориентированная на данные Astro-WISE». Экспериментальная астрономия . 35 (1–2): 1. arXiv : 1208.0447 . Бибкод : 2013ExA....35....1B . дои : 10.1007/s10686-012-9311-4 . S2CID 118620001 .
- ^ Мвебазе, Джонсон (2012). Экстремальное происхождение данных в специальной обработке астрономических данных (доктор философии). Университет Гронингена. ISBN 9789036757591 .
- ^ Гилмор, Джеральд (январь 2001 г.). «OPTICON: Оптическая инфракрасная координационная сеть ЕС для астрономии». Организации и стратегии в астрономии II . Библиотека астрофизики и космических наук. Том. 2. С. 83–102. arXiv : astro-ph/0105562 . Бибкод : 2001ASSL..266...83G . дои : 10.1007/978-94-010-0666-8_6 . ISBN 978-0-7923-7172-4 . S2CID 34032027 .
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Эдельман, Питер (20 июля 2009 г.). « Миллионы субсидий для программы майнинга данных в Северных Нидерландах». Биты и чипы (на голландском языке). п. 45.
- ^ Джайн, Р; Саркар, П.; Субхравети, Д. (2013), «GPFS-SNC: файловая система корпоративного кластера для больших данных», IBM Journal of Research and Development , 57 (3/4): 5:1, 5:10, doi : 10.1147/JRD .2013.2243531
- ^ Бегеман, Кор; Бегеман, КГ; Беликов А.Н.; Боксхорн, ДР; Дейкстра, Ф.; Валентин, Э.А.; Френд, WJ; Чжао, З. (2010), «Объединение сетевых технологий», Journal of Grid Computing , 8 (2): 199–221, doi : 10.1007/s10723-010-9147-y
- ^ Лури, X.; Палмер, М.; Ареноу, Ф.; Масана, Э.; Де Брейне, Дж.; Античе, Э.; Бабюзьо, К.; Боррачеро, Р.; Сарторетти, П.; Джулбе, Ф.; Исаси, Ю.; Мартинес, О.; Робин, AC; Рейле, К.; Джорди, К.; Карраско, Дж. М. (2014). «Обзор и звездная статистика ожидаемого Gaia Каталога с использованием Gaia генератора объектов ». Астрономия и астрофизика . 566 : А119. arXiv : 1404.5861 . Бибкод : 2014A&A...566A.119L . дои : 10.1051/0004-6361/201423636 . S2CID 119233012 .
- ^ Малин, Б.; Лукидес, Г.; Бенитес, К.; Клейтон, EW (2011). «Идентифицируемость в биобанках: модели, меры и стратегии смягчения последствий» . Генетика человека . 130 (3): 383–392. дои : 10.1007/s00439-011-1042-5 . ПМК 3621020 . ПМИД 21739176 .
- ^ «Проекты Центра электронных наук» . esciencecenter.nl .
- ^ Беликов А.Н.; Бегеман, К.; Боксхорн, ДР; Дейкстра, Ф.; Холтис, Х.; Мейер-Чжао, З.; Аренда, Джорджия; Валентин, Э.А.; Друг, У.Дж. (2011). «Информационная система ЛОФАР». Учеб. ADASS XXI, ASP Conf. Ряд . 461 : 693. arXiv : 1111.6443 . Бибкод : 2012ASPC..461..693B .
- ^ Бегеман, К.; Боксхорн, Д.; Дейкстра, Ф.; Холтис, штат Ха; Вриенд, В.-Ж (2011). «Цель для долгосрочного архива LOFAR: архитектура и реализация». Компьютерные системы будущего поколения . 27 (3): 319–328. дои : 10.1016/j.future.2010.08.010 .
- ^ Холтис, штат Ха; ван Дипен, Г.; и др. (2012). «Анализ данных в долгосрочном архиве LOFAR» . Серия конференций ASP . 461, Программное обеспечение и системы для анализа астрономических данных XXI: 536. Бибкод : 2012ASPC..461..635H .
- ^ ван дер Зант, Т; Шомейкер, LRB; Зингер, С.; ван Ши, Х. (2009). «Где поисковые системы для рукописных документов?». Междисциплинарные научные обзоры . 34 (2–3): 224–235. Бибкод : 2009ISRv...34..224В . дои : 10.1179/174327909X441126 . S2CID 57037481 .
- ^ ван дер Зант, Т; Шомейкер, LRB; Валентин, Э.; Б.А. Яникоглу; К. Беркнер (28 января 2008 г.). «Крупномасштабная параллельная обработка изображений документов». В Яникоглу - Беррин А; Беркнер, Кэтрин (ред.). Распознавание и поиск документов XV . Том. 6815. с. 68150Н. Бибкод : 2008SPIE.6815E..0SV . дои : 10.1117/12.765482 . S2CID 40083465 .
- ^ Шомейкер, LRB; Б.А. Яникоглу; К. Беркнер (28 января 2008 г.). «Словодобывающий анализ в редко маркированной рукописной коллекции». В Яникоглу, Беррин А.; Беркнер, Кэтрин (ред.). Распознавание и поиск документов XV . Том. 6815. стр. 6815–6823. Бибкод : 2008SPIE.6815E..0NS . дои : 10.1117/12.766329 . S2CID 15863576 . ван дер Зант, Т; Шомейкер, LRB; Хаак, К. (2008). «Определение рукописных слов с использованием биологических функций». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 30 (11): 1945–1957. дои : 10.1109/tpami.2008.144 . ПМИД 18787243 . S2CID 18702898 .
- ^ ван Остен, Ж.-П.; Шомейкер, LRB (2014). «Раздельность и прототипичность при поиске рукописных слов и изображений» (PDF) . Распознавание образов . 47 (3): 1031–1038. Бибкод : 2014PatRe..47.1031V . дои : 10.1016/j.patcog.2013.09.006 . hdl : 11370/ca3dd93d-fbd9-4ae3-bfac-90bb148ea1dd . S2CID 215715932 .
- ^ Новости РУГ (11 декабря 2014 г.). «Престижный стартовый грант ERC для Младена Поповича» . Университет Гронингена . Проверено 19 января 2015 г.
- ^ Столк, Рональд П.; Росмален Дж.Г.; Постма ДС; де Бур РА; Навис Г; Слаец Дж. П.; Ормель Дж; Вольффенбюттель Б.Х. (январь 2008 г.). «Универсальные факторы риска многофакторных заболеваний: LifeLines: популяционное исследование трех поколений» . Европейский журнал эпидемиологии . 23 (1): 67–74. дои : 10.1007/s10654-007-9204-4 . ПМИД 18075776 .
- ^ Франчиоли, Лоран; Менелау, Андроники; и др. (29 июня 2014 г.). «Вариации последовательности всего генома, структура населения и демографическая история голландского населения» . Природная генетика . 46 (8): 818–825. дои : 10.1038/ng.3021 . ПМИД 24974849 . S2CID 14316238 .
- ^ ван Вейнгаарден, Аренд (30 июня 2014 г.). «Геном голландского народа раскрыт» . Дагблад ван хет Ноорден.
- ^ Теуне, Лаура Клааске (2013). Паттерны метаболизма глюкозы при нейродегенеративных заболеваниях головного мозга (полностью внутренняя диссертация (DIV)). Кандидатская диссертация.
- ^ Янг, Джей Ти; Дж. Т. де Йонг; ГАВ Клейн; К. Х. Куйкен; Э.А. Валентина (2013). «Килоградусный обзор». Экспериментальная астрономия . 35 (1–2): 25–44. arXiv : 1206.1254 . Стартовый код : 2013ExA....35...25D . дои : 10.1007/s10686-012-9306-1 . S2CID 3082399 .
- ^ Нидерландская исследовательская школа астрономии (NOVA). «Годовой отчет NOVA за 2011–2011–2012 гг.» (PDF) . nova-астрономия . НОВАЯ ЗВЕЗДА.
- ^ Шиллинг, Говерт (8 июня 2011 г.). «Прямой успех встретился с суперкамерой» [Немедленный успех с суперкамерой]. Де Фолькскрант (на голландском языке).
- ^ «Суперрезкие фотографии неба с чилийской горы». NRC Handelsblad (на голландском языке). 9 июня 2011 г.
- ^ Вейльбахер, Питер; Питер М. Вейльбахер; Оле Штрейхер; Таня Уррутия; Орельен Ярно; Арлетт Пеконталь-Руссе; Роланд Бэкон; Петра Бём (сентябрь 2012 г.). «Дизайн и возможности программного обеспечения и конвейера сжатия данных MUSE». В Радзивилле Николь М; Кьоцци, Джанлука (ред.). Программное обеспечение и киберинфраструктура для астрономии II . Том. 8451. С. 84510Б. Бибкод : 2012SPIE.8451E..0BW . дои : 10.1117/12.925114 . S2CID 120263291 .
- ^ Пасиан, Фабио; Фабио Пасиан; Джон Хоар; Марк Соваж; Кристоф Дабен; Морис Понсе; Ориана Мансутти (сентябрь 2012 г.). «Научный наземный сегмент миссии ЕКА Евклид». В Радзивилле Николь М; Кьоцци, Джанлука (ред.). Программное обеспечение и киберинфраструктура для астрономии II . Том. 8451. с. 845104. Бибкод : 2012SPIE.8451E..04P . дои : 10.1117/12.926026 . S2CID 123008296 .
- ^ Хейсман, Зандер (31 января 2013 г.). «Целевой проект включает в себя четыре новые компании » . Вычислимый (на голландском языке).
- ^ Ветер, Майке (12 мая 2014 г.). «Отчет больших данных: мужчина с одной ногой и пятью детьми» [Отчет больших данных: мужчина с одной ногой и пятью детьми]. Dagblad van het Noorden (на голландском языке). п. 2.
- ^ Винд, Майке (19 июня 2014 г.). «Театр Инфоверсум, открытый для публики» [Театр Инфоверсум открывается для публики]. Гронингер Гезинсбоде (на голландском языке). п. 19.
- ^ «Инфоверсум» . Де Телеграаф (на голландском языке). 4 июля 2014 г.