Биомедицинские данные
Биомедицинские данные — это междисциплинарная область, которая использует большие объемы данных для продвижения биомедицинских инноваций и открытий. Биомедицинская наука о данных опирается на различные области, включая биостатистику , биомедицинскую информатику и машинное обучение , с целью понимания биологических и медицинских данных. Его можно рассматривать как изучение и применение науки о данных для решения биомедицинских проблем. [1] Современные наборы биомедицинских данных часто имеют специфические особенности, которые затрудняют их анализ, в том числе:
- Большое количество объектов (иногда миллиарды), обычно намного превышающее количество образцов (обычно десятки или сотни)
- Шумные и отсутствующие данные
- Проблемы конфиденциальности (например, конфиденциальность электронных медицинских записей )
- Требование интерпретируемости со стороны лиц, принимающих решения, и регулирующих органов
Многие проекты в области биомедицинских данных применяют машинное обучение к таким наборам данных. [2] [3] Эти характеристики, хотя и присутствуют во многих приложениях науки о данных в целом, делают науку о биомедицинских данных особой областью. Примеры исследований в области биомедицинских данных включают:
- Вычислительная геномика
- Вычислительная визуализация [3] [4]
- электронных медицинских записей Интеллектуальный анализ данных
- Биомедицинская сетевая наука [5]
Обучение в области биомедицинских данных
[ редактировать ]Национальная медицинская библиотека ( Национальных институтов здравоохранения США NIH) определила ключевые качества специалиста по биомедицинским данным в общенациональном обзоре NIH: общие знания по биомедицинским предметам; знание языков программирования; прогнозная аналитика, моделирование и машинное обучение; командная наука и общение; и ответственное управление данными. [6]
Кафедры и программы университета
[ редактировать ]- Факультет биомедицинской инженерии Университета Джонса Хопкинса предлагает обучение в области биомедицинских данных на уровне бакалавриата, магистратуры и докторантуры. Они были первым университетом, предложившим программы как для студентов, так и для выпускников.
- Дартмутского колледжа В Медицинской школе Гейзеля находится факультет биомедицинских данных, где программы количественных биомедицинских наук доступны на уровнях магистра и доктора философии.
- Имперского колледжа Лондона и Медицинский факультет Институт науки о данных предлагают степень магистра в области биомедицинских исследований (наука о данных).
- Маунт-Синай предлагает Медицинская школа Икан степень магистра наук в области биомедицинских данных.
- Стэнфордского университета предлагает несколько программ последипломного образования в области биомедицинской информатики (MS, PhD и MD/PhD). Факультет биомедицинских данных
- предлагает степень магистра в области наук о медицинских данных. университета Колледж здравоохранения и медицины Эксетерского
Биомедицинские исследования данных в академических кругах
[ редактировать ]Научные журналы
[ редактировать ]В 2018 году появился первый журнал, посвящённый биомедицинским данным, — Annual Review of Biomedical Data Science .
« Ежегодный обзор биомедицинских данных предоставляет всесторонние экспертные обзоры в области биомедицинских данных, уделяя особое внимание передовым методам хранения, извлечения, анализа и организации биомедицинских данных и знаний. Объем журнала охватывает информатику, вычислительные и статистические подходы к биомедицинским данным, включая подобласти биоинформатики, вычислительной биологии, биомедицинской информатики, информатики клинических и клинических исследований, биостатистики и информатики изображений. Миссия журнала — выявить как новые, так и существующие области биомедицинской науки о данных, а также лидеров в этих областях». [7]
Другие журналы имеют более общую сферу применения, чем журнал «Наука о биомедицинских данных», но регулярно публикуют исследования в области биомедицинских данных, такие как «Наука о биомедицинских данных». [8] и природный машинный интеллект. [9] Наука о данных не существовала бы без тщательно подобранных наборов данных, и в этой области наблюдается рост журналов, посвященных описанию и проверке таких наборов данных, некоторые из которых полезны для биомедицинских приложений, включая научные данные. [10] Биомедицинские данные, [11] и Данные. [12]
Пример
[ редактировать ]Проект «Геном человека» (HGP), в ходе которого были обнаружены последовательности ДНК, составляющие человеческие гены, был бы невозможен без науки о биомедицинских данных. Для обработки данных в HGP потребовались значительные вычислительные ресурсы, поскольку геном человека содержит более 6 миллиардов пар оснований ДНК . [13] Ученые построили геном, соединив вместе небольшие фрагменты ДНК, и вычисление перекрытий между этими последовательностями потребовало более 10 000 часов процессора. В таком огромном масштабе данных ученые полагались на передовые алгоритмы для выполнения таких этапов обработки данных, как сборка последовательностей и выравнивание последовательностей, для контроля качества. [14] Некоторые из этих алгоритмов, например BLAST , до сих пор используются в современной биоинформатике. Ученым из HGP также пришлось решать сложности, часто связанные с биомедицинскими данными, включая зашумленные данные, такие как ошибки чтения ДНК , и права субъектов исследования на неприкосновенность частной жизни. [15] Проект HGP, завершенный в 2004 году, оказал огромное влияние как в биологическом плане, пролив свет на эволюцию человека , так и в медицинском, положив начало области биоинформатики и приведя к таким технологиям, как генетический скрининг и генная терапия .
Ссылки
[ редактировать ]- ^ Альтман, Расс; Левитт, Майкл (2018). «Что такое биомедицинская наука о данных и нужен ли нам ее ежегодный обзор?» . Ежегодный обзор биомедицинских данных . 1 : я – iii. doi : 10.1146/annurev-bd-01-041718-100001 . S2CID 134950609 .
- ^ Бальди, Пьер (2018). «Глубокое обучение в области биомедицинских данных». Ежегодный обзор биомедицинских данных . 1 : 181–205. doi : 10.1146/annurev-biodatasci-080917-013343 . S2CID 67381478 .
- ^ Jump up to: а б Роннебергер, Олаф; Фишер, Филипп; Брокс, Томас (2015). «U-net: сверточные сети для сегментации биомедицинских изображений». Международная конференция по обработке медицинских изображений и компьютерному вмешательству . arXiv : 1505.04597 .
- ^ Дункан, Джеймс С.; Инсана, Майкл Ф; Аяче, Николас (2020). «Биомедицинская визуализация и анализ в эпоху больших данных и глубокого обучения [сканирование проблемы]» . Труды IEEE . 108 : 3–10. дои : 10.1109/JPROC.2019.2956422 . S2CID 210077608 .
- ^ Су, Чанг; Тонг, Цзе; Чжу, Юнджун; Ку, Пэн; Ван, Фэй (2020). «Сетевое встраивание в биомедицинские данные». Брифинги по биоинформатике . 21 (1): 182–197. дои : 10.1093/нагрудник/bby117 . ПМИД 30535359 .
- ^ Зарингалам, Марьям; Федерер, Лиза; Уэрта, Майкл. «Основные навыки специалистов по биомедицинским данным» (PDF) . Национальная медицинская библиотека США . Национальные институты здравоохранения США . Проверено 21 февраля 2022 г.
- ^ «Ежегодный обзор биомедицинских данных» . Annualreviews.org . Проверено 21 февраля 2022 г.
- ^ «Наука о медицинских данных» . spj.sciencemag.org . Проверено 5 июля 2022 г.
- ^ «Природный машинный интеллект» . Nature.com . Проверено 5 июля 2022 г.
- ^ «Научные данные» . Nature.com . Проверено 5 июля 2022 г.
- ^ «Журнал биомедицинских данных» . biomed-data.eu . Проверено 5 июля 2022 г.
- ^ "Данные" . mdpi.com . Проверено 5 июля 2022 г.
- ^ Пиовесан, Эллисон; Пеллери, Мария С; Антонарос, Франческа; Стрипполи, Пьерлуиджи; Витале, Лоренца (2019). «О длине, массе и GC-содержании генома человека» . Исследовательские заметки BMC . 12 (1): 106. дои : 10.1186/s13104-019-4137-z . ПМК 6391780 . ПМИД 30813969 .
- ^ Альтшул, Стивен Ф; Гиш, Уоррен; Миллер, Уэбб; Майерс, Юджин В; Липман, Дэвид Дж (1990). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. дои : 10.1016/S0022-2836(05)80360-2 . ПМИД 2231712 . S2CID 14441902 .
- ^ Вентер, Дж. Крейг; и др. (2001). «Последовательность генома человека» . Наука . 291 (5507): 1304–1351. Бибкод : 2001Sci...291.1304V . дои : 10.1126/science.1058040 . ПМИД 11181995 .