Информатика заболеваний
Информатика болезней (также информатика инфекционных заболеваний) изучает производство, обмен знаниями, моделирование и управление инфекционными заболеваниями. [1] Эта область стала более изученной как побочный продукт быстрого увеличения количества широко доступных биомедицинских и клинических данных, а также для удовлетворения потребностей в полезном анализе таких данных. [1]
Учитывая, что инфекционные заболевания ежегодно приводят к миллионам смертей, способность выявлять и понимать распространение болезней имеет решающее значение для общества, позволяющего применять меры контроля и профилактики. [2] Знания, полученные исследователями в области информатики заболеваний, могут быть использованы для помощи политикам в принятии решений по таким вопросам, как распространение осведомленности общественности, обновление подготовки медицинских работников и покупка вакцин . [2]
Помимо помощи в принятии решений политиками, цели информатики о заболеваниях также включают более глубокую идентификацию биомаркеров трансмиссивности, улучшение дизайна вакцин и более глубокое понимание взаимодействия хозяина и патогена , а также оптимизацию разработки противомикробных препаратов . [1]
Методы
[ редактировать ]Искусственный интеллект
[ редактировать ]Использование инструментов искусственного интеллекта (ИИ), таких как машинное обучение и обработка естественного языка ( НЛП ), в информатике о заболеваниях повышает эффективность за счет автоматизации и ускорения некоторых процессов анализа данных. Достижения в области искусственного интеллекта и повышение доступности данных помогают в прогнозном моделировании и надзоре за общественным здравоохранением. ИИ использует прогностическое моделирование для изучения обширных наборов данных и прогнозирования будущих результатов, чтобы повысить способность прогнозировать вспышки заболеваний и помогать направлять методы лечения общественного здравоохранения. [3] ИИ также предоставляет ценную возможность, объединяя свои возможности пространственного моделирования с данными географической информационной системы (ГИС) для выявления географических закономерностей (например, кластеров заболеваний) для поддержки принятия решений на основе данных для прогнозирования распространения болезней на местном уровне. [3] Поскольку рост ИИ продолжается, ожидается, что появятся новые успехи в его использовании в информатике заболеваний.
Машинное обучение
[ редактировать ]Методы машинного обучения (МО) помогают изучать информатику заболеваний благодаря их способности пространственно и временно прогнозировать прогрессирование и передачу инфекционных заболеваний. [2] В информатике о заболеваниях алгоритмы машинного обучения используются для анализа больших объемов сложных наборов данных для выявления закономерностей в различных типах данных, таких как демографические данные, электронные медицинские записи, условия окружающей среды и т. д. [2] Типы обычно используемых методов ML — это деревья решений ( модель дерева решений ), случайные леса , машины опорных векторов ( машина опорных векторов ) и сети глубокого обучения ( глубокое обучение ). [2] Используя эти инструменты, исследователи могут применять их к наборам данных (например, геномным данным, сообщениям в социальных сетях и медицинским записям), чтобы делать прогнозы о потенциальных источниках вспышки, вероятности заражения человека определенным заболеванием и прогнозировать количество случаев заболевания в данном регионе. [2] Согласно многочисленным исследованиям, модели МО оказались столь же точными, как и традиционные статистические методы (особенно когда одновременно используются несколько моделей МО), когда дело доходит до прогнозирования распространения и возникновения заболеваний. [2]
Анализ текста
[ редактировать ]Использование интеллектуального анализа текста стало полезным способом запроса больших объемов данных для картирования генов и анализа геномов. [1] Этот инструмент предоставляет возможность запрашивать в медицинских базах данных такие процессы, как геномное картирование , путем интеграции геномных и протеомных данных для картирования генов и выявления их взаимосвязи с различными заболеваниями. [1] Получение данных о целевых последовательностях можно выполнить двумя способами: с помощью поиска по сходству или с помощью поиска по ключевым словам. Поиск по сходству (с использованием такого программного обеспечения, как BLAST (биотехнология) выполняется путем ввода известной последовательности в качестве последовательности запроса для поиска последовательностей, имеющих сходство. Поиск по ключевым словам (общедоступные инструменты включают SRS, Entrez и ACNUC) использует аннотации, которые определяют функции генов, таких как положения последовательностей, для извлечения искомых желаемых последовательностей генов. [1]
Синдромальный надзор
[ редактировать ]С помощью процесса, называемого синдромным надзором (связанным с надзором за общественным здравоохранением ), методы анализа данных могут быть успешно использованы для прогнозирования потенциальных вспышек заболеваний путем выявления своевременных, предварительных показателей здоровья. [4] Синдромный эпиднадзор объединяет демографические данные (возраст, пол, этническая принадлежность и т. д.) с данными посещений пациентов (статус госпитализации, основная жалоба , тип посещения кабинета и т. д.), которые можно обработать с помощью естественного языка, чтобы выявить потенциальные предикторы вспышки. [4] Из-за чувствительности ко времени при прогнозировании возможных вспышек использование данных об основных жалобах является ценным, поскольку они доступны гораздо быстрее, чем официальные диагностические данные из кабинетов врачей. [4] Ключом к успешному использованию данных эпиднадзора для информатики о заболеваниях является использование более чем одного источника. Другие важные источники, которые обычно используются синхронно, включают следующее: [4]
- Продажа безрецептурных препаратов (OTC)
- Госпитализация
- Уровень прогулов в школах и на рабочих местах
- Заказы на лабораторные испытания
- Связь токсикологических центров
- Номера отчетов о случаях
Ограничения и перспективы на будущее
[ редактировать ]Проблемы доступности
[ редактировать ]Точность этих инструментов и методов искусственного интеллекта зависит от предоставления им высококачественных и полных данных. Доступность и сбор таких данных по-прежнему являются постоянной проблемой, поскольку большая часть извлекаемых данных является неполной, зашумленной и содержит человеческие ошибки (например, грамматические, аббревиатуры, орфография), что означает, что данные должны пройти тщательную очистку ( очистку данных ), прежде чем они будут опубликованы. годен к использованию. [2] [4]
Собранные данные также будут поступать из многочисленных источников (из-за различий в доступности и управлении данными), которые используют различное форматирование и программное обеспечение, что создает проблему необходимости в некоторой форме стандартизированной инфраструктуры для лучшей интеграции и управления данными. [3] Формирование стандартизированной таксономии для анализа данных и прогнозного моделирования облегчит исследовательское сотрудничество, ускорит принятие решений и поможет выбрать правильные прогностические модели для использования. [3]
Одним из используемых методов является федеративное обучение , которое позволяет обучать ИИ в нескольких разных центрах без необходимости совместного использования необработанных данных , сохраняя данные в безопасности в их источнике. [3] Однако те же проблемы, связанные с различным форматированием и программным обеспечением для обеспечения сходимости моделей, по-прежнему влияют и на этот подход, поэтому необходимы алгоритмические улучшения.
Еще одной проблемой является возможность предвзятости и переоснащения прогнозных моделей, что может привести к неточным прогнозам. [2] Человеческая ошибка все еще может сохраняться даже при использовании этих инструментов для автоматизации задач, поскольку, если инструменты ИИ обучены неправильно, они будут выдавать неточные данные. Соответствующее исследование предполагает, что внедрение ИИ с носимыми устройствами и другими новыми технологиями в будущем поможет решить некоторые проблемы, предоставляя данные в реальном времени для использования моделями, что может привести к повышению точности данных в их необработанной форме, создавая меньше необходимости тратить время на очистку данных и позволить моделям делать более точные прогнозы. [3]
Этические проблемы
[ редактировать ]Критической проблемой при использовании искусственного интеллекта и прогнозного моделирования в информатике заболеваний является безопасность и конфиденциальность данных. Используемые источники данных (электронные медицинские карты, демографические данные и т. д.) содержат очень конфиденциальную информацию, которая должна быть защищена для всех вовлеченных сторон. Любые используемые модели или методы должны соответствовать местным правительственным постановлениям и законам, таким как HIPAA в США. Используемые данные также должны пройти строгие протоколы анонимизации и деидентификации для защиты конфиденциальности пациентов. [3]
Благодаря дальнейшему использованию и развитию объяснимого ИИ, также называемого XAI ( объяснимый искусственный интеллект ), исследователи и все участвующие стороны могут обеспечить прозрачность и подотчетность, когда дело доходит до использования анализа данных и вычислительных методов в области информатики заболеваний. XAI предоставляет объяснения того, как работают используемые алгоритмы, почему они были выбраны, какие знания они производят и так далее. [3]
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж Синченко, Виталий, изд. (2010). «Информатика инфекционных заболеваний» . СпрингерЛинк . дои : 10.1007/978-1-4419-1327-2 . ISBN 978-1-4419-1326-5 .
- ^ Jump up to: а б с д и ж г час я Сантанджело, Омар Энцо; Джентиле, Вито; Пиццо, Стефано; Джордано, Домициана; Седроне, Фабрицио (01 февраля 2023 г.). «Машинное обучение и прогнозирование инфекционных заболеваний: систематический обзор» . Машинное обучение и извлечение знаний . 5 (1): 175–198. дои : 10.3390/make5010013 . ISSN 2504-4990 .
- ^ Jump up to: а б с д и ж г час Олаваде, Дэвид Б.; Вада, Одзима Дж.; Давид-Олаваде, Аануолувапо Клемент; Кунонга, Эдвард; Абайре, Олавале; Линг, Джонатан (26 октября 2023 г.). «Использование искусственного интеллекта для улучшения общественного здравоохранения: описательный обзор» . Границы общественного здравоохранения . 11 . дои : 10.3389/fpubh.2023.1196397 . ISSN 2296-2565 . ПМЦ 10637620 . ПМИД 37954052 .
- ^ Jump up to: а б с д и Чен, Синьчунь; Цзэн, Дэниел; Ян, Пин (2010). Информатика инфекционных заболеваний: синдромный надзор в целях общественного здравоохранения и биозащиты . Интегрированная серия по информационным системам. Нью-Йорк: Спрингер. ISBN 978-1-4419-1278-7 .