Единая система медицинского языка
Единая система медицинского языка ( UMLS ) представляет собой сборник многих контролируемых словарей по биомедицинским наукам (создан в 1986 году). [1] Он обеспечивает структуру сопоставления этих словарей и, таким образом, позволяет осуществлять перевод между различными терминологическими системами; его также можно рассматривать как всеобъемлющий тезаурус и онтологию биомедицинских концепций. UMLS также предоставляет возможности для обработки естественного языка . Предназначен для использования в основном разработчиками систем медицинской информатики .
UMLS состоит из источников знаний (баз данных) и набора программных инструментов.
UMLS был разработан и поддерживается США Национальной медицинской библиотекой , обновляется ежеквартально и может использоваться бесплатно. Проект был инициирован в 1986 году Дональдом А. Б. Линдбергом , доктором медицинских наук , тогдашним директором Медицинской библиотеки, и руководил Бетси Хамфрис . [2]
Назначение и применение
[ редактировать ]Количество биомедицинских ресурсов, доступных исследователям, огромно. Зачастую это является проблемой из-за большого объема документов, извлекаемых при поиске медицинской литературы. Цель UMLS — расширить доступ к этой литературе, способствуя разработке компьютерных систем, понимающих биомедицинский язык. Это достигается за счет преодоления двух существенных барьеров: «разнообразия способов выражения одних и тех же концепций в разных машиночитаемых источниках разными людьми» и «распределения полезной информации среди множества разрозненных баз данных и систем». [ нужна ссылка ]
Лицензирование
[ редактировать ]Пользователи системы должны подписать «соглашение UMLS» и подавать краткие годовые отчеты об использовании. Академические пользователи могут бесплатно использовать UMLS в исследовательских целях. Для коммерческого или производственного использования требуются лицензии на авторские права на некоторые из включенных исходных словарей.
Источники знаний
[ редактировать ]Метатезавр
[ редактировать ]Метатезаурус составляет основу UMLS и включает более 1 миллиона биомедицинских концепций и 5 миллионов названий концепций, все из которых происходят из более чем 100 встроенных контролируемых словарей и систем классификации. Некоторыми примерами встроенных контролируемых словарей являются CPT , ICD-10 , MeSH , SNOMED CT , DSM-IV , LOINC , Терминология ВОЗ по нежелательным реакциям на лекарства , Клинические термины Великобритании , RxNorm , Gene Ontology и OMIM (см. полный список ).
Метатезаурус организован по понятиям, и каждое понятие имеет определенные атрибуты, определяющие его значение, и связано с соответствующими названиями понятий в различных исходных словарях. Представлены многочисленные связи между понятиями, например иерархические, такие как « is » для подклассов и «является частью» для субъединиц, и ассоциативные, такие как «вызвано» или «в литературе часто встречается близко к» (т. последнее взято из Medline ).
Объем Метатезауруса определяется объемом исходных словарей. Если разные словари используют разные названия для одного и того же понятия или если они используют одно и то же имя для разных понятий, то это будет точно представлено в Метатезаурусе. Вся иерархическая информация из исходных словарей сохраняется в Метатезаурусе. Концепции метатезавра также могут быть связаны с ресурсами за пределами базы данных, например, с базами данных последовательностей генов.
Семантическая сеть
[ редактировать ]Каждому понятию в Метатезаурусе присвоен один или несколько семантических типов (категорий), которые связаны между собой семантическими отношениями . [3] Семантическая сеть представляет собой каталог этих семантических типов и отношений. Это довольно широкая классификация; Всего насчитывается 127 семантических типов и 54 связи.
Основными семантическими типами являются организмы, анатомические структуры, биологические функции, химические вещества, события, физические объекты, а также концепции или идеи. Связи между семантическими типами определяют структуру сети и показывают важные отношения между группировками и понятиями. Основной связью между семантическими типами является ссылка « isa », устанавливающая иерархию типов. В сети также есть 5 основных категорий неиерархических (или ассоциативных) отношений, которые составляют оставшиеся 53 типа отношений. Они «физически связаны с», «пространственно связаны с», «временно связаны с», «функционально связаны с» и «концептуально связаны с». [3]
Информация о семантическом типе включает идентификатор, определение, примеры, иерархическую информацию об охватывающем семантическом типе(ах) и ассоциативные отношения. Ассоциативные связи внутри семантической сети очень слабы. Они фиксируют в лучшем случае отношения «некоторые-некоторые», т.е. они фиксируют тот факт, что некоторый экземпляр первого типа может быть связан существенным отношением с некоторым экземпляром второго типа. Другими словами, они отражают тот факт, что соответствующее реляционное утверждение имеет смысл (хотя оно не обязательно должно быть истинным во всех случаях).
Примером ассоциативной связи является « может-причина », примененная к терминам (курение, рак легких), что приведет к: курение « может-причина » рака легких.
СПЕЦИАЛЬНЫЙ лексикон
[ редактировать ]Лексикон SPECIALIST содержит информацию об общей английской лексике, биомедицинских терминах, терминах, найденных в MEDLINE , и терминах, найденных в UMLS Metathesaurus. Каждая запись содержит синтаксическую (как слова соединяются для создания значения), морфологическую (форму и структуру) и орфографическую (орфографическую) информацию. Набор программ Java использует лексикон для работы с вариациями биомедицинских текстов, связывая слова по частям речи, что может быть полезно при в Интернете поиске или в электронных медицинских записях .
Записи могут состоять из одного или нескольких слов. Записи состоят из четырех частей: базовая форма (т.е. «бег» вместо «бег»); части речи (из которых Специалист распознает одиннадцать); уникальный идентификатор; и любые доступные варианты написания. Например, запрос «анестетик» вернет следующее: [4]
{ base=anaesthetic spelling_variant=anesthetic entry=E0008769 cat=noun variants=reg } { base=anaesthetic spelling_variant=anesthetic entry=E0008770 cat=adj variants=inv position=attrib(3) }
Лексика СПЕЦИАЛИСТА доступна в двух форматах. Формат «единичной записи» можно увидеть выше. Он включает в себя слоты и заполнители . Слот — это элемент (т. е. "base=" или "вариант написания="), а заполнители — это значения, относящиеся к этому слоту для данной записи. Формат « реляционной таблицы » еще не нормализован и содержит в файлах большое количество избыточных данных.
Несоответствия и другие ошибки
[ редактировать ]Учитывая размер и сложность UMLS, а также ее либеральную политику в отношении условий интеграции, ошибки неизбежны. [5] К ошибкам относятся двусмысленность и избыточность, циклы иерархических отношений (концепт является одновременно предком и потомком другого), отсутствующие предки (семантические типы родительских и дочерних концептов не связаны между собой) и семантическая инверсия (дочерние/родительские отношения с семантическими типами не связаны между собой). не соответствует понятиям). [6]
Эти ошибки обнаруживаются и устраняются путем аудита UMLS. Ручной аудит может быть очень трудоемким и дорогостоящим. Исследователи пытались решить эту проблему несколькими способами. Для поиска этих ошибок можно использовать автоматизированные инструменты. Для структурных несоответствий (таких как циклы) подойдет тривиальное решение, основанное на порядке. Однако то же самое не применяется, когда несоответствие находится на уровне термина или концепции (контекстно-зависимое значение термина). [7] Это требует использования стратегии информированного поиска ( представление знаний ).
Поддержка программных инструментов
[ редактировать ]Помимо источников знаний, Национальная медицинская библиотека также предоставляет вспомогательные инструменты.
- MetamorphoSys — настраивает Metathesaurus для конкретных приложений, например, исключая определенные исходные словари.
- lvg — программа, использующая лексику СПЕЦИАЛИСТ для генерации лексических вариантов данного термина и поддержки синтаксического анализа текста на естественном языке.
- MetaMap - онлайн-инструмент, который по произвольному фрагменту текста находит и возвращает соответствующие концепции Метатезавра.
- MetaMap Transfer (MMTx) — Java-реализация MetaMap (больше не поддерживается).
- Сервер источников знаний — доступ к словарям через Интернет (выведен из эксплуатации осенью 2010 г.). [8]
Стороннее программное обеспечение
[ редактировать ]- UMLS-Similarity — пакет программного обеспечения с открытым исходным кодом, который реализует множество мер семантического сходства и родства.
- Веб-интерфейс UMLS-Similarity , веб-интерфейс для UMLS-Similarity
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Единая система медицинского языка , 1996 г.
- ^ Эллисон Д., Хамфрис Б.Л., Митчелл Дж. (июль 2010 г.). «Вручение премии Морриса Ф. Коллена 2009 года Бетси Л. Хамфрис с замечаниями получателя» . Журнал Американской ассоциации медицинской информатики . 17 (4): 481–5. дои : 10.1136/jamia.2010.005728 . ПМК 2995660 . ПМИД 20595319 .
- ^ Jump up to: а б Национальная медицинская библиотека (2009). «Глава 5 — Семантические сети» . Справочное руководство по UMLS . Бетесда, доктор медицины: Национальная медицинская библиотека США, Национальные институты здравоохранения.
- ^ Браун А.С., МакКрей А.Т., Шринивасан С. (июнь 2000 г.). Специализированный лексикон (PDF) . Бетесда, доктор медицины: Национальный центр биомедицинских коммуникаций Листер-Хилл, Национальная медицинская библиотека. п. 1.
- ^ Морри К.П., Геллер Дж., Халпер М., Перл Ю. (июнь 2009 г.). «Инструмент аудита соседства: гибридный интерфейс для аудита UMLS» . Журнал биомедицинской информатики . 42 (3): 468–89. дои : 10.1016/j.jbi.2009.01.006 . ПМЦ 2891659 . ПМИД 19475725 .
- ^ Геллер Дж., Морри С.П., Сюй Дж., Халпер М., Эльханан Г., Перл Ю., Рипчак Г. (ноябрь 2009 г.). «Сравнение противоречивых конфигураций отношений, указывающих на ошибки UMLS» . AMIA ... Материалы ежегодного симпозиума. Симпозиум АМИА . 2009 : 193–7. ПМК 2815406 . ПМИД 20351848 .
- ^ Чжу X, Фань Дж.В., Баорто Д.М., Венг С., Чимино Дж.Дж. (июнь 2009 г.). «Обзор методов проверки, применяемых к содержанию контролируемой биомедицинской терминологии» . Журнал биомедицинской информатики . 42 (3): 413–25. дои : 10.1016/j.jbi.2009.03.003 . ПМЦ 3505841 . ПМИД 19285571 .
- ^ «Новости Unified Medical Language System® (UMLS®): пересмотренное лицензионное соглашение, новые терминологические службы и браузер UMLS, прекращение поддержки UMLSKS и изменения API» . Технический бюллетень NLM (375): e9. Июль – август 2010 г.
Дальнейшее чтение
[ редактировать ]- Боденрейдер О (январь 2004 г.). «Единая система медицинского языка (UMLS): интеграция биомедицинской терминологии» . Исследования нуклеиновых кислот . 32 (Проблема с базой данных): D267-70. дои : 10.1093/nar/gkh061 . ПМК 308795 . ПМИД 14681409 .
- Кумар А., Смит Б. (2003). «Единая система медицинского языка и онтология генов: некоторые критические размышления» (PDF) . Достижения в области искусственного интеллекта (Конспекты лекций по искусственному интеллекту, 2821 г., Берлин: Springer. стр. 135–148.
- Смит Б., Кумар А., Шульце-Кремер С. (2004). «Пересмотр семантической сети UMLS» (PDF) . В Fieschi M, et al. (ред.). Мединфо . Амстердам: IOS Press. п. 1700.
- Койера Э (2003). «Глава 17. Медицинская терминология и системы классификации». Руководство по медицинской информатике (2-е изд.). Моддер, Арнольд. ISBN 978-0-340-76425-1 .
- Мужен Ф, Боденрейдер О (2005). «Подходы к устранению циклов в метатезаурусе UMLS: наивные и формальные» . Материалы ежегодного симпозиума AMIA . 2005 : 550–4. ПМК 1560864 . ПМИД 16779100 .
Внешние ссылки
[ редактировать ]- Официальный сайт
- Краткое описание UMLS со ссылками на информационные бюллетени и документацию по Metathesaurus, Semantic Network, SPECIALIST Lexicon и MetamorphoSys.
- Обзор и руководство по UMLS , авторы Рэйчел Кляйнзордж, Ян Уиллис, Аллен Браун, Алан Аронсон
- Модуль Perl для запроса установки UMLS MySQL.
- Единая система медицинского языка Национальной медицинской библиотеки США по медицинским предметным рубрикам (MeSH)
- UMLS.me — извлекает медицинские концепции и коды UMLS из свободного текста в браузере, автор Александр Скарлат, доктор медицинских наук.