Открытие на основе литературы

Открытие на основе литературы (LBD), также называемое открытием, связанным с литературой (LRD), представляет собой форму извлечения знаний и автоматизированной генерации гипотез , в которой используются статьи и другие академические публикации («литература») для поиска новых связей между существующими знаниями («литература»). открытие»). Открытие, основанное на литературе, направлено на открытие новых знаний путем соединения информации, которая была явно изложена в литературе, для установления связей, которые не были явно заявлены. [1]
LBD может помочь исследователям быстро обнаруживать и исследовать гипотезы, а также получать информацию о соответствующих достижениях внутри и за пределами их ниш и расширять междисциплинарный обмен информацией. [1]
Самый простой и распространенный тип LBD называется парадигмой ABC , поскольку он сосредоточен вокруг трех концепций, называемых A, B и C. [2] [3] [4] В нем говорится, что если существует связь между A и B и связь между B и C, то между A и C существует связь, которая, если она не указана явно, еще предстоит изучить. [1]
История
[ редактировать ]Техника LBD была впервые предложена Доном Р. Свонсоном в 1980-х годах. [5] Он предположил, что комбинация двух отдельно опубликованных результатов, указывающих на взаимосвязь AB и взаимосвязь BC, является свидетельством взаимосвязи AC, которая неизвестна или неисследована. Он использовал это, чтобы предложить рыбий жир для лечения синдрома Рейно из-за их общей связи с вязкостью крови . [6] Позднее в проспективном исследовании было показано, что эта гипотеза имеет смысл. [7] и он постоянно предлагал другие открытия, используя аналогичные методы. [8] [9] [10] [1]
Суонсон связывает
[ редактировать ]Связывание Свонсона - термин, предложенный в 2003 году. [11] это относится к соединению двух частей знания, которые ранее считались несвязанными. [12] Например, может быть известно, что болезнь А вызвана химическим веществом В и что известно, что лекарство С снижает количество химического вещества В в организме. Однако, поскольку соответствующие статьи были опубликованы отдельно друг от друга (так называемые «непересекающиеся данные»), связь между болезнью А и препаратом С может быть неизвестна. Целью связывания Swanson является поиск этих взаимосвязей и сообщение о них.
Хотя парадигма ABC широко используется, критики системы утверждают, что большая часть науки не сводится к простым утверждениям, а скорее строится на аналогиях и образах на более высоком уровне абстракции . [13]
Системы
[ редактировать ]LBD обычно бывает двух видов: открытое и закрытое открытие. При открытом открытии дается только А. Подход находит B и использует их для возврата пользователю, возможно, интересных C, тем самым генерируя гипотезы из A. При закрытом открытии A и C передаются подходу, который стремится найти B, которые могут связать их, тем самым проверяя гипотеза об А и С. [1]
За прошедшие годы был разработан ряд систем для осуществления открытий, основанных на литературных данных, которые расширяют первоначальную идею Дона Суонсона, и оценка качества таких систем является активной областью исследований. [14] Некоторые системы включают веб-версии для повышения удобства использования. [15] Распространенным подходом ко многим системам является использование терминов MeSH для обозначения научных статей. Это используется системами Manjal, BITOLA и LitLinker. [16]
Одна хорошо известная система в этой области называется Arrowsmith и предназначена для поиска связей между двумя непересекающимися наборами статей - подход, получивший название «двухузлового поиска». [17] [18]
Другая известная система LION LBD, [19] использует PubTator [20] для аннотирования научных статей PubMed с использованием таких понятий, как химические вещества , гены/белки, мутации , болезни и виды ; а также аннотации признаков рака на уровне предложений, которые описывают фундаментальные раковые процессы и поведение. [21] Он использует метрики совместного появления для ранжирования отношений между понятиями и выполняет как открытое, так и закрытое обнаружение. [1]
Хотя системы LBD основаны на традиционных статистических методах, [16] другие системы используют сложные методы машинного обучения , такие как нейронные сети . [1] Некоторые системы LBD представляют связь между понятиями в виде графа знаний и, таким образом, используют методы теории графов . [22] Представление на основе графов также является основой для систем LBD, в которых используются графовые базы данных , такие как Neo4J , что позволяет осуществлять обнаружение с помощью языков графовых запросов, таких как Cypher . [23]
Системы LBD на основе графов представляют отношения между понятиями, используя различные типы отношений, например, в семантической сети UMLS . [24] Некоторые подходы идут дальше и пытаются применить контекстуализированные отношения. [25] подход, также используемый Gene Ontology для моделирования причинно-следственной деятельности (GO-CAM). [26]
Использование баз данных
[ редактировать ]Помимо извлечения информации из научных статей, системы LBD часто используют структурированные знания из биологических ресурсов, таких как онлайн-менделевское наследование у мужчин (OMIM). [27]
Список систем
[ редактировать ]
Это опубликованные системы LBD, упорядоченные по дате публикации: [29]
- 1986 - Эроусмит [6]
- 2000 - БИТОЛА V1 [30]
- 2001 - ПАПА [31]
- 2003 - ЛитЛинкер [32]
- 2004 - САУ [33]
- 2004 - Манджал [34]
- 2004 - РАДУЖНЫЕ [35]
- 2005 - БИТОЛА V2 [36]
- 2006 - ЛитЛинкер V2 [37]
- 2007 - Стрелка V2 [38]
- 2008 - Годы 2.0 [28]
- 2008 - Открытие КоПаб [39]
- 2009 - РаджоЛинк [40]
- 2010 - Сем-БТ [41]
- 2015 - Очевидное [42]
- 2016 - «Искра» [43]
- 2017 - Минируем брешь [44]
- 2019 - ЛЕВ ЛБД [19]
Семантическая типизация
[ редактировать ]Общей задачей при открытии литературы является отнесение слов/понятий к разным семантическим типам. Концепт может быть отнесен к одному типу или нескольким типам. Например, в Единой системе медицинского языка (UMLS) термин «мигрень» классифицируется по типу «болезнь» и «синдром» , а термин «магний» — по двум типам: биологически активное вещество и элемент , ион или изотоп. [16] Типизация - понятий оттачивает обнаружение связей между отдельными классами понятий, заболеваниями - генами или болезнями т.е. лекарствами . [16]
Оценка системы
[ редактировать ]Оценка открытий, основанных на литературе, является сложной задачей и включает в себя как экспериментальные методы, так и методы in silico . [45] Методы пытаются количественно оценить объем знаний, генерируемых системами, которые должны быть предоставлены в объеме и богатстве, полезных для ученых. [46]
Оценка LBD затруднена по нескольким причинам: разногласия относительно роли систем LBD в исследованиях и, следовательно, того, что делает их успешными; сложность определения того, насколько полезно, интересно или действенно открытие; и сложность объективного определения « открытия », что препятствует созданию стандартного набора оценок, позволяющего количественно определить, когда открытие было воспроизведено или обнаружено. [1]
Популярный метод, используемый в LBD, — это повторение предыдущих открытий. [4] [47] [48] Обычно это открытия, основанные на LBD, поскольку их относительно легко оценить количественно по сравнению с другими открытиями. Таких открытий немного, и подходы, рассчитанные на хорошие результаты в отношении этих открытий, не могут быть обобщены. В этом типе оценки литература до открытия, подлежащего тиражированию, используется для создания ранжированного списка кандидатов на открытие в качестве целевых или связывающих терминов. Успех измеряется путем сообщения о ранге интересующего термина(ов); чем выше ранг, тем лучше подход.
Литературное или временное разделение предполагает разделение существующей литературы в определенный момент времени. Затем система LBD знакомится с литературой до разделения и оценивается по тому, сколько открытий в более поздний период она может сделать. В системах LBD используются термины «совпадение», [49] связи с внешними биомедицинскими ресурсами (например, SemMedDB) [50] и смысловые отношения [51] создать золотые стандарты. Высокоточный подход заключается в том, чтобы получить мнение экспертов для создания золотого стандарта. [52] но это отнимает много времени, дорого и приводит к низкой скорости отзыва. [1]
Преимущество разделения времени по сравнению с повторением предыдущих открытий заключается в оценке на большом количестве тестовых экземпляров. Это повышает потребность в показателях оценки , которые могут количественно оценить производительность в больших ранжированных списках. [1] В работах LBD использовались метрики, популярные в информационном поиске. [53] которые включают точность, полноту, площадь под кривой (AUC), точность при k , среднюю среднюю точность (MAP) и другие. [1]
Подход «Предложение новых открытий или методов лечения» выходит за рамки повторения прошлых открытий или прогнозирования отдельных случаев конкретных отношений и показывает, что систему можно использовать в реальных ситуациях . [54] [47] [55] [56] Обычно это сопровождается рецензируемой публикацией в предметной области или проверкой экспертом в предметной области . [1]
Анализ текста
[ редактировать ]
Автоматизация поиска на основе литературы во многом зависит от интеллектуального анализа текста . [58]
Язык научных статей часто содержит двусмысленности, и важным шагом для последовательного анализа литературы является извлечение смысла каждого термина в контексте, в котором они используются, - задача, называемая устранением смысловой неоднозначности слова (WSD). [59] Например, термины для таких генов, как CT ( PCYT1A ) и MR ( NR3C2 ), можно спутать с аббревиатурами компьютерной томографии и магнитного резонанса , что требует сложных систем устранения неоднозначности. [60] Термины часто согласовываются с онтологиями или другими источниками уникальных идентификаторов, такими как Единая система медицинского языка (UMLS). [61] Этот процесс сопоставления нескольких разных высказываний с одним именем или идентификатором называется нормализацией. [57]
Использование
[ редактировать ]Науки о жизни
[ редактировать ]LBD уже использовался различными способами для выявления новых связей между биомедицинскими объектами и новыми генами-кандидатами и методами лечения заболеваний. [62] [1]
Открытие лекарств
[ редактировать ]LBD нашел применение при разработке и перепрофилировании лекарств. [54] [63] а также прогнозирование побочных реакций на лекарства. [64] [65] [1]
Метод открытия, основанного на литературных данных, использовался для поиска методов лечения ряда заболеваний человека, в том числе:
- диабетическая ретинопатия [66]
- дилатационная кардиомиопатия [61]
- болезнь Паркинсона [67]
- рак простаты [63]
- рак желудка [68]
- рассеянный склероз [69]
Открытие функций генов и белков
[ редактировать ]Этот подход также использовался для предположения связи генов с конкретными заболеваниями. [70] как рак молочной железы . [71]
В контексте системной вакцинологии он использовался для идентификации белков, связанных с гамма-интерфероном и играющих роль в реакции на вакцины . [57]
Его также использовали для предложения механизмов для используемых в настоящее время лекарств. [72]
Открытие биомаркеров
[ редактировать ]LBD исследовался как инструмент для идентификации биомаркеров для диагностики и прогнозирования заболеваний, например, риска диабета 2 типа . [73]
Другое использование
[ редактировать ]Помимо предоставления научных гипотез о мире, LBD также используется для улучшения анализа данных посредством автоматического выявления возможных искажающих факторов с использованием медицинской литературы. [74]
Его также использовали для лучшего понимания этиологии заболеваний и связи различных заболеваний, например, для поиска генов, связывающих инфаркт миокарда и депрессию . [75] и связи между психиатрическими и соматическими заболеваниями. [76]
За пределами наук о жизни
[ редактировать ]LBD в основном используется в биомедицинской сфере, но также используется и за ее пределами, поскольку применяется для исследований в области разработки систем очистки воды , ускорения развития развивающихся стран и выявления перспективного исследовательского сотрудничества. [77] [78] [79]
См. также
[ редактировать ]- Система Стрелок
- Импликатура
- Скрытая семантическая индексация
- Метафора
- Анализ текста
- Биокурация
- БиоКреатив
Дополнительное чтение
[ редактировать ]- Уилсон, Патрик (1977). Общественное знание, частное незнание: к библиотечной и информационной политике . Издательская группа Гринвуд. п. 156. ISBN 0-8371-9485-7 .
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж г час я дж к л м н Крайтон, Гамаль; Бейкер, Саймон; Го, Юфань; Корхонен, Анна (15 мая 2020 г.). «Нейронные сети для открытых и закрытых исследований на основе литературы» . ПЛОС ОДИН . 15 (5): e0232891. Бибкод : 2020PLoSO..1532891C . doi : 10.1371/JOURNAL.PONE.0232891 . ПМК 7228051 . ПМИД 32413059 .
В эту статью включен текст, доступный по лицензии CC BY 4.0 .
- ^ Смальхейзер, Нил Р.; Суонсон, Дон Р. (ноябрь 1998 г.). «Использование Arrowsmith: компьютерный подход к формулированию и оценке научных гипотез». Компьютерные методы и программы в биомедицине . 57 (3): 149–153. дои : 10.1016/s0169-2607(98)00033-9 . ISSN 0169-2607 . ПМИД 9822851 .
- ^ Гордон, Майкл Д.; Линдси, Роберт К. (февраль 1996 г.). «На пути к системам поддержки открытий: тиражирование, повторное исследование и расширение работы Суонсона по основанному на литературе открытию связи между Рейно и рыбьим жиром». Журнал Американского общества информатики . 47 (2): 116–128. doi : 10.1002/(sici)1097-4571(199602)47:2<116::aid-asi3>3.0.co;2-1 . ISSN 0002-8231 .
- ^ Перейти обратно: а б Коэн, Тревор; Шваневельдт, Роджер; Виддоуз, Доминик (апрель 2010 г.). «Рефлексивная случайная индексация и косвенный вывод: масштабируемый метод обнаружения неявных связей» . Журнал биомедицинской информатики . 43 (2): 240–256. дои : 10.1016/j.jbi.2009.09.003 . ISSN 1532-0464 . ПМИД 19761870 .
- ^ Смальхейзер, Нил Р. (01 декабря 2017 г.). «Открытие заново Дона Суонсона: прошлое, настоящее и будущее открытий, основанных на литературе» . Журнал данных и информатики . 2 (4): 43–64. дои : 10.1515/jdis-2017-0019 . ПМЦ 5771422 . ПМИД 29355246 .
- ^ Перейти обратно: а б Суонсон, Дон Р. (1986). «Рыбий жир, синдром Рейно и неоткрытые общественные знания». Перспективы биологии и медицины . 30 (1): 7–18. дои : 10.1353/pbm.1986.0087 . ISSN 1529-8795 . ПМИД 3797213 . S2CID 33675760 .
- ^ Рикко, Жан Батист (май 1990 г.). «Пищевые добавки с рыбьим жиром у пациентов с феноменом Рейно: двойное слепое контролируемое проспективное исследование» . Журнал сосудистой хирургии . 11 (5): 733–734. дои : 10.1016/0741-5214(90)90229-4 . ISSN 0741-5214 .
- ^ Суонсон, Дон Р. (1988). «Мигрень и магний: одиннадцать забытых связей». Перспективы биологии и медицины . 31 (4): 526–557. дои : 10.1353/pbm.1988.0009 . ISSN 1529-8795 . ПМИД 3075738 . S2CID 12482481 .
- ^ Суонсон, Дон Р. (1990). «Соматомедин С и аргинин: неявные связи между взаимно изолированной литературой». Перспективы биологии и медицины . 33 (2): 157–186. дои : 10.1353/pbm.1990.0031 . ISSN 1529-8795 . ПМИД 2406696 . S2CID 41205674 .
- ^ Смальхейзер, Нил Р.; Суонсон, Дон Р. (сентябрь 1996 г.). «Связь эстрогена с болезнью Альцгеймера». Неврология . 47 (3): 809–810. дои : 10.1212/wnl.47.3.809 . ISSN 0028-3878 . ПМИД 8797484 . S2CID 9636182 .
- ^ Стегманн Дж., Громанн Г. Генерация гипотез на основе кластеризации кослов. Наукометрия. 2003;56:111–135. Цитируется Бехуисом
- ^ Бехуис, Таня (2006). «Концептуальная биология, открытие гипотез и анализ текста: наследие Свонсона» . Биомедицинские цифровые библиотеки . 3 :2. дои : 10.1186/1742-5581-3-2 . ПМК 1459187 . ПМИД 16584552 .
- ^ Смальхейзер, Нил Р. (26 июля 2011 г.). «Открытие на основе литературы: за пределами азбуки» . Журнал Ассоциации информационных наук и технологий . 63 (2): 218–224. дои : 10.1002/ASI.21599 .
- ^ Йетисген-Йылдыз, Мелиха; Пратт, Ванда (16 декабря 2008 г.). «Новая методология оценки систем обнаружения на основе литературы» . Журнал биомедицинской информатики . 42 (4): 633–643. дои : 10.1016/J.JBI.2008.12.001 . ПМИД 19124086 .
- ^ Хур, Чунгук; Шайлер, Адам Д.; Штаты, Дэвид Дж.; Фельдман, Ева Л. (2 февраля 2009 г.). «SciMiner: веб-инструмент для анализа литературы для идентификации целей и анализа функционального обогащения» . Биоинформатика . 25 (6): 838–840. doi : 10.1093/биоинформатика/btp049 . ISSN 1460-2059 . ПМЦ 2654801 . ПМИД 19188191 .
- ^ Перейти обратно: а б с д Йетисген-Йылдыз, Мелиха; Пратт, Ванда (4 января 2006 г.). «Использование статистических и основанных на знаниях подходов для открытий на основе литературы» . Журнал биомедицинской информатики . 39 (6): 600–611. дои : 10.1016/J.JBI.2005.11.010 . ПМИД 16442852 .
- ^ Смальхейзер, Нил Р.; Торвик, Ветле И. (2008), Бруза, Питер; Вибер, Марк (ред.), «Место литературных открытий в современной научной практике», « Литературные открытия , информатика и управление знаниями», Берлин, Гейдельберг: Springer, стр. 13–22, Bibcode : 2008lbd.. книга...13S , doi : 10.1007/978-3-540-68690-3_2 , ISBN 978-3-540-68690-3
- ^ «СТРЕЛКА: Старт» . .arrowsmith.psych.uic.edu . Проверено 4 марта 2022 г.
- ^ Перейти обратно: а б Пыйсало, Сампо; Бейкер, Саймон; Али, Имран; Хазельвиммер, Стефан; Шах, Теджас; Янг, Эндрю; Го, Юфань; Хёгберг, Йохан; Стениус, Улла; Нарита, Масаси; Корхонен, Анна (09.10.2018). «LION LBD: основанная на литературе система открытий в области биологии рака» . Биоинформатика . 35 (9): 1553–1561. doi : 10.1093/биоинформатика/bty845 . ISSN 1367-4803 . ПМК 6499247 . ПМИД 30304355 .
- ^ Вэй, Чи-Сюань; Као, Хун-Ю; Лу, Чжиюн (22 мая 2013 г.). «PubTator: веб-инструмент для анализа текста для помощи в биокурировании» . Исследования нуклеиновых кислот . 41 (П1): W518–W522. дои : 10.1093/нар/gkt441 . ISSN 1362-4962 . ПМК 3692066 . ПМИД 23703206 .
- ^ Бейкер, Саймон; Али, Имран; Силиньш, Илона; Пыйсало, Сампо; Го, Юфань; Хёгберг, Йохан; Стениус, Улла; Корхонен, Анна (14 июля 2017 г.). «Инструмент анализа признаков рака (CHAT): подход к анализу текста для организации и оценки научной литературы по раку» . Биоинформатика . 33 (24): 3973–3981. doi : 10.1093/биоинформатика/btx454 . ISSN 1367-4803 . ПМК 5860084 . ПМИД 29036271 .
- ^ Кэмерон, Делрой; Кавулуру, Рамакант; Риндфлеш, Томас К.; Шет, Амит П.; Тирунараян, Кришнапрасад; Боденрайдер, Оливье (07 февраля 2015 г.). «Автоматическое создание подграфов на основе контекста для открытия на основе литературы» . Журнал биомедицинской информатики . 54 : 141–157. дои : 10.1016/J.JBI.2015.01.014 . ПМЦ 4888806 . ПМИД 25661592 .
- ^ Христовский, Димитр; Кастрин, Андрей; Диневский, Деян; Риндфлеш, Томас К. (1 января 2015 г.). «Построение базы данных графов для семантического поиска на основе литературы» . Исследования в области медицинских технологий и информатики . 216 :1094. ПМИД 26262393 .
- ^ Прейсс, Юдита; Стивенсон, Марк; Гайзаускас, Роберт (13 мая 2015 г.). «Изучение типов отношений для открытий на основе литературы» . Журнал Американской ассоциации медицинской информатики . 22 (5): 987–992. дои : 10.1093/JAMIA/OCV002 . ПМЦ 4986660 . ПМИД 25971437 .
- ^ Ким, Ён Хван; Сон, Мин (24 апреля 2019 г.). «Контекстная модель ABC для открытий на основе литературы» . ПЛОС ОДИН . 14 (4): e0215313. Бибкод : 2019PLoSO..1415313K . doi : 10.1371/JOURNAL.PONE.0215313 . ПМК 6481912 . ПМИД 31017923 .
- ^ Томас, Пол Д.; Хилл, Дэвид П.; Ми, Хуайюй; Осуми-Сазерленд, Дэвид; Окен, Кимберли Ван; Карбон, Сет Дж.; Балхофф, Джеймс П.; Альбу, Лоран-Филипп; Хорошо, Бенджамин М.; Годе, Паскаль; Льюис, Сюзанна (01 октября 2019 г.). «Моделирование причинной активности генной онтологии (GO-CAM) выходит за рамки аннотаций GO и переходит к структурированному описанию биологических функций и систем» . Природная генетика . 51 (10): 1429–1433. дои : 10.1038/S41588-019-0500-1 . ПМК 7012280 . ПМИД 31548717 .
- ^ Христовский, Димитар; Петерлин, Борут; Митчелл, Джойс А.; Хамфри, Сюзанна М. (1 января 2003 г.). «Улучшение поддержки открытий на основе литературы за счет интеграции генетических знаний» . Исследования в области медицинских технологий и информатики . 95 : 68–73. ПМИД 14663965 .
- ^ Перейти обратно: а б Джелиер, Роб; Шуэми, Мартин Дж.; Шуэми, Мартин Дж.; Вельдховен, Антуан; Дорссерс, Ламберт CJ; Дженстер, Гвидо; Корс, Ян А.; Корс, Ян А. (12 июня 2008 г.). «Анни 2.0: многофункциональный инструмент для анализа текста для наук о жизни» . Геномная биология . 9 (6): R96. дои : 10.1186/GB-2008-9-6-R96 . ПМЦ 2481428 . ПМИД 18549479 .
- ^ Гопалакришнан, Вишравас; Джа, Кишлай; Джин, Вэй; Чжан, Айдун (01 мая 2019 г.). «Обзор подходов к открытиям, основанных на литературе, в биомедицинской области» . Журнал биомедицинской информатики . 93 : 103141. дои : 10.1016/j.jbi.2019.103141 . ISSN 1532-0464 . ПМИД 30857950 .
- ^ Христовский, Димитр; Джероски, Сашо; Петерлин, Борут; Рожич, Анамажирья (2000), «Поддержка открытий в медицине с помощью интеллектуального анализа библиографических баз данных по правилам ассоциации», Принципы интеллектуального анализа данных и открытия знаний , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 446–451, doi : 10.1007/3-540 -45372-5_49 , ISBN 978-3-540-41066-9
- ^ Вибер, Марк; Кляйн, Хенни; де Йонг-ван ден Берг, Лольке Т.В.; Вос, Рейн (2001). «Использование концепций в открытиях, основанных на литературе: моделирование открытий Суонсона по Рейно, рыбьему жиру и магнию от мигрени». Журнал Американского общества информатики и технологий . 52 (7): 548–557. дои : 10.1002/asi.1104 . ISSN 1532-2882 .
- ^ Пратт, Ванда; Йетисген-Йылдыз, Мелиха (2003). «ЛитЛинкер». Материалы 2-й международной конференции по захвату знаний . Нью-Йорк, Нью-Йорк, США: ACM Press. п. 105. дои : 10.1145/945645.945662 . ISBN 1581135831 . S2CID 2221335 .
- ^ ван дер Эйк, К. Кристиан; ван Маллиген, Эрик М.; Корс, Ян А.; Монс, Баренд; ван ден Берг, январь (2004). «Построение ассоциативного концептуального пространства для открытий на основе литературы». Журнал Американского общества информатики и технологий . 55 (5): 436–444. дои : 10.1002/asi.10392 . ISSN 1532-2882 .
- ^ Шринивасан, П.; Либбус, Б. (19 июля 2004 г.). «Mining MEDLINE для выявления неявных связей между пищевыми веществами и болезнями». Биоинформатика . 20 (Приложение 1): i290–i296. doi : 10.1093/биоинформатика/bth914 . ISSN 1367-4803 . ПМИД 15262811 .
- ^ Рен, Джонатан Д. (2004). «Расширение меры взаимной информации для ранжирования предполагаемых литературных отношений» . БМК Биоинформатика . 5 (1): 145. дои : 10.1186/1471-2105-5-145 . ПМК 526381 . ПМИД 15471547 .
- ^ Христовский, Димитар; Петерлин, Борут; Митчелл, Джойс А.; Хамфри, Сюзанна М. (март 2005 г.). «Использование открытий, основанных на литературе, для выявления генов-кандидатов болезней». Международный журнал медицинской информатики . 74 (2–4): 289–298. doi : 10.1016/j.ijmedinf.2004.04.024 . ISSN 1386-5056 . ПМИД 15694635 .
- ^ Йетисген-Йылдыз, Мелиха; Пратт, Ванда (декабрь 2006 г.). «Использование статистических и основанных на знаниях подходов для открытий на основе литературы» . Журнал биомедицинской информатики . 39 (6): 600–611. дои : 10.1016/j.jbi.2005.11.010 . ISSN 1532-0464 . ПМИД 16442852 .
- ^ Торвик, Ветле И.; Смальхейзер, Нил Р. (26 апреля 2007 г.). «Количественная модель для связывания двух разрозненных наборов статей в MEDLINE» . Биоинформатика . 23 (13): 1658–1665. doi : 10.1093/биоинформатика/btm161 . ISSN 1460-2059 . ПМИД 17463015 .
- ^ Фрайтерс, Р.; Хойперс, Б.; ван Бик, П.; Бууис, М.; ван Шайк, Р.; де Влиг, Дж.; Полман, Дж.; Алкема, В. (19 мая 2008 г.). «CoPub: основанный на литературе инструмент пополнения ключевых слов для анализа данных микрочипов» . Исследования нуклеиновых кислот . 36 (Веб-сервер): W406–W410. дои : 10.1093/нар/gkn215 . ISSN 0305-1048 . ПМЦ 2447728 . ПМИД 18442992 .
- ^ Петрие, Ингрид; Урбанеи, Таня; Честник, Боян; Мацедони-Лукшич, Марта (апрель 2009 г.). «Метод интеллектуального анализа литературы RaJoLink для выявления связей между биомедицинскими концепциями» . Журнал биомедицинской информатики . 42 (2): 219–227. дои : 10.1016/j.jbi.2008.08.004 . ISSN 1532-0464 . ПМИД 18771753 .
- ^ Христовский, Димитр; Кастрин, Андрей; Петерлин, Борут; Риндфлеш, Томас К. (2010), «Объединение семантических связей и данных микрочипов ДНК для генерации новых гипотез», Связывание литературы, информации и знаний для биологии , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 53–61, doi : 10.1007 /978-3-642-13131-8_7 , ISBN 978-3-642-13130-1 , S2CID 8957416
- ^ Кэмерон, Делрой; Кавулуру, Рамакант; Риндфлеш, Томас К.; Шет, Амит П.; Тирунараян, Кришнапрасад; Боденрейдер, Оливье (апрель 2015 г.). «Автоматическое создание подграфов на основе контекста для открытия на основе литературы» . Журнал биомедицинской информатики . 54 : 141–157. дои : 10.1016/j.jbi.2015.01.014 . ISSN 1532-0464 . ПМЦ 4888806 . ПМИД 25661592 .
- ^ Уоркман, Т. Элизабет; Фишман, Марсело; Кайрелли, Майкл Дж.; Наль, Дайан; Риндфлеш, Томас К. (01 апреля 2016 г.). «Spark, приложение, основанное на случайном открытии знаний» . Журнал биомедицинской информатики . 60 : 23–37. дои : 10.1016/j.jbi.2015.12.014 . ISSN 1532-0464 . ПМИД 26732995 .
- ^ Пэн, Юфан; Бонифилд, Гэри; Смальхейзер, Нил Р. (22 мая 2017 г.). «Пробелы в биомедицинской литературе: первоначальная характеристика и оценка стратегий открытий» . Границы в области метрик исследований и аналитики . 2 . дои : 10.3389/frma.2017.00003 . ISSN 2504-0537 . ПМЦ 5736374 . ПМИД 29271976 .
- ^ Генри, MS Сэм; Макиннес, Бриджит Т. (21 августа 2017 г.). «Открытия на основе литературы: модели, методы и тенденции» . Журнал биомедицинской информатики . 74 : 20–32. дои : 10.1016/J.JBI.2017.08.011 . ПМИД 28838802 .
- ^ Прейсс, Юдита; Стивенсон, Марк (31 мая 2017 г.). «Количественная оценка и фильтрация знаний, полученных в результате открытий, основанных на литературе» . БМК Биоинформатика . 18 (Приложение 7): 249. doi : 10.1186/S12859-017-1641-9 . ПМК 5471938 . ПМИД 28617217 .
- ^ Перейти обратно: а б Суонсон, Дон Р.; Смальхейзер, Нил Р. (апрель 1997 г.). «Интерактивная система поиска дополнительной литературы: стимул к научным открытиям» . Искусственный интеллект . 91 (2): 183–203. дои : 10.1016/s0004-3702(97)00008-8 . ISSN 0004-3702 .
- ^ Р. Вебер; М. Кляйн; Х. Аронсон; А.Р. Морк; Дж. Г. де Йонг-ван ден Берг; Л.Т. Вос (2000). «Текстовые открытия в биомедицине: архитектура DAD-системы» . Слушания. Симпозиум АМИА . Американская ассоциация медицинской информатики: 903–907. OCLC 678976989 . ПМЦ 2243779 . ПМИД 11080015 .
- ^ Христовский, Димитр; Джероски, Сашо; Петерлин, Борут; Рожич, Анамажирья (2000), «Поддержка открытий в медицине с помощью интеллектуального анализа библиографических баз данных по правилам ассоциации», Принципы интеллектуального анализа данных и открытия знаний , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 446–451, doi : 10.1007/3-540 -45372-5_49 , ISBN 978-3-540-41066-9
- ^ Эронен, Лаури; Хинтсанен, Петтери; Тойвонен, Ханну (2012), «Биомайн: сетевой ресурс биологических объектов для прогнозирования связей», Bisociative Knowledge Discovery , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 364–378, номер домена : 10.1007/978-3-642-31830-6_26 , ISBN 978-3-642-31829-0
- ^ Прейсс, Юдита; Стивенсон, Марк; Гайзаускас, Роберт (12 мая 2015 г.). «Изучение типов отношений для открытий на основе литературы» . Журнал Американской ассоциации медицинской информатики . 22 (5): 987–992. дои : 10.1093/jamia/ocv002 . ISSN 1527-974X . ПМЦ 4986660 . ПМИД 25971437 .
- ^ Йетисген-Йылдыз, Мелиха; Пратт, Ванда (август 2009 г.). «Новая методология оценки систем обнаружения на основе литературы» . Журнал биомедицинской информатики . 42 (4): 633–643. дои : 10.1016/j.jbi.2008.12.001 . ISSN 1532-0464 . ПМИД 19124086 .
- ^ Йетисген-Йылдыз, М.; Пратт, В. (2008), «Оценка систем обнаружения на основе литературы», Открытие на основе литературы , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 101–113, Бибкод : 2008lbd..book..101Y , doi : 10.1007 /978-3-540-68690-3_7 , ISBN 978-3-540-68685-9
- ^ Перейти обратно: а б Христовский, Димитр; Кастрин, Андрей; Петерлин, Борут; Риндфлеш, Томас К. (2010), «Объединение семантических связей и данных микрочипов ДНК для генерации новых гипотез», Связывание литературы, информации и знаний для биологии , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 53–61, doi : 10.1007 /978-3-642-13131-8_7 , ISBN 978-3-642-13130-1 , S2CID 8957416
- ^ Стегманн, Йоханнес; Громанн, Гюнтер (2003). «Генерация гипотез на основе кластеризации кослов». Наукометрия . 56 (1): 111–135. дои : 10.1023/А:1021954808804 . S2CID 14362816 .
- ^ Рен, доктор медицинских наук; Бекереджян Р.; Стюарт, Дж.А.; Шохет, Р.В.; Гарнер, HR (22 января 2004 г.). «Обнаружение знаний путем автоматической идентификации и ранжирования неявных отношений» . Биоинформатика . 20 (3): 389–398. doi : 10.1093/биоинформатика/btg421 . ISSN 1367-4803 . ПМИД 14960466 .
- ^ Перейти обратно: а б с Озгюр, Арзукан; Сян, Цзошуан; Радев, Драгомир Р.; Хэ, Юнцюнь (3 июня 2010 г.). «Литературное открытие сети интерферона-гамма и взаимодействия генов, опосредованного вакцинами» . Журнал биомедицины и биотехнологии . 2010 : 426479. doi : 10.1155/2010/426479 . ПМЦ 2896678 . ПМИД 20625487 .
- ^ Корхонен, Анна; Го, Юфань; Бейкер, Саймон; Йетисген-Йылдыз, Мелиха; Стениус, Улла; Нарита, Масаси; Лио, Пьетро (01 января 2015 г.). «Улучшение поиска на основе литературы с помощью расширенного анализа текста» . Методы вычислительного интеллекта для биоинформатики и биостатистики . Конспекты лекций по информатике. Том. 8623. стр. 89–98. дои : 10.1007/978-3-319-24462-4_8 . ISBN 978-3-319-24461-7 .
- ^ Прейсс, Юдита; Стивенсон, Марк (июль 2016 г.). «Влияние точности устранения неоднозначности смысла слова на открытия, основанные на литературе» . BMC Медицинская информатика и принятие решений . 16 (S1): 57. дои : 10.1186/s12911-016-0296-1 . ISSN 1472-6947 . ПМЦ 4959388 . ПМИД 27455071 . S2CID 45296293 .
- ^ Кастрин, Андрей; Христовски, Димитар (6 ноября 2008 г.). «Алгоритм быстрой классификации документов для устранения неоднозначности символов генов в системе поддержки открытий на основе литературы BITOLA» . Материалы ежегодного симпозиума AMIA . 2008 : 358–362. ПМЦ 2655979 . ПМИД 18998999 .
- ^ Перейти обратно: а б Габетта, Маттео; Ларица, Кристиана; Беллацци, Риккардо (1 января 2013 г.). «Система на основе Единой медицинской языковой системы (UMLS) для литературных открытий в медицине» . Исследования в области медицинских технологий и информатики . 192 : 412–416. ПМИД 23920587 .
- ^ Христовский, Димитр; Риндфлеш, Томас; Петерлин, Борут (01 января 2013 г.). «Использование открытий, основанных на литературе, для определения новых терапевтических подходов». Сердечно-сосудистые и гематологические средства в медицинской химии . 11 (1): 14–24. дои : 10.2174/1871525711311010005 . ISSN 1871-5257 . ПМИД 22845900 .
- ^ Перейти обратно: а б Чжан, Руй; Кайрелли, Майкл Дж.; Фишман, Марсело; Киликоглу, Халил; Риндфлеш, Томас К.; Пахомов Сергей Владимирович; Мелтон, Женевьева Б. (январь 2014 г.). «Использование литературных знаний и семантики для выявления потенциальных лекарств от рака простаты» . Раковая информатика . 13с1 (Приложение 1): 103–111. дои : 10.4137/cin.s13889 . ISSN 1176-9351 . ПМК 4216049 . ПМИД 25392688 .
- ^ Бенцшавель, Эрик (2016). «Выявление потенциальных нежелательных явлений, связанных с приемом лекарств, в твитах с использованием встроенных лексиконов» . Материалы студенческого исследовательского семинара ACL 2016 . Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 15–21. дои : 10.18653/v1/p16-3003 . S2CID 3008644 .
- ^ Шан, Нин; Сюй, Хуа; Риндфлеш, Томас К.; Коэн, Тревор (декабрь 2014 г.). «Определение вероятных побочных реакций на лекарства с использованием знаний, извлеченных из литературы» . Журнал биомедицинской информатики . 52 : 293–310. дои : 10.1016/j.jbi.2014.07.011 . ISSN 1532-0464 . ПМК 4261011 . ПМИД 25046831 .
- ^ Мавер, Алесь; Христовский, Димитр; Риндфлеш, Томас К.; Петерлин, Борут (24 ноября 2013 г.). «Интеграция данных омических исследований с открытиями, основанными на литературе, для выявления новых методов лечения неоваскуляризации при диабетической ретинопатии» . БиоМед Исследования Интернэшнл . 2013 : e848952. дои : 10.1155/2013/848952 . ISSN 2314-6133 . ПМЦ 3857903 . ПМИД 24350292 .
- ^ Костофф, Рональд Н.; Бриггс, Майкл Б. (февраль 2008 г.). «Литературное открытие (LRD): потенциальные методы лечения болезни Паркинсона». Технологическое прогнозирование и социальные изменения . 75 (2): 226–238. doi : 10.1016/j.techfore.2007.11.007 . ISSN 0040-1625 .
- ^ Донг, Вэйвэй; Лю, Исюань; Чжу, Вэйцзе; Моу, Цюань; Ван, Цзиньлян; Ху, Йи (20 июня 2014 г.). «Моделирование открытия Суонсона, основанного на литературе: лечение анандамидом подавляет рост клеток рака желудка in vitro и in silico» . ПЛОС ОДИН . 9 (6): e100436. Бибкод : 2014PLoSO...9j0436D . doi : 10.1371/JOURNAL.PONE.0100436 . ПМК 4065097 . ПМИД 24949851 .
- ^ Костофф, Рональд Н.; Бриггс, Майкл Б.; Лайонс, Теренс Дж. (февраль 2008 г.). «Литературное открытие (LRD): потенциальные методы лечения рассеянного склероза». Технологическое прогнозирование и социальные изменения . 75 (2): 239–255. doi : 10.1016/j.techfore.2007.11.002 . ISSN 0040-1625 .
- ^ Христовский, Димитар; Б, Петерлин; С, Дзероски (01 января 2001 г.). «Система поддержки открытий на основе литературы и ее применение для идентификации генов болезней» . Слушания. Ежегодный симпозиум AMIA : 928. PMC 2243305 .
- ^ Саркар, Индра Нил; Агравал, Абха (2006). «Открытие кластеров генов на основе литературы с использованием филогенетических методов» . AMIA ... Материалы ежегодного симпозиума. Симпозиум АМИА . 2006 : 689–693. ISSN 1942-597Х . ПМК 1839645 . ПМИД 17238429 .
- ^ Алерс, Кэролайн Б.; Христовский, Димитр; Киликоглу, Халил; Риндфлеш, Томас К. (11 октября 2007 г.). «Использование парадигмы открытий, основанной на литературе, для исследования механизмов действия лекарств» . AMIA ... Материалы ежегодного симпозиума. Симпозиум АМИА . 2007 : 6–10. ISSN 1942-597Х . ПМЦ 2655783 . ПМИД 18693787 .
- ^ Шринивасан, Мифили; Блэкберн, Коринн; Мохамед, Мохамед; Сивагами, А.В.; Блюм, Дженис С. (14 мая 2015 г.). «Литературное открытие биомаркеров слюны для сахарного диабета 2 типа» . Биомаркерная информация . 10 :39–45. дои : 10.4137/BMI.S22177 . ПМК 4433061 . ПМИД 26005324 .
- ^ Малек, Скотт А.; Вэй, Пэн; Сюй, Хуа; Бернстам, Элмер В.; Минени, Сахити; Коэн, Тревор (01 января 2016 г.). «Литературное обнаружение искажений в наблюдательных клинических данных» . Материалы ежегодного симпозиума AMIA . 2016 : 1920–1929. ПМК 5333204 . ПМИД 28269951 .
- ^ Дай, Чжэньго; Ли, Цянь; Ян, Гуан; Ван, Йини; Лю, Ян; Чжэн, Чжилей; Ту, Инфэн; Ян, Шуан; Ю, Бо (11 июня 2019 г.). «Использование основанных на литературе открытий для идентификации генов-кандидатов, отвечающих за взаимодействие между инфарктом миокарда и депрессией» . BMC Медицинская генетика . 20 (1): 104. дои : 10.1186/S12881-019-0841-8 . ПМК 6560897 . ПМИД 31185929 .
- ^ Вос, Рейн; Аартс, Сил; Маллиген, Эрик М. ван; Метсемейкерс, Иов; Бокстел, Мартин П. ван; Верхей, Франс Р.Дж.; Аккер, Марьян ван ден (17 июня 2013 г.). «Обнаружение потенциально новых моделей мультиморбидности психиатрических и соматических заболеваний: изучение использования литературных открытий в исследованиях первичной медико-санитарной помощи» . Журнал Американской ассоциации медицинской информатики . 21 (1): 139–145. doi : 10.1136/AMIAJNL-2012-001448 . ПМЦ 3912726 . ПМИД 23775174 .
- ^ Костофф, Рональд Н.; Солка, Джеффри Л.; Рашенберг, Роберт Л.; Вятт, Джеффри А. (февраль 2008 г.). «Литературное открытие (LRD): очистка воды». Технологическое прогнозирование и социальные изменения . 75 (2): 256–275. doi : 10.1016/j.techfore.2007.11.009 . ISSN 0040-1625 .
- ^ Гордон, доктор медицины; Авад, Н.Ф. (2008), «Вершина айсберга: поиск инноваций у основания пирамиды», « Открытие на основе литературы » , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 23–37, Bibcode : 2008lbd.. книга...23G , doi : 10.1007/978-3-540-68690-3_3 , ISBN 978-3-540-68685-9
- ^ Христовский, Димитр; Кастрин, Андрей; Риндфлеш, Томас К. (25 августа 2015 г.). «Рекомендации по междоменному сотрудничеству на основе семантики в науках о жизни». Материалы Международной конференции IEEE/ACM 2015 г. по достижениям в области анализа и майнинга социальных сетей, 2015 г. Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 805–806. дои : 10.1145/2808797.2809300 . ISBN 9781450338547 . S2CID 8079114 .