Национальный центр текстового анализа
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Учредил | 2004 |
---|---|
Головное учреждение | Департамент компьютерных наук Манчестерского университета |
Принадлежность | Манчестерский университет |
Директор | София Ананиаду |
Расположение | , |
Веб-сайт | www |
Национальный центр текстового анализа ( NACTeM ) [1] — это финансируемый государством центр интеллектуального анализа текста (TM). Он был создан для предоставления поддержки, консультаций и информации о технологиях НМ, а также для распространения информации в более широком сообществе НМ, а также для предоставления услуг и инструментов в ответ на требования академического сообщества Соединенного Королевства.
Программные инструменты и услуги, которые предоставляет NaCTeM , позволяют исследователям применять методы интеллектуального анализа текста для решения проблем в конкретных областях их интересов — примеры этих инструментов приведены ниже. Помимо предоставления услуг, центр также участвует и вносит значительный вклад в исследовательское сообщество по интеллектуальному анализу текста как на национальном, так и на международном уровне в таких инициативах, как Europe PubMed Central .
Центр расположен в Манчестерском институте биотехнологии и управляется и организуется кафедрой компьютерных наук Манчестерского университета . NaCTeM обладает опытом в области обработки естественного языка и извлечения информации , включая распознавание названных объектов и извлечение сложных отношений (или событий), которые существуют между именованными объектами, а также параллельные и распределенные системы интеллектуального анализа данных в биомедицинских и клинических приложениях.
Услуги
[ редактировать ]Срок
[ редактировать ]TerMine — это доменно-независимый метод автоматического распознавания терминов, который можно использовать для поиска наиболее важных терминов в документе и автоматического их ранжирования. [2]
АкроМайн
[ редактировать ]AcroMine находит все известные расширенные формы сокращений в том виде, в котором они появляются в записях Medline , или, наоборот, его можно использовать для поиска возможных сокращений расширенных форм в том виде, в каком они ранее появлялись в Medline, и устраняет их неоднозначность. [3]
Средний
[ редактировать ]Medie — это интеллектуальная поисковая система для семантического поиска предложений, содержащих биомедицинские корреляции, из рефератов Medline. [4] [5]
Готово +
[ редактировать ]Facta+ — это поисковая система Medline для поиска ассоциаций между биомедицинскими концепциями. [6]
Факты+ Визуализатор
[ редактировать ]Facta+ Visualizer — это веб-приложение, которое помогает понять результаты поиска FACTA+ посредством интуитивной графической визуализации. [7]
КЛЕИО
[ редактировать ]KLEIO — это многогранная система поиска семантической информации по рефератам Medline.
Европа ЧВК EvidenceFinder
[ редактировать ]Europe PMC EvidenceFinder Europe PMC EvidenceFinder помогает пользователям исследовать факты, затрагивающие интересующие организации, в полнотекстовых статьях базы данных Europe PubMed Central . [8]
EUPMC Evidence Finder для анатомических образований с мета-знаниями
[ редактировать ]EUPMC Evidence Finder для анатомических объектов с мета-знаниями аналогичен Europe PMC EvidenceFinder, позволяя исследовать факты, связанные с анатомическими объектами, в полнотекстовых статьях базы данных Europe PubMed Central. Факты можно фильтровать по различным аспектам их интерпретации (например, отрицание, уровень определенности, новизна).
Инфо-ПабМед
[ редактировать ]Info-PubMed предоставляет информацию и графическое представление биомедицинских взаимодействий, извлеченных из Medline с использованием технологии глубокого семантического анализа . Это дополняется словарем терминов, состоящим из более чем 200 000 названий белков / генов и идентификаций типов заболеваний и организмов .
Протоколы клинических испытаний (ASCOT)
[ редактировать ]ASCOT — это эффективное приложение для поиска с семантическим расширением, адаптированное для документов клинических исследований. [9]
История медицины (HOM)
[ редактировать ]HOM - система семантического поиска по архивам исторических медицинских документов.
Ресурсы
[ редактировать ]Биолексикон
[ редактировать ]BioLexicon — это крупномасштабный терминологический ресурс в области биомедицины. [10]
Блестящий
[ редактировать ]GENIA — это сборник справочных материалов для разработки систем биомедицинского анализа текста.
ГРЕЧЕСКИЙ
[ редактировать ]GREC — это семантически аннотированный корпус рефератов Medline, предназначенный для обучения системам и/или ресурсам IE, которые используются для извлечения событий из биомедицинской литературы. [11]
Метаболит и ферментный корпус
[ редактировать ]Это корпус рефератов Medline, снабженных экспертами аннотациями с названиями метаболитов и ферментов.
Анатомия Корпора
[ редактировать ]Коллекция корпусов, вручную аннотированных мелкозернистыми, независимыми от вида анатомическими объектами, предназначенная для облегчения разработки систем интеллектуального анализа текста, которые могут выполнять подробный и всесторонний анализ биомедицинского научного текста. [12] [13]
Корпус метазнаний
[ редактировать ]Это расширение корпуса событий GENIA, в котором события обогащаются различными уровнями информации, касающейся их интерпретации. Цель состоит в том, чтобы позволить системам быть обученными, которые могут отличать события от фактической информации или экспериментального анализа, определенной информации от спекулятивной информации и т. д. [14]
Проекты
[ редактировать ]Арго
[ редактировать ]Целью проекта Argo является разработка инструментария для анализа (в первую очередь аннотирования) текстовых данных. Инструментальные средства, доступные как веб-приложение, поддерживают комбинацию элементарных компонентов обработки текста для формирования комплексных рабочих процессов обработки. Он предоставляет функциональные возможности для ручного вмешательства в автоматический процесс аннотирования путем исправления или создания новых аннотаций, а также облегчает совместную работу пользователей, предоставляя возможности совместного использования ресурсов, принадлежащих пользователям. Argo приносит пользу таким пользователям, как дизайнеры текстового анализа, предоставляя интегрированную среду для разработки рабочих процессов обработки; аннотаторы/кураторы, предоставляя функции ручного аннотирования, поддерживаемые автоматической предварительной и постобработкой; и разработчиков, предоставляя рабочую среду для тестирования и оценки текстовой аналитики.
Большой механизм
[ редактировать ]Большие механизмы — это большие объяснительные модели сложных систем, в которых взаимодействия имеют важные причинные последствия. Хотя сбор больших данных все больше автоматизируется, создание больших механизмов остается в основном человеческим усилием, которое становится все более сложной задачей из-за фрагментации и распространения знаний. Возможность автоматизировать строительство больших механизмов может оказать большое влияние на научные исследования. Это один из ряда различных проектов, составляющих программу больших механизмов, финансируемую DARPA , цель которой состоит в том, чтобы собрать всеобъемлющий большой механизм на основе литературы и предыдущих экспериментов и использовать его для вероятностной интерпретации новых данных о паномике пациентов. Мы объединим машинное чтение литературы о раке с вероятностным рассуждением по заявлениям о раке, используя специально разработанные онтологии, компьютерное моделирование механизмов рака (путей), автоматизированную генерацию гипотез для расширения знаний о механизмах и «ученого-робота», который проводит эксперименты для проверки. гипотезы. Повторяющийся цикл анализа текста, моделирования, экспериментального тестирования и обновления мировоззрения призван привести к расширению знаний о механизмах рака.
Текст пути
[ редактировать ]Pathtext/Refine — это система, предназначенная для интеграции визуализатора пути, систем интеллектуального анализа текста и инструментов аннотаций. [15] [16]
ОБИЛЬНЫЙ
[ редактировать ]Этот проект направлен на создание хранилища знаний о филиппинском биоразнообразии путем объединения соответствующего опыта и ресурсов филиппинских партнеров с анализом больших данных на основе анализа текста Национального центра анализа текста Манчестерского университета. Репозиторий будет представлять собой синергию различных типов информации, например, таксономической, распространенной, экологической, биомолекулярной, биохимической, предоставляя таким образом пользователям всестороннее представление об интересующих видах, что позволит им (1) проводить прогнозный анализ распределения видов. и (2) исследовать потенциальное медицинское применение натуральных продуктов, полученных из филиппинских видов.
Европейский проект ЧВК
[ редактировать ]Это сотрудничество с группой Text-Mining в Европейском институте биоинформатики (EBI) и Mimas (центр обработки данных) , формирующее пакет работ в проекте Europe PubMed Central (ранее UKPMC), хостингом и координацией которого занимается Британская библиотека . Europe PMC в целом образует европейскую версию хранилища документов PubMed Central в сотрудничестве с Национальными институтами здравоохранения (NIH) в США. Europe PMC финансируется консорциумом ключевых финансирующих организаций, финансирующих биомедицинские исследования. Вклад в этот крупный проект заключается в применении решений для интеллектуального анализа текста для улучшения поиска информации и открытия знаний. По существу, это крупномасштабное применение технологии, разработанной в других проектах NaCTeM, и являющееся важным ресурсом для биомедицинского сообщества.
Горное дело Биоразнообразие
[ редактировать ]Этот проект направлен на преобразование Библиотеки наследия биоразнообразия (BHL) в социальный цифровой библиотечный ресурс нового поколения, который будет способствовать изучению и обсуждению (посредством интеграции с социальными сетями) устаревших научных документов по биоразнообразию мировым сообществом и повышению осведомленности об изменениях. биоразнообразия с течением времени среди широкой общественности. Проект объединяет в BHL новые методы анализа текста, визуализацию, краудсорсинг и социальные сети. Полученный в результате цифровой ресурс обеспечит полностью взаимосвязанный и индексированный доступ ко всему содержимому документов библиотеки BHL посредством семантически расширенных и интерактивных возможностей просмотра и поиска, что позволит пользователям легко и эффективно находить именно интересующую их информацию.
Горное дело для общественного здравоохранения
[ редактировать ]Этот проект направлен на проведение новых исследований в области анализа текста и машинного обучения, чтобы изменить способ общественного здравоохранения ( EBPH проведения научно обоснованных обзоров ). Цели проекта включают разработку новых методов анализа текста без присмотра для выявления сходства терминов, поддержку скрининга во время обзоров EBPH, а также создание новых алгоритмов для ранжирования и визуализации значимых ассоциаций нескольких типов в динамическом и итеративном порядке. Эти недавно разработанные методы будут оцениваться в обзорах EBPH на основе реализации пилотного проекта, чтобы определить уровень трансформации в обзорах EBPH.
Ссылки
[ редактировать ]- ^ Ананиаду С (2007). «Национальный центр интеллектуального анализа текста: взгляд на будущее» . Ариадна (53).
- ^ Франци К., Ананиаду С. и Мима Х. (2007). «Автоматическое распознавание терминов, состоящих из нескольких слов» (PDF) . Международный журнал цифровых библиотек . 3 (2): 117–132.
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Окадзаки Н., Ананиаду С. (2006). «Создание словаря сокращений с использованием подхода распознавания терминов» . Биоинформатика . 22 (24): 3089–95. doi : 10.1093/биоинформатика/btl534 . ПМИД 17050571 .
- ^ Мияо Ю., Охта Т., Масуда К., Цуруока Ю., Ёсида К., Ниномия Т. и Цудзи Дж. (2006). Семантический поиск для точной идентификации реляционных концепций в больших текстовых базах . Материалы 21-й Международной конференции по компьютерной лингвистике и 44-го ежегодного собрания Ассоциации компьютерной лингвистики. стр. 1017–1024. дои : 10.3115/1220175.1220303 .
{{cite conference}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ «МЕДИ» . НаКТеМ . Проверено 25 марта 2022 г.
- ^ Цуруока Ю., Цудзи Дж., Ананиаду С. (2008). «ФАКТА: текстовая поисковая система для поиска связанных биомедицинских концепций» . Биоинформатика . 24 (21): 2559–60. doi : 10.1093/биоинформатика/btn469 . ПМЦ 2572701 . ПМИД 18772154 .
- ^ Цуруока, Ю; Мива, М; Хамамото, К; Цудзи, Дж; Ананиаду, С (2011). «Обнаружение и визуализация косвенных связей между биомедицинскими концепциями» . Биоинформатика . 27 (13): i111–9. doi : 10.1093/биоинформатика/btr214 . ПМК 3117364 . ПМИД 21685059 .
- ^ Европейский консорциум PMC (2014 г.). «Европа PMC: полнотекстовая база данных литературы по наукам о жизни и платформа для инноваций» . Исследования нуклеиновых кислот . 43 (Д1): Д1042–Д1048. дои : 10.1093/nar/gku1061 . ПМК 4383902 . ПМИД 25378340 .
- ^ Корконцелос И., Му Т. и Ананиаду С. (2012). «ASCOT: веб-сервис на основе интеллектуального анализа текста для эффективного поиска и помощи в создании клинических испытаний» . BMC Медицинская информатика и принятие решений . 12 (Приложение 1): S3. дои : 10.1186/1472-6947-12-S1-S3 . ПМЦ 3339391 . ПМИД 22595088 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Томпсон, П., Макнот, Дж., Монтеманьи, С., Кальцолари, Н., дель Гратта, Р., Ли, В., Марки, С., Моначини, М., Пезик, П., Куочи, В. , Рупп, С.Дж., Сасаки, Й., Вентури, Г., Ребхольц-Шуман, Д. и Ананиаду, С. (2011). «Биолексикон: крупномасштабный терминологический ресурс для биомедицинского анализа текстов» . БМК Биоинформатика . 12 :397. дои : 10.1186/1471-2105-12-397 . ПМК 3228855 . ПМИД 21992002 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Томпсон П., Икбал С.А., Макнот Дж. и Ананиаду С. (2009). «Создание аннотированного корпуса для поддержки извлечения биомедицинской информации» . БМК Биоинформатика . 10 :349. дои : 10.1186/1471-2105-10-349 . ПМЦ 2774701 . ПМИД 19852798 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Пюйсало С., Охта Т., Мива М., Чо Х.-К., Цудзи Дж. и Ананиаду С. (2012). «Извлечение событий на нескольких уровнях биологической организации» . Биоинформатика . 28 (18): i575–i581. doi : 10.1093/биоинформатика/bts407 . ПМЦ 3436834 . ПМИД 22962484 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Пийсало С. и Ананиаду С. (2014). «Распознавание упоминаний об анатомических объектах в литературном масштабе» . Биоинформатика . 30 (6): 868–875. doi : 10.1093/биоинформатика/btt580 . ПМЦ 3957068 . ПМИД 24162468 .
- ^ Томпсон П., Наваз Р., Макнот Дж. и Ананиаду С. (2011). «Обогащение корпуса биомедицинских событий аннотациями метазнаний» . БМК Биоинформатика . 12 :393. дои : 10.1186/1471-2105-12-393 . ПМЦ 3222636 . ПМИД 21985429 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Анон (2010). «ПутьТекст/Уточнить проект» . nactem.ac.uk . Архивировано из оригинала 22 января 2022 года.
- ^ Брайан Кемпер; Такуя Мацузаки; Юкико Мацуока; Ёсимаса Цуруока; Хироаки Китано; София Ананиаду ; Дзюнъити Цудзи (1 июня 2010 г.). «PathText: интегратор интеллектуального анализа текста для визуализации биологических путей» . Биоинформатика . 26 (12): i374-81. doi : 10.1093/БИОИНФОРМАТИКА/BTQ221 . ISSN 1367-4803 . ПМЦ 2881405 . ПМИД 20529930 . Викиданные Q33896337 .