Биокомпьютерный объект
Аббревиатура | БКО |
---|---|
Статус | Активная рабочая группа IEEE [ мертвая ссылка ] |
Сопутствующие стандарты | Общий язык рабочего процесса |
Лицензия | BSD-3-пункт |
Веб-сайт | ОСФ |
Проект BioCompute Object ( BCO ) — это инициатива сообщества по созданию структуры для стандартизации и совместного использования вычислений и анализов, полученных в результате высокопроизводительного секвенирования (HTS — также называемого секвенированием следующего поколения или массово-параллельным секвенированием ). С тех пор проект был стандартизирован как IEEE 2791-2020, а файлы проекта хранятся в репозитории с открытым исходным кодом . [1] В от 22 июля 2020 года выпуске Федерального реестра было объявлено, что FDA теперь поддерживает использование BioCompute (официально известного как IEEE 2791-2020) в нормативных документах, а также включение стандарта в Каталог стандартов данных для подачи данных HTS. в NDA, ANDA, BLA и IND в CBER , CDER и CFSAN .
Первоначально начавшийся как совместный контракт между Университетом Джорджа Вашингтона и Управлением по контролю за продуктами и лекарствами , проект разросся и теперь включает в себя более 20 университетов, биотехнологические компании, государственно-частные партнерства и фармацевтические компании, включая Seven Bridges и Гарвардскую медицинскую школу . [2] BCO стремится облегчить обмен рабочими процессами HTS между различными организациями, такими как FDA, фармацевтические компании, контрактные исследовательские организации, поставщики биоинформатических платформ и академические исследователи. Из-за деликатного характера документации, предоставляемой регулирующим органам, можно публиковать лишь несколько прямых ссылок на материалы. Тем не менее, в настоящее время проект финансируется для обучения рецензентов и администраторов FDA чтению и интерпретации BCO, и в настоящее время имеется 4 публикации, которые либо представлены, либо почти представлены.
Фон
[ редактировать ]Одной из самых больших проблем в биоинформатике является документирование и обмен научными рабочими процессами таким образом, чтобы вычисления и их результаты могли быть проверены экспертами или надежно воспроизведены. [3] Биоинформатические конвейеры обычно используют несколько частей программного обеспечения, каждая из которых обычно имеет несколько доступных версий, несколько входных параметров, несколько выходов и, возможно, конфигурации для конкретной платформы. Как и в случае с экспериментальными параметрами в лабораторном протоколе, небольшие изменения в вычислительных параметрах могут оказать большое влияние на научную достоверность результатов. BioCompute Framework обеспечивает объектно-ориентированную структуру , на основе которой можно создать BCO, содержащий подробную информацию о конвейере и способах его использования, поставить цифровую подпись и поделиться им. Концепция BioCompute изначально была разработана для удовлетворения потребностей регуляторных исследований и проверки FDA в оценке, проверке и проверке данных геномики. Однако структура биокомпьютеров следует принципам FAIR Data. [4] и может широко использоваться для обеспечения связи и взаимодействия между различными платформами, отраслями, учеными и регулирующими органами. [5]
Утилита
[ редактировать ]В качестве стандартизации геномных данных объекты BioCompute в основном полезны трем группам пользователей: 1) академическим исследователям, проводящим новые генетические эксперименты, 2) фармацевтическим/биотехнологическим компаниям, желающим представить работу в FDA на рассмотрение регулирующих органов, и 3) клиническим учреждения (больницы и лаборатории), предлагающие генетические тесты и персонализированную медицину . Полезность для академических исследователей заключается в способности воспроизводить экспериментальные данные более точно и с меньшей неопределенностью. Полезность для организаций, желающих представить работу в FDA, заключается в упрощенном подходе, опять же с меньшей неопределенностью и возможностью более точно воспроизводить работу. Для клинических условий крайне важно, чтобы данные HTS и клинические метаданные передавались точным способом, в идеале стандартизированным способом, который может быть прочитан любой заинтересованной стороной, включая партнеров по регулирующим органам.
Формат
[ редактировать ]Объект BioCompute имеет формат json и содержит как минимум все версии программного обеспечения и параметры, необходимые для оценки или проверки вычислительного конвейера. Он также может содержать входные данные в виде файлов или ссылок, эталонных геномов или исполняемых компонентов Docker. Объект BioCompute можно интегрировать с HL7 FHIR в качестве ресурса происхождения. [6] В стадии разработки также находятся многочисленные совместные реализации, которые используют ориентированный на отчеты формат BCO, включая CWL (один из которых является частью действующего финансируемого государством государственного контракта с соучредителем CWL на пилотирование и создание документации для совместного BCO-CWL, а также примеры) и РО. [7]
Консорциум БСО
[ редактировать ]Рабочая группа BioCompute Object предоставила различным заинтересованным сторонам возможность внести свой вклад в текущую практику BCO. Эта рабочая группа была сформирована во время подготовки к семинару HTS по вычислительным стандартам для регуляторных наук 2017 года и первоначально состояла из участников семинара. Рост и работа рабочей группы BCO, ставшая прямым результатом взаимодействия различных заинтересованных сторон из всех заинтересованных сообществ, завершилась принятием официального стандарта IEEE 2791-2020 , который был утвержден в январе 2020 года. Государственно-частное партнерство был создан между GWU и CBER и стал легкой точкой входа для новых людей или учреждений в проект BCO для участия в обсуждении лучших практик для объектов.
Реализации
[ редактировать ]Простой биокомпьютер пакета R [8] может создавать, проверять и экспортировать объекты BioCompute. Genomics Compliance Suite — это приложение Shiny, предлагающее функции, аналогичные регулярным выражениям, которые есть во всех современных текстовых редакторах. Существует несколько разработанных внутри компании пакетов программного обеспечения с открытым исходным кодом и веб-приложений, реализующих спецификацию BioCompute, три из которых были развернуты в общедоступном AWS EC2 облаке . К ним относятся экземпляр высокопроизводительной интегрированной виртуальной среды , портал BioCompute Portal. [9] (веб-приложение на основе форм, которое может создавать и редактировать объекты BioCompute на основе стандарта IEEE-2791-2020 , а также экземпляр Galaxy , совместимый с BioCompute .
Некоторые платформы биоинформатики имеют встроенную поддержку Biocompute, которая позволяет пользователю автоматически создавать BCO из рабочего процесса и редактировать описательный контент.
- DNAnexus и PrecisionFDA упрощают создание BCO за счет импорта рабочих процессов, что позволяет пользователям редактировать описательный контент. Платформа поддерживает импорт и экспорт метаданных сценариев WDL и CWL и предлагает инструмент BCONexus, который представляет собой высокоуровневый, не требующий платформы инструмент с графическим пользовательским интерфейсом, который позволяет пользователю объединять BCO.
- Seven Bridges Genomics и Cancer Genomics Cloud от Velsera также поддерживают BioCompute, обеспечивая прямое предварительное заполнение полей BCO из рабочих процессов.
- BioCompute также был интегрирован в HIVE и основной экземпляр Galaxy, которые одинаково позволяют пользователям автоматически генерировать BCO и редактировать контент на этих платформах.
- BioCompute также был реализован в рамках партнерского проекта Common Fund Data Elements Playbook Partnership. Эта реализация позволяет пользователю сохранять рабочий процесс, когда он удовлетворен результатами, что способствует отслеживанию через сеть ресурсов с независимыми версиями, позволяя пользователям сохранять запросы и аннотировать их для будущего использования, совместного использования или повторяемости в соответствии с его роль в развитии практики биоинформатики.
Интеграция с платформами призвана улучшить обработку данных и совместную работу, а также предоставить пользователям эффективные способы выполнения рабочего процесса, а графическое представление BCO часто является более интуитивным способом просмотра или чтения BCO.
Ссылки
[ редактировать ]- ^ Симонян В., Гёкс Дж., Мазумдер Р. Биокомпьютерные объекты — шаг к оценке и проверке биомедицинских научных вычислений. PDA журнал фармацевтической науки и технологий. 2017;71(2):136-146. doi:10.5731/pdajpst.2016.006734.
- ^ «Спецификации объектов BioCompute для улучшения анализа геномных данных» . www.europeanpharmaceuticalreview.com . Проверено 21 декабря 2017 г.
- ^ Сандве, Гейр Кьетил; Некрутенко Антон; Тейлор, Джеймс; Ховиг, Эйвинд (24 октября 2013 г.). «Десять простых правил воспроизводимых вычислительных исследований» . PLOS Вычислительная биология . 9 (10): e1003285. Бибкод : 2013PLSCB...9E3285S . дои : 10.1371/journal.pcbi.1003285 . ПМК 3812051 . ПМИД 24204232 .
- ^ Уилкинсон, Марк Д.; Дюмонтье, Мишель; Ольберсберг, Эйсбранд Ян; Эпплтон, Габриель; Экстон, Майлз; Баак, Арье; Бломберг, Никлас; Бойтен, Ян-Виллем; Сантос, Луис Бонино да Силва (15 марта 2016 г.). «Руководящие принципы FAIR по управлению и рациональному использованию научных данных» . Научные данные . 3 : 160018. Бибкод : 2016NatSD...360018W . дои : 10.1038/sdata.2016.18 . ПМЦ 4792175 . ПМИД 26978244 .
- ^ Альтеровиц, Гил; Дин, Деннис А.; Гобл, Кэрол; Крузо, Майкл Р.; Сойланд-Рейес, Стиан; Белл, Аманда; Хейс, Анаис; Кинг, Чарльз Хэдли Х.; Йохансон, Элейн; Томпсон, Элейн Э.; Дональдсон, Эрик; Цанг, Синьи С.; Гёкс, Джереми; Алмейда, Йонас С.; Го, Лидия; Вальдерхауг, Марк; Уолш, Пол; Кахсай, Робель; Блум, Тоби; Лай, Юйчин; Симонян, Ваан; Мазумдер, Раджа (21 сентября 2017 г.). «Возможность прецизионной медицины посредством стандартного обмена информацией о происхождении, анализе и результатах NGS» . биоRxiv . 16 (12): 191783. дои : 10.1101/191783 . ПМК 6338479 . PMID 30596645 – через www.biorxiv.org.
- ^ «Пример-происхождение-биокомпьютерный-объект» . HL7 FHIR, выпуск 3 (STU) .
- ^ Сойланд-Рейес, Стиан (01 сентября 2020 г.), hive-cwl-examples: Упаковка объектов BioCompute с использованием RO-Crate
- ^ «CRAN – Пакет биокомпьютеров» . cran.r-project.org . Проверено 28 ноября 2019 г.
- ^ «Биокомпьютерный портал» . github.com/biocompute-objects . Проверено 25 июня 2020 г.