Биопроводник
![]() | |
Стабильная версия | 3.19 / 1 мая 2024 г |
---|---|
Операционная система | Linux , MacOS , Windows |
Платформа | язык программирования R |
Тип | Биоинформатика |
Лицензия | Художественная лицензия 2.0 |
Веб-сайт | www |
Bioconductor — это бесплатный программный проект с открытым исходным кодом и открытой разработкой для анализа и понимания геномных данных, полученных в ходе лабораторных экспериментов в области молекулярной биологии .
Bioconductor основан в основном на статистическом языке программирования R , но содержит элементы других языков программирования. он выпускает два выпуска Ежегодно , которые следуют за полугодовыми выпусками R. В любой момент существует версия выпуска , соответствующая выпущенной версии R, и версия для разработки , которая соответствует версии R для разработки. Большинство пользователей будут найти версию выпуска, соответствующую их потребностям. Кроме того, существует множество пакетов аннотаций генома , которые в основном, но не исключительно, ориентированы на различные типы микрочипов .
В то время как вычислительные методы для интерпретации биологических данных продолжают разрабатываться, проект Bioconductor представляет собой репозиторий программного обеспечения с открытым исходным кодом, в котором размещен широкий спектр статистических инструментов, разработанных в среде программирования R. Используя богатый набор статистических и графических функций R, было разработано множество пакетов Bioconductor для удовлетворения различных потребностей в анализе данных. Использование этих пакетов обеспечивает базовое понимание языка программирования/команд R. В результате пакеты R и Bioconductor, имеющие обширную вычислительную базу, используются большинством биологов, которые получат значительную выгоду от их способности анализировать наборы данных. Все эти результаты предоставляют биологам легкий доступ к анализу геномных данных, не требуя навыков программирования .
Проект был начат осенью 2001 года и контролируется основной командой Bioconductor, базирующейся в основном в Центре онкологических исследований Фреда Хатчинсона , а также другими участниками из международных организаций.
Пакеты
[ редактировать ]Большинство компонентов Bioconductor распространяются в виде пакетов R , которые являются дополнительными модулями для R. Первоначально большинство программных пакетов Bioconductor были ориентированы на анализ одноканальных микрочипов Affymetrix и двух или более канальных кДНК / Олиго -чипов . По мере развития проекта функциональные возможности пакетов программного обеспечения расширялись и теперь включают анализ всех типов геномных данных, таких как SAGE, последовательности или SNP данные .
Цели
[ редактировать ]Общие цели проектов заключаются в следующем:
- Обеспечить широкий доступ к широкому спектру мощных статистических и графических методов анализа геномных данных.
- Содействие включению биологических метаданных в анализ геномных данных, например, литературных данных из PubMed , данных аннотаций из LocusLink/ Entrez .
- Обеспечить общую программную платформу которая позволит быстро разрабатывать и развертывать подключаемое масштабируемое , , и совместимое программное обеспечение.
- Дальнейшее научное понимание за счет создания высококачественной документации и воспроизводимых исследований .
- Обучить исследователей вычислительным и статистическим методам анализа геномных данных.
Основные особенности
[ редактировать ]- Документирование и воспроизводимые исследования . Каждый пакет Bioconductor содержит как минимум одну виньетку, представляющую собой документ, содержащий текстовое, ориентированное на задачу описание функциональности пакета. Эти виньетки бывают нескольких форм. Многие из них представляют собой простые инструкции , предназначенные для демонстрации того, как конкретная задача может быть решена с помощью программного обеспечения этого пакета. Другие предоставляют более подробный обзор пакета или даже обсуждают общие вопросы, связанные с пакетом. В будущем проект Bioconductor стремится предоставлять виньетки, которые не привязаны конкретно к упаковке, а скорее демонстрируют более сложные концепции. Как и во всех аспектах проекта Bioconductor, пользователям предлагается принять участие в этом проекте.
- Статистические и графические методы . Целью проекта Bioconductor является предоставление доступа к широкому спектру мощных статистических и графических методов анализа геномных данных. Доступны пакеты анализа для: предварительной обработки Affymetrix и Illumina кДНК данных массива ; идентификация дифференциально экспрессируемых генов ; теоретический анализ графов; построение геномных данных. Кроме того, сама система пакетов R обеспечивает реализацию широкого спектра современных статистических и графических методов, включая линейное и нелинейное моделирование, кластерный анализ , прогнозирование , повторную выборку , анализ выживания и анализ временных рядов .
- Аннотация генома . Проект Bioconductor предоставляет программное обеспечение для связывания микрочипов и других геномных данных в режиме реального времени с биологическими метаданными из веб-баз данных, таких как GenBank , LocusLink и PubMed (пакет аннотаций). Также предусмотрены функции для включения результатов статистического анализа в HTML-отчеты со ссылками на аннотационные WWW-ресурсы. Программные инструменты доступны для сборки и обработки данных геномных аннотаций из таких баз данных, как GenBank , Gene Ontology Consortium , LocusLink, UniGene , UCSC Human Genome Project и других, с пакетом AnnotationDbi. Пакеты данных распространяются для сопоставления различных идентификаторов зондов (например, идентификаторов Affy, LocusLink, PubMed ). Также можно собрать индивидуальные библиотеки аннотаций. Этот проект также содержит несколько функций для геномного анализа и филогенетики (например, ggtree , пакеты phytools ...).
- Открытый исходный код . Проект Bioconductor придерживается принципа полного открытого исходного кода и распространяется через платформу, подобную SourceForge.net . Ожидается, что все материалы будут существовать под лицензией с открытым исходным кодом, такой как Artistic 2.0 , GPL2 или BSD . Существует много разных причин, по которым программное обеспечение с открытым исходным кодом полезно для анализа данных микрочипов и вычислительной биологии в целом. Причины включают в себя:
- Обеспечить полный доступ к алгоритмам и их реализации.
- Содействовать улучшению программного обеспечения посредством исправления ошибок и плагинов.
- Поощрять хорошие научные вычисления и статистическую практику, предоставляя соответствующие инструменты и инструкции.
- Предоставить набор инструментов , которые позволят исследователям исследовать и расширять методы, используемые для анализа биологических данных.
- Обеспечить, чтобы международное научное сообщество являлось владельцем программных средств, необходимых для проведения исследований.
- Руководить и поощрять коммерческую поддержку и разработку успешных инструментов.
- Содействовать воспроизводимым исследованиям , предоставляя открытые и доступные инструменты для их проведения (воспроизводимые исследования отличаются от независимой проверки).
- Открытая разработка . Пользователям предлагается стать разработчиками , предоставив пакеты или документацию, соответствующие требованиям Bioconductor. Кроме того, Bioconductor предоставляет механизм для объединения различных групп с общими целями для содействия сотрудничеству над программным обеспечением, возможно, на уровне совместной разработки.
Вехи
[ редактировать ]Каждая версия Bioconductor разработана для наилучшей работы с выбранной версией R. [1] Помимо исправлений ошибок и обновлений, в новый выпуск обычно добавляются пакеты. В таблице ниже версия Bioconductor сопоставлена с версией R и показано количество доступных пакетов программного обеспечения Bioconductor для этой версии.
Версия | Дата выпуска | Количество пакетов | R-зависимость |
---|---|---|---|
3.19 | 1 мая 2024 г. | 2300 | 4,4 рэнда |
3.18 | 25 октября 2023 г. | 2266 | 4,3 рэнда |
3.16 | 2 ноября 2022 г. | 2183 | 4,2 рэнда |
3.14 | 27 октября 2021 г. | 2083 | Р 4.1 |
3.11 | 28 апреля 2020 г. | 1903 | 4,0 рэнда |
3.10 | 30 октября 2019 г. | 1823 | 3,6 рэндов |
3.8 | 31 октября 2018 г. | 1649 | 3,5 рэнда |
3.6 | 31 октября 2017 г. | 1473 | 3,4 рэнда |
3.4 | 18 октября 2016 г. | 1296 | 3,3 рэнда |
3.2 | 14 октября 2015 г. | 1104 | 3,2 рэнда |
3.0 | 14 октября 2014 г. | 934 | Р 3.1 |
2.13 | 15 октября 2013 г. | 749 | 3,0 рэнда |
2.11 | 3 октября 2012 г. | 610 | 2,15 рэндов |
2.9 | 1 ноября 2011 г. | 517 | 2,14 рэндов |
2.8 | 14 апреля 2011 г. | 466 | 2.13 рэндов |
2.7 | 18 ноября 2010 г. | 418 | 2.12 рэндов |
2.6 | 23 апреля 2010 г. | 389 | 2.11 рэндов |
2.5 | 28 октября 2009 г. | 352 | 2,10 рэндов |
2.4 | 21 апреля 2009 г. | 320 | 2,9 рэнда |
2.3 | 22 октября 2008 г. | 294 | 2,8 рэнда |
2.2 | 1 мая 2008 г. | 260 | 2,7 рэнда |
2.1 | 8 октября 2007 г. | 233 | 2,6 рэнда |
2.0 | 26 апреля 2007 г. | 214 | 2,5 рэнда |
1.9 | 4 октября 2006 г. | 188 | 2,4 рэнда |
1.8 | 27 апреля 2006 г. | 172 | 2,3 рэнда |
1.7 | 14 октября 2005 г. | 141 | 2,2 рэнда |
1.6 | 18 мая 2005 г. | 123 | Р 2.1 |
1.5 | 25 октября 2004 г. | 100 | 2,0 рэнда |
1.4 | 17 мая 2004 г. | 81 | 1,9 рэндов |
1.3 | 30 октября 2003 г. | 49 | 1,8 рэндов |
1.2 | 29 мая 2003 г. | 30 | 1,7 рэнда |
1.1 | 19 октября 2002 г. | 20 | 1,6 рэнда |
1.0 | 1 мая 2002 г. | 15 | 1,5 рэнда |
Ресурсы
[ редактировать ]- Джентльмен, Р .; Кэри, В.; Хубер, В .; Иризарри, Р. ; Дюдуа, С. (2005). Решения в области биоинформатики и вычислительной биологии с использованием R и биопроводника . Спрингер. ISBN 978-0-387-25146-2 .
- Джентльмен, Р. (2008). Программирование на R для биоинформатики . Чепмен и Холл/CRC. ISBN 978-1-4200-6367-7 .
- Хане, Ф.; Хубер, В .; Джентльмен, Р .; Сокол, С. (2008). Тематические исследования по биопроводникам . Спрингер. ISBN 978-0-387-77239-4 .
- Джентльмен, Роберт С .; Кэри, Винсент Дж.; Бейтс, Дуглас М.; Болстад, Бен; Деттлинг, Марсель ; Дюдуа, Сандрин ; Эллис, Байрон; Готье, Лоран; Ге, Юнчао; Джентри, Джефф; Хорник, Курт; Хотхорн, Торстен; Хубер, Вольфганг ; Якус, Стефано; Ирисарри, Рафаэль ; Лейш, Фридрих; Ли, Ченг; Меклер, Мартин; Россини, Энтони Дж.; Савицкий, Гюнтер; Смит, Колин; Смит, Гордон; Тирни, Люк ; Ян, Жан Ю.Х .; Чжан, Цзяньхуа (2004). «Биокондуктор: разработка открытого программного обеспечения для вычислительной биологии и биоинформатики» . Геномная биология . 5 (10): 80 рандов. дои : 10.1186/gb-2004-5-10-r80 . ПМК 545600 . ПМИД 15461798 .
См. также
[ редактировать ]- Вычислительная биология
- Биоинформатика
- Список программного обеспечения для биоинформатики с открытым исходным кодом
- Список программного обеспечения для выравнивания последовательностей
- R (язык программирования)
- ДНК-микрочип
- Affymetrix — технологическая платформа микрочипов.
Ссылки
[ редактировать ]- ^ «Биокондуктор – анонсы релизов» . bioconductor.org . Биопроводник . Проверено 28 мая 2019 г.
Внешние ссылки
[ редактировать ]- Официальный сайт
- Проект R GNU R — это язык программирования для статистических вычислений.
- Релизы биокондуктора
- Сообщество дистрибутива Debian GNU/Linux стремится к автоматизированной сборке пакетов BioConductor. Архивировано 11 августа 2007 г. на Wayback Machine для их распространения. BioKnoppix и Quantian — это проекты, расширяющие Knoppix , которые предоставили загрузочные компакт-диски Debian GNU/Linux, обеспечивающие установку BioConductor.