БиоПерл
![]() | |
Первоначальный выпуск | 11 июня 2002 г |
---|---|
Стабильная версия | |
Репозиторий | |
Написано в | Перл |
Тип | Биоинформатика |
Лицензия | Художественная лицензия и GPL |
Веб-сайт | биоперл |
БиоПерл [1] [2] представляет собой набор модулей Perl , упрощающих разработку сценариев Perl для приложений биоинформатики . Он сыграл важную роль в проекте «Геном человека» . [3]
Фон
[ редактировать ]BioPerl — активный проект программного обеспечения с открытым исходным кодом , поддерживаемый Фондом открытой биоинформатики . Первый набор Perl-кодов BioPerl был создан Тимом Хаббардом и Джонгом Бхаком. [ нужна ссылка ] в MRC Center Cambridge, где первое секвенирование генома было проведено Фредом Сэнгером . Центр MRC был одним из центров и мест зарождения современной биоинформатики, поскольку он располагал большим количеством последовательностей ДНК и трехмерных белковых структур. Хаббард использовал th_lib.pl
Библиотека Perl, содержащая множество полезных подпрограмм Perl для биоинформатики. Бхак, первый аспирант Хаббарда, создал jong_lib.pl
. Бхак объединил две библиотеки подпрограмм Perl в одну Bio.pl
. Название BioPerl было придумано совместно Бхаком и Стивеном Бреннерами из Центра белковой инженерии (CPE). В 1995 году Бреннер организовал сессию BioPerl на конференции «Интеллектуальные системы для молекулярной биологии» , проходившей в Кембридже. В ближайшие месяцы у BioPerl появилось несколько пользователей, в том числе Георг Фюлен, который организовал учебный курс в Германии. Коллеги и ученики Фюллена значительно расширили BioPerl; это было далее расширено другими, включая Стива Червица, который активно разрабатывал коды Perl для своей базы данных генома дрожжей. Основное расширение произошло, когда студент Кембриджа Юэн Бирни . к команде разработчиков присоединился [ нужна ссылка ]
Первый стабильный выпуск вышел 11 июня 2002 г.; самая последняя стабильная (с точки зрения API) версия — 1.7.2 от 7 сентября 2017 года. Также периодически выпускаются версии для разработчиков. Версия серии 1.7.x считается самой стабильной (с точки зрения ошибок) версией BioPerl и рекомендуется для повседневного использования.
Чтобы воспользоваться преимуществами BioPerl, пользователю необходимо базовое понимание языка программирования Perl, включая понимание того, как использовать ссылки, модули, объекты и методы Perl.
Особенности и примеры
[ редактировать ]BioPerl предоставляет программные модули для многих типичных задач программирования биоинформатики. К ним относятся:
- Доступ к данным о последовательностях нуклеотидов и пептидов из локальных и удаленных баз данных
Пример доступа к GenBank для получения последовательности:
use Bio::DB::GenBank;
$db_obj = Bio::DB::GenBank->new;
$seq_obj = $db_obj->get_Seq_by_acc( # Insert Accession Number );
- Преобразование форматов записей базы данных/файлов
Пример кода для преобразования форматов
use Bio::SeqIO;
my $usage = "all2y.pl informat outfile outfileformat";
my $informat = shift or die $usage;
my $outfile = shift or die $usage;
my $outformat = shift or die $usage;
my $seqin = Bio::SeqIO->new( -fh => *STDIN, -format => $informat, );
my $seqout = Bio::SeqIO->new( -file => ">$outfile", -format => $outformat, );
while (my $inseq = $seqin->next_seq)
{
$seqout->write_seq($inseq);
}
- Управление отдельными последовательностями
Пример сбора статистики по заданной последовательности
use Bio::Tools::SeqStats;
$seq_stats = Bio::Tools::SeqStats->new($seqobj);
$weight = $seq_stats->get_mol_wt();
$monomer_ref = $seq_stats->count_monomers();
# for nucleic acid sequence
$codon_ref = $seq_stats->count_codons();
- Поиск похожих последовательностей
- и управление ими Создание выравниваний последовательностей
- Поиск генов и других структур в геномной ДНК
- Разработка машиночитаемых аннотаций последовательностей
Использование
[ редактировать ]Помимо непосредственного использования конечными пользователями, [4] BioPerl также предоставил основу для широкого спектра биоинформатических инструментов, в том числе :
- SynBrowse [5]
- ДжинКомбер [6]
- ТФБС [7]
- МИМОКС [8]
- БиоПарсер [9]
- Вырожденная конструкция праймера [10]
- Запрос к общедоступным базам данных [11]
- Текущая сравнительная таблица [12]
Новые инструменты и алгоритмы от внешних разработчиков часто интегрируются непосредственно в сам BioPerl:
Преимущества
[ редактировать ]BioPerl был одним из первых репозиториев биологических модулей, которые повысили удобство использования. Он имеет очень простые в установке модули и гибкий глобальный репозиторий. BioPerl использует хорошие тестовые модули для самых разных процессов.
Недостатки
[ редактировать ]Существует множество способов использования BioPerl: от простых сценариев до очень сложного объектного программирования. Это делает язык неясным, а иногда и трудным для понимания. Среди множества модулей, которые есть в BioPerl, некоторые не всегда работают так, как задумано. [ нужна ссылка ]
Связанные библиотеки на других языках программирования
[ редактировать ]Несколько связанных библиотек биоинформатики, реализованных на других языках программирования, существуют как часть Open Bioinformatics Foundation , в том числе:
Ссылки
[ редактировать ]- ^ Стаич, Дж. Э.; Блок, Д.; Булез, К.; Бреннер, С .; Червиц, С.; Дагдигян, К.; Фюллен, Г.; Гилберт, Дж.; Корф, И.; Лапп, Х.; Лехваслайхо, Х.; Матсалла, К.; Мунгалл, CJ; Осборн, Б.И.; Покок, MR; Шаттнер, П.; Сенгер, М.; Штейн, Л.Д. ; Ступка, Е.; Уилкинсон, доктор медицины; Бирни, Э. (2002). «Набор инструментов BioPerl: модули Perl для наук о жизни» . Геномные исследования . 12 (10): 1611–1618. дои : 10.1101/гр.361602 . ПМК 187536 . ПМИД 12368254 .
- ^ «Публикации BioPerl — BioPerl» . Архивировано из оригинала 2 февраля 2007 г. Проверено 21 января 2007 г. Полный и актуальный список ссылок на BioPerl.
- ^ Линкольн Штайн (1996). «Как Perl спас проект генома человека» . Перл-журнал . 1 (2). Архивировано из оригинала 2 февраля 2007 г. Проверено 25 февраля 2009 г.
- ^ Хаджа Р., Макдональд Дж., Чжан Дж., Шерер С. (2006). «Методы идентификации и картирования недавних сегментных дупликаций и дупликаций генов в геномах эукариот» . Картирование генов, открытие и экспрессия . Методы Мол Биол. Том. 338. Тотова, Нью-Джерси: Humana Press. стр. 9–20. дои : 10.1385/1-59745-097-9:9 . ISBN 978-1-59745-097-3 . ПМИД 16888347 .
- ^ Пан, X.; Штейн, Л .; Брендель, В. (2005). «SynBrowse: Synteny-браузер для сравнительного анализа последовательностей» . Биоинформатика . 21 (17): 3461–3468. doi : 10.1093/биоинформатика/bti555 . ПМИД 15994196 .
- ^ Шах, СП; Маквикер, врач общей практики; Маккуорт, АК; Рогич, С.; Уэллетт, лучший друг (2003). «GeneComber: Объединение результатов программ прогнозирования генов для улучшения результатов» . Биоинформатика . 19 (10): 1296–1297. doi : 10.1093/биоинформатика/btg139 . ПМИД 12835277 .
- ^ Ленхард, Б.; Вассерман, WW (2002). «TFBS: Вычислительная система для анализа сайта связывания транскрипционных факторов» . Биоинформатика . 18 (8): 1135–1136. дои : 10.1093/биоинформатика/18.8.1135 . ПМИД 12176838 .
- ^ Хуанг, Дж.; Гаттеридж, А.; Хонда, В.; Канехиса, М. (2006). «MIMOX: веб-инструмент для картирования эпитопов на основе фагового дисплея» . БМК Биоинформатика . 7 : 451. дои : 10.1186/1471-2105-7-451 . ПМЦ 1618411 . ПМИД 17038191 .
- ^ КАТАНЬО, М.; Маскареньяш, Д.; Деграв, В.; Де Миранда, AB?L. (2006). «БиоПарсер» . Прикладная биоинформатика . 5 (1): 49–53. дои : 10.2165/00822942-200605010-00007 . ПМИД 16539538 .
- ^ Вэй, X.; Кун, Д.Н.; Нарасимхан, Г. (2003). «Вырожденный дизайн праймера посредством кластеризации». Слушания. Конференция IEEE Computer Society по биоинформатике . 2 : 75–83. ПМИД 16452781 .
- ^ Кроче, О.; Ламарр, ML; Кристен, Р. (2006). «Запрос в общедоступных базах данных на наличие последовательностей с использованием сложных ключевых слов, содержащихся в характерных линиях» . БМК Биоинформатика . 7:45 . дои : 10.1186/1471-2105-7-45 . ПМК 1403806 . ПМИД 16441875 .
- ^ Ландштейнер, БР; Олсон, MR; Резерфорд, Р. (2005). «Текущая сравнительная таблица (CCT) автоматизирует индивидуальный поиск в динамических биологических базах данных» . Исследования нуклеиновых кислот . 33 (проблема с веб-сервером): W770–W773. дои : 10.1093/nar/gki432 . ПМК 1160193 . ПМИД 15980582 .
- ^ Льябрес, М.; Роча, Дж.; Росселло, Ф.; Валиенте, Г. (2006). «О предковой совместимости двух филогенетических деревьев с вложенными таксонами». Журнал математической биологии . 53 (3): 340–364. arXiv : cs/0505086 . дои : 10.1007/s00285-006-0011-4 . ПМИД 16823581 . S2CID 1704494 .
- ^ Пампанвар, В.; Энглер, Ф.; Хэтфилд, Дж.; Бланди, С.; Гупта, Г.; Содерлунд, К. (2005). «Веб-инструменты FPC для риса, кукурузы и их распространения» . Физиология растений . 138 (1): 116–126. дои : 10.1104/стр.104.056291 . ПМЦ 1104167 . ПМИД 15888684 .