НЕДЕЛИ
Оригинальный автор(ы) | Фурсов М. |
---|---|
Разработчик(и) | Юнипро |
Первоначальный выпуск | 2008 год |
Стабильная версия | 49 / 8 ноября 2023 г |
Написано в | С++ , Qt |
Операционная система | Windows , macOS , Linux |
Доступно в | английский , русский |
Тип | биоинформатики Инструментарий |
Лицензия | Лицензия GPLv 2 |
Веб-сайт | недели |
UGENE — компьютерное программное обеспечение для биоинформатики . [1] [2] Он работает в операционных системах персональных компьютеров , таких как Windows , macOS или Linux . Он распространяется как бесплатное программное обеспечение с открытым исходным кодом под лицензией GNU General Public License (GPL) версии 2.
UGENE помогает биологам анализировать различные данные биологической генетики , такие как последовательности , аннотации, множественные выравнивания , филогенетические деревья , сборки NGS и другие. Данные могут храниться как локально (на персональном компьютере), так и в общем хранилище (например, в лабораторной базе данных).
UGENE объединяет десятки известных биологических инструментов, алгоритмов и оригинальных инструментов в контексте геномики , эволюционной биологии , вирусологии и других отраслей наук о жизни. UGENE предоставляет графический пользовательский интерфейс (GUI) для готовых инструментов, поэтому биологам, не имеющим навыков компьютерного программирования, может быть проще получить доступ к этим инструментам.
Используя UGENE Workflow Designer, можно упростить многоэтапный анализ. Рабочий процесс состоит из таких блоков, как устройства чтения данных, блоки выполнения встроенных инструментов и алгоритмов и устройства записи данных. Блоки можно создавать с помощью инструментов командной строки или сценария. В конструкторе рабочих процессов доступен набор примеров рабочих процессов для аннотирования последовательностей, преобразования форматов данных, анализа данных NGS и т. д.
Помимо графического интерфейса, UGENE также имеет интерфейс командной строки . Таким образом, также могут выполняться рабочие процессы.
Чтобы повысить производительность, UGENE использует многоядерные процессоры (ЦП) и графические процессоры (ГП) для оптимизации некоторых алгоритмов. [3] [4]
Ключевые особенности
[ редактировать ]Программное обеспечение поддерживает следующие функции:
- Создавайте, редактируйте и аннотируйте нуклеиновых кислот и белков. последовательности
- Быстрый поиск в последовательности
- Множественное выравнивание последовательностей : Clustal W и O, MUSCLE , Kalign , MAFFT , T-Coffee.
- Создайте и используйте общее хранилище, например, лабораторную базу данных.
- Поиск по онлайн-базам данных : Национальный центр биотехнологической информации (NCBI), Банк данных белков (PDB), UniProtKB/Swiss-Prot , UniProtKB/TrEMBL , серверы DAS.
- NCBI Genbank BLAST Локальный поиск и поиск
- Открыть поиск рамки считывания
- Поиск рестрикционных ферментов со встроенным REBASE [5] список ферментов рестрикции
- Интегрированный пакет Primer3 [6] для разработки праймера для ПЦР
- Плазмидная конструкция и аннотация
- Клонирование in silico путем создания векторов клонирования
- Картирование генома коротких ридов с помощью Bowtie , BWA, [7] и UGENE Genome Aligner
- Визуализируйте данные секвенирования следующего поколения (файлы BAM) с помощью браузера сборок UGENE.
- Вариант вызова с помощью SAMtools [8]
- Анализ данных RNA-Seq с помощью конвейера Tuxedo (TopHat, [9] Запонки, [10] и т. д.)
- ChIP-seq с помощью конвейера Cistrome (MACS, Анализ данных [11] ЧАСЫ, [12] и т. д.)
- Обработка необработанных данных NGS
- HMMER 2 и 3 Интеграция пакетов
- хроматограмм Просмотрщик
- Поиск транскрипционных факторов сайтов связывания ( TFBS ) с помощью весовой матрицы и SITECON . алгоритмов
- Поиск прямых , инвертированных и тандемных повторов в ДНК . последовательностях
- Локальное выравнивание последовательностей с помощью оптимизированного алгоритма Смита-Уотермана
- Сборка (с использованием интегрированного объединения соседей PHYLIP , MrBayes, [13] или ФиМЛ [14] Максимальное правдоподобие) и редактировать филогенетические деревья.
- Объединяйте различные алгоритмы в собственные рабочие процессы с помощью UGENE Workflow Designer.
- Сборка контигов с CAP3 [15]
- Средство просмотра 3D-структур файлов в банке данных белков (PDB) и базе данных молекулярного моделирования (MMDB) [16] форматы, анаглифного просмотра поддержка
- Прогнозируйте вторичную структуру белка с помощью GOR IV и PSIPRED. алгоритмов
- Постройте точечные графики для последовательностей нуклеиновых кислот.
- Выравнивание мРНК со Spidey [17]
- Поиск сложных сигналов с помощью ExpertDiscovery [18]
- Поиск шаблона результатов различных алгоритмов в последовательности нуклеиновой кислоты с помощью UGENE Query Designer
- ПЦР in silico для проектирования и картирования праймеров
- Лопата снова ассемблер
Последовательный просмотр
[ редактировать ]Просмотр последовательности используется для визуализации, анализа и изменения нуклеиновых кислот или белков последовательностей . В зависимости от типа последовательности и выбранных опций в окне «Просмотр последовательности» могут присутствовать следующие представления:
- структуры 3D- просмотр
- Круговой вид
- хроматограммы Просмотр
- Представление в виде графиков: GC-контент, AG-контент и др.
- точечного графика Представление
Редактор выравнивания
[ редактировать ]Редактор выравнивания позволяет работать с несколькими последовательностями нуклеиновых кислот или белков — выравнивать их, редактировать выравнивание, анализировать его, сохранять консенсусную последовательность , строить филогенетическое дерево и так далее.
Средство просмотра филогенетического дерева
[ редактировать ]Средство просмотра филогенетических деревьев помогает визуализировать и редактировать филогенетические деревья. Можно синхронизировать дерево с соответствующим множественным выравниванием, использованным для построения дерева.
Обозреватель сборок
[ редактировать ]Проект Assembly Browser был запущен в 2010 году как заявка на Illumina iDEA Challenge 2011. [19] Браузер позволяет пользователям визуализировать и просматривать большие (до сотен миллионов коротких чтений) сборки последовательностей нового поколения. Он поддерживает SAM, [20] BAM (двоичная версия SAM) и форматы ACE. Перед просмотром данных сборки в UGENE входной файл автоматически преобразуется в файл базы данных UGENE. У этого подхода есть свои плюсы и минусы. Плюсы в том, что это позволяет просматривать всю сборку, перемещаться по ней и быстро переходить к хорошо покрытым регионам. Минусы заключаются в том, что преобразование большого файла может занять время и требует достаточно места на диске для хранения базы данных.
Дизайнер рабочих процессов
[ редактировать ]UGENE Workflow Designer позволяет создавать и запускать сложные вычислительные схемы рабочих процессов . [21]
Отличительной особенностью Workflow Designer от других биоинформатических систем управления рабочими процессами является то, что рабочие процессы выполняются на локальном компьютере. Это помогает избежать проблем с передачей данных, тогда как зависимость других инструментов от удаленного хранения файлов и подключения к Интернету этого не дает.
Элементы, из которых состоит рабочий процесс, соответствуют основной части алгоритмов, интегрированных в UGENE. Использование Workflow Designer также позволяет создавать собственные элементы рабочего процесса. Элементы могут быть основаны на инструменте командной строки или сценарии.
Рабочие процессы хранятся в специальном текстовом формате. Это позволяет их повторное использование и передачу между пользователями.
Рабочий процесс можно запустить с помощью графического интерфейса или запустить из командной строки. Графический интерфейс также позволяет контролировать выполнение рабочего процесса, сохранять параметры и т.д.
Существует встроенная библиотека примеров рабочих процессов для преобразования, фильтрации и аннотирования данных, а также несколько конвейеров для анализа данных NGS, разработанных в сотрудничестве с NIH NIAID. [22] Мастер доступен для каждого примера рабочего процесса.
Поддерживаемые форматы биологических данных
[ редактировать ]- Последовательности и аннотации : FASTA (.fa), GenBank (.gb), EMBL (.emb), GFF (.gff).
- Множественное выравнивание последовательностей : Clustal (.aln), MSF (.msf), Stockholm (.sto), Nexus (.nex).
- 3D-структуры : PDB (.pdb), MMDB (.prt). [16]
- Хроматограммы : ABIF (.abi), SCF (.scf)
- Краткие сведения: Sequence Alignment/Map(SAM) (.sam), двоичная версия SAM (.bam), ACE (.ace), FASTQ (.fastq).
- Филогенетические деревья : Ньюик (.nwk), PHYLIP (.phy)
- Другие форматы: Bairoch ( информация о ферментах ), HMM ( HMMER профили ), PWM и PFM ( матрицы позиций ), SNP и VCF4 (варианты генома).
Цикл выпуска
[ редактировать ]UGENE в первую очередь разрабатывается ООО «Юнипро». [23] со штаб-квартирой в Академгородке Новосибирска, Россия. Каждая итерация длится около 1–2 месяцев, после чего следует новый релиз . Также можно загрузить снимки разработки.
Функции, включаемые в каждый выпуск, в основном инициируются пользователями.
См. также
[ редактировать ]- Программное обеспечение для выравнивания последовательностей
- Биоинформатика
- Вычислительная биология
- Список программного обеспечения для биоинформатики с открытым исходным кодом
Ссылки
[ редактировать ]- ^ Оконечников К, Голосова О, Фурсов М, коллектив UGENE (2012). «Юнипро ЮГЕН: единый инструментарий биоинформатики» . Биоинформатика . 28 (8): 1166–7. doi : 10.1093/биоинформатика/bts091 . ПМИД 22368248 .
- ^ Фурсов М.; Новикова, О. (2008). «Многозадачная программная система для анализа ДНК» (PDF) . Материалы Шестой Международной конференции по биоинформатике регуляции и структуры генома . 1 : 78. ISBN 978-5-91291-005-0 .
- ^ Фурсов М.Ю.; Ощепков Д.Ю.; Новикова, О.С. (2009). «UGENE: интерактивные вычислительные схемы для анализа генома» (PDF) . Материалы Пятого Московского международного конгресса по биотехнологии . 3 : 14–15. ISBN 978-5-7237-0372-8 .
- ^ Ефремов, ИП; Фурсов М.Ю.; Данилова, Ю. Э. (2009). «UGENE: пакет высокопроизводительного анализа генома». Материалы Пятого Московского международного конгресса по биотехнологии . 2 : 405–406. ISBN 978-5-7237-0372-8 .
- ^ «НОВЫЙ ДОМ» . rebase.neb.com . Проверено 18 октября 2019 г.
- ^ «Ввод Primer3 (версия 0.4.0)» . bioinfo.ut.ee . Проверено 18 октября 2019 г.
- ^ «Алайнер Берроуза – Уиллера» . bio-bwa.sourceforge.net . Проверено 18 октября 2019 г.
- ^ «САМтулс» . samtools.sourceforge.net . Проверено 18 октября 2019 г.
- ^ «ТопХэт» . ccb.jhu.edu . Проверено 18 октября 2019 г.
- ^ «Перенаправление IU для веб-мастеров» . cufflinks.cbcb.umd.edu . Проверено 18 октября 2019 г.
- ^ «MACS — Анализ на основе модели для ChIP-Seq» . liulab.dfci.harvard.edu . Проверено 18 октября 2019 г.
- ^ «CEAS — Система аннотаций цис-регуляторных элементов» . liulab.dfci.harvard.edu . Проверено 18 октября 2019 г.
- ^ «МрБайес | индекс» . nbisweden.github.io . Проверено 18 октября 2019 г.
- ^ «АТГК: ФиМЛ» . atgc.lirmm.fr . Проверено 18 октября 2019 г.
- ^ CAP3
- ^ Jump up to: а б «Ресурсная группа по макромолекулярным структурам» . www.ncbi.nlm.nih.gov . Проверено 18 октября 2019 г.
- ^ «Спайди заменен [ так в оригинале ] Сплайном» . www.ncbi.nlm.nih.gov . Проверено 18 октября 2019 г.
- ^ Васькин Ю.; Хомичева И.; Игнатьева Е.; Витяев, Е. (2012). «Интегрированная система ExpertDiscovery и UGENE для интеллектуального анализа регуляторных областей генов». В кремниевой биологии . 11 (3–4): 97–108. дои : 10.3233/ISB-2012-0448 . ПМИД 22935964 .
- ^ «Иллюмина – вызов iDEA» . Архивировано из оригинала 26 января 2013 г. Проверено 18 октября 2019 г.
- ^ «СЭМ» (PDF) . Проверено 18 октября 2019 г.
- ^ Фурсов М.Ю.; Варламов, А. (2009). «UGENE — Практический подход к комплексному компьютерному анализу в молекулярной биологии» (PDF) . Материалы 10-й ежегодной конференции по биоинформатике с открытым исходным кодом : 7.
- ^ «NIH: Национальный институт аллергии и инфекционных заболеваний | Ведущие исследования в области понимания, лечения и предотвращения инфекционных, иммунологических и аллергических заболеваний» . www.niaid.nih.gov . Проверено 18 октября 2019 г.
- ^ "УНИПРО, Новосибирский центр информационных технологий. | СОФТ. Разработка, тестирование, реинжиниринг, поддержка ПО" ["UNIPRO, Novosibirsk center of information technologies. | SOFT. Development, testing, reengineering, software support"] . Retrieved 18 October 2019 .