Jump to content

ПИКРУст

Оригинальный автор(ы) Морган Лангилл, Джесси Заневельд, Дэн Найтс, Джошуа А. Рейес, Хосе С. Клементе, Дерон Э. Беркепайл, Ребекка Л. Вега Тёрбер, Роб Найт , Роберт Дж. Бейко, Кертис Хаттенхауэр
Разработчик(и) Морган Ланжилль, Джесси Заневельд, Дэниэл МакДональд, Грег Капорасо, Гэвин Дуглас
Первоначальный выпуск 29 июля 2013 г .; 11 лет назад ( 29.07.2013 )
Написано в Питон, Р
Веб-сайт пикраст .github .что /picrust /

ПИКРУст [ 1 ] представляет собой пакет программного обеспечения для биоинформатики . Название представляет собой аббревиатуру от «Филогенетическое исследование сообществ путем реконструкции ненаблюдаемых состояний».

Этот инструмент используется в области метагеномного анализа, где он позволяет сделать вывод о функциональном профиле микробов . сообщества на основе исследования маркерных генов в одном или нескольких образцах. По сути, PICRSt использует предоставленную пользователем таблицу операционных таксономических единиц (обычно называемую таблицей OTU), представляющую последовательности маркерных генов (чаще всего 16S кластер ), сопровождаемые их относительным содержанием в каждом из образцов. Выходные данные PICRSt представляют собой выборку по матрице количества функциональных генов, указывающую количество каждого функционального гена в каждом из исследованных образцов. Способность PICRSt оценивать профиль функционального гена для данного образца зависит от набора известных секвенированных геномов . Это также можно рассматривать как автоматизированную альтернативу ручному исследованию семейств генов, которые могут присутствовать в организмах, чьи последовательности обнаружены в 16S рибосомальной РНК библиотеке ампликонов . Приведенное ниже описание соответствует исходной версии PICRSt, но в настоящее время разрабатывается крупное обновление этого инструмента. [ 2 ]

Алгоритм предсказания генома

[ редактировать ]

На начальном этапе предварительной обработки PICRSt строит доверительные интервалы и точечные прогнозы для количества копий каждого семейства генов в каждом штамме бактерий и архей в эталонном дереве, используя в качестве эталона организмы с секвенированными геномами. Точнее, для каждого семейства генов PICRSt отображает известное количество копий генов (из полных секвенированных геномов) на эталонное древо жизни. семейства генов Эти числа копий рассматриваются как непрерывные признаки и эволюционная модель, построенная на основе предположения о броуновском движении . Эти эволюционные модели могут быть построены с использованием максимального правдоподобия , ослабленного максимального правдоподобия или экономии Вагнера. Эта эволюционная модель затем используется для прогнозирования как точечной оценки, так и доверительного интервала для числа копий микроорганизмов без секвенированных геномов. На этом этапе «прогнозирования генома» создается большая таблица типов бактерий (в частности, операционных таксономических единиц или OTU) в зависимости от количества копий семейства генов. Эта таблица распространяется среди конечных пользователей. Важно отметить, что этот метод прогнозирования отличается от метода ближайшего соседа (т. е. просто поиска ближайшего секвенированного генома), и было показано, что он дает небольшое, но значительное улучшение точности по сравнению с этим методом. Однако, Прогноз ближайшего соседа доступен в качестве опции в PICRSt.

Примечательно, что хотя эта функция обычно используется для прогнозирования числа копий генов у бактерий, в принципе ее можно использовать для прогнозирования любого другого непрерывного признака с учетом данных о признаках для различных организмов и эталонной филогении .

Ланжилль и др. [ 1 ] протестировали точность этого этапа прогнозирования генома, используя перекрестную проверку с исключением одного на входном наборе секвенированных геномов. Дополнительные тесты проверяли чувствительность к ошибкам филогенетического вывода , отсутствие геномных данных и точность доверительных интервалов содержания генов.

Аналогичный шаг позволяет предсказать количество копий генов 16S рРНК .

Алгоритм прогнозирования метагенома

[ редактировать ]

Применяя PICRSt к библиотеке генов 16S рРНК , PICRSt сопоставляет эталонные операционные таксономические единицы с таблицами и извлекает прогнозируемое количество копий 16S рРНК и количество копий гена для каждого семейства генов. Численность каждого OTU делится на прогнозируемое количество копий (если бактерия имеет несколько копий 16S, ее видимое содержание в данных 16S рРНК будет завышено), а затем умножается на количество копий семейства генов. Это дает прогноз вклада каждой OTU в общее содержание генов образца ( метагеном ). Наконец, эти отдельные вклады суммируются для получения оценки генов, присутствующих в метагеноме .

Ланжилль и др., 2013 г. [ 1 ] проверили точность этого этапа предсказания генома, используя ранее опубликованные наборы данных, в которых один и тот же биологический образец подвергался амплификации гена 16S рРНК и метагеномике дробовика . В этих случаях результаты метагеномной дроби воспринимались как представление «истинного» сообщества, а библиотеки ампликонов гена 16S рРНК вводились в PICRSt, чтобы попытаться предсказать эти данные. Наборы тестовых данных включали образцы человеческого микробиома из Проекта «Микробиом человека» , образцы почвы, различные образцы млекопитающих и образцы Герреро-Негро. микробных матов

Ближайший секвенированный индекс таксона

[ редактировать ]

Поскольку PICRSt и эволюционная сравнительная геномика в целом зависят от секвенированных геномов, биологические образцы из хорошо изученной среды (многие секвенированные геномы) будут лучше прогнозироваться, чем плохо изученные среды. Чтобы оценить, сколько геномов доступно, PICRSt дополнительно позволяет пользователям рассчитать индекс ближайшего секвенированного таксона (NSTI) для их образцов. Этот индекс отражает среднее филогенетическое расстояние между каждой последовательностью гена 16S рРНК в их образце и последовательностью гена 16S рРНК из полностью секвенированного генома . В целом, чем ниже балл NSTI, тем более точными будут прогнозы PICRSt. Например, [ 1 ] показали, что PICRSt был гораздо более точным на различных образцах почвы и образцах из проекта «Микробиом человека», чем на образцах микробного мата из Герреро-Негро , которые содержали множество бактерий без каких-либо секвенированных родственников.

[ редактировать ]

Окуда и др., 2012 г. [ 3 ] опубликовал аналогичный метод, который использовал подход ограниченного k-ближайшего соседа для прогнозирования виртуальных метагеномов. Они подтвердили свой подход, используя последовательности генов 16S рРНК, извлеченные из метагеномов дробовика , и сравнили предсказания своего метода с полным метагеномом.

Копирайтер, [ 4 ] как и PICRSt, использует эволюционное моделирование и прогнозирование филогенетических признаков для оценки числа копий последовательности гена 16S рРНК для каждого типа бактерий и архей в образце, а затем использует эти оценки для корректировки оценок состава сообщества.

ПанФП [ 5 ] представили аналогичный метод, но основанный на предсказаниях генома для каждой таксономической группы. Бенчмаркинг показал очень схожую производительность с PICRSt при сравнении с теми же наборами данных. Одним из преимуществ является то, что можно использовать все OTU, а не только те, которые указаны в справочной таблице филогении. Одним из недостатков является то, что не строятся доверительные интервалы и эволюционные модели.

ПЕРЕЦ [ 6 ] представляет собой инструмент прогнозирования метагенома, основанный на размещении входных последовательностей гена 16S рРНК в известное филогенетическое дерево, соответствующее эталонным геномам. Основной результат прогнозирования соответствует числам Комиссии по ферментам .

Пифиллин [ 7 ] это инструмент, созданный компанией Second Genome , который производит предсказания метагенома на основе кластеризации ближайших соседей входных последовательностей гена 16S рРНК с последовательностями гена 16S рРНК из эталонных геномов. На веб-сайте Second Genome есть веб-портал для запуска этого инструмента. Этот инструмент постоянно развивается и проходит проверку, как описано в публикации 2020 года. [ 8 ]

Tax4Fun [ 9 ] представляет собой аналогичный инструмент, основанный на связывании генов 16S рибосомальной РНК всех организмов KEGG с последовательностями генов 16S рРНК, обнаруженными в базе данных рибосомальных РНК SILVA . Первоначально этот инструмент был ограничен последовательностями генов 16S рРНК, обнаруженными в базе данных SILVA. Однако последняя версия этого инструмента, Tax4Fun2, может использоваться с OTU или вариантами последовательностей ампликонов из любого конвейера кластеризации.

  1. ^ Jump up to: а б с д Ланжиль, Морган Джи; Заневельд, Джесси; Капорасо, Дж. Грегори; Макдональд, Дэниел; Найтс, Дэн; Рейес, Джошуа А; Клементе, Хосе С; Беркепайл, Дерон Э; Вега Тербер, Ребекка Л; Найт, Роб; Бейко, Роберт Дж; Хаттенхауэр, Кертис (2013). «Прогнозирующее функциональное профилирование микробных сообществ с использованием последовательностей маркерного гена 16S рРНК» (PDF) . Природная биотехнология . 31 (9): 814–821. дои : 10.1038/nbt.2676 . ISSN   1087-0156 . ПМЦ   3819121 . ПМИД   23975157 .
  2. ^ Дуглас, Гэвин; Маффеи, Винс; Заневельд, Джесси; Юргель, Светлана; Браун, Джеймс; Тейлор, Кристофер; Хаттенхауэр, Кертис; Ланжилль, Морган (2020). «PICRUSt2: улучшенный и настраиваемый подход к выводу метагенома» . биоRxiv . дои : 10.1101/672295 .
  3. ^ . Окуда , Масуми , Юки ; , Ито , Хисао Кирияма , Цучия ( 2012   Сюдзиро ; )
  4. ^ Англи, Флоран Э; Деннис, Пол Дж; Скаршевский, Адам; Ванвонтергем, Инка; Гугенгольц, Филип; Тайсон, Джин В. (2014). «CopyRighter: быстрый инструмент для повышения точности профилей микробного сообщества посредством коррекции числа копий гена, специфичного для линии» . Микробиом . 2:11 . дои : 10.1186/2049-2618-2-11 . ПМК   4021573 . ПМИД   24708850 .
  5. ^ Джун, Се-Ран; Робсон, Майкл С.; Хаузер, Лорен Дж.; Шадт, Кристофер В.; Горин, Андрей А. (2015). «PanFP: функциональные профили микробных сообществ на основе пангенома» . Исследовательские заметки BMC . 8 : 479. doi : 10.1186/s13104-015-1462-8 . ПМЦ   4584126 . ПМИД   26409790 .
  6. ^ Боуман, Джефф; Даклоу, Хью (2015). «Микробные сообщества можно описать с помощью метаболической структуры: общая основа и применение к сезонно изменяющемуся, стратифицированному по глубине микробному сообществу прибрежной части западной части Антарктического полуострова» . ПЛОС ОДИН . 10 (8): e0135868. Бибкод : 2015PLoSO..1035868B . дои : 10.1371/journal.pone.0135868 . ПМК   4540456 . ПМИД   26285202 .
  7. ^ Иваи, Сёко; Вайнмайер, Томас; Шмидт, Брайан; Альбертсон, Донна; Полосо, Нил; Даббаг, Карим; ДеСантис, Тодд (2016). «Пифиллин: улучшенное предсказание метагеномного содержания путем прямого вывода из микробиомов человека» . ПЛОС ОДИН . 11 (11): e0166104. Бибкод : 2016PLoSO..1166104I . дои : 10.1371/journal.pone.0166104 . ПМК   5098786 . ПМИД   27820856 .
  8. ^ Нараян, Николь; Вайнмайер, Томас; Лазерна-Мендьета, Эмилио; Классон, Маркус; Шанахан, Фергус; Даббаг, Карим; Иваи, Сёко; ДеСантис, Тодд (2020). «Пифиллин предсказывает метагеномный состав и динамику на основе скорректированных с помощью DADA2 последовательностей 16S рДНК» . БМК Геномика . 21 (1): 56. дои : 10.1186/s12864-019-6427-1 . ПМК   6967091 . ПМИД   31952477 .
  9. ^ Асхауэр, Катрин; Вемхойер, Бернд; Дэниел, Рольф; Мейнике, Питер (2015). «Tax4Fun: прогнозирование функциональных профилей на основе метагеномных данных 16S рРНК» . Биоинформатика . 31 (17): 2882–2884. doi : 10.1093/биоинформатика/btv287 . ПМЦ   4547618 . ПМИД   25957349 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 438c8b6d4623fed0b57a23774eb7ee91__1709422440
URL1:https://arc.ask3.ru/arc/aa/43/91/438c8b6d4623fed0b57a23774eb7ee91.html
Заголовок, (Title) документа по адресу, URL1:
PICRUSt - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)