Филогенетическая принадлежность названных линий глобальной вспышки
![]() Логотип ПАНГОЛИН | |
Первоначальный выпуск | 30 апреля 2020 г |
---|---|
Стабильная версия | 4.3.1 [1] ![]() |
Репозиторий | github |
Написано в | Питон |
Лицензия | Стандартная общественная лицензия GNU v3.0 |
Веб-сайт | ящер ![]() |
Филогенетическое определение названных линий глобальной вспышки ( PANGOLIN ) — это программный инструмент, разработанный доктором Айн О'Тул. [2] и сотрудники лаборатории Эндрю Рамбо с соответствующим веб-приложением, разработанным Центром по надзору за геномными патогенами в Южном Кембриджшире . [3] Его цель — внедрить динамическую номенклатуру (известную как номенклатура Панго) для классификации генетических линий SARS -CoV-2 , вируса, вызывающего COVID-19 . [4] Пользователь с полной последовательностью генома образца SARS-CoV-2 может использовать этот инструмент для отправки этой последовательности, которая затем сравнивается с другими последовательностями генома и назначается наиболее вероятная линия (линия Pango). [5] Возможны один или несколько запусков, и инструмент может возвращать дополнительную информацию об известной истории назначенного происхождения. [5] Кроме того, он взаимодействует с Microreact, чтобы показать временную последовательность расположения отчетов о секвенированных образцах одной и той же линии. [5] Последняя функция основана на общедоступных геномах, полученных от Консорциума геномики COVID-19 Великобритании, а также на геномах, представленных в GISAID . [5] Он назван в честь ящера .
Контекст [ править ]
PANGOLIN — ключевой компонент, лежащий в основе номенклатурной системы Pango. [6]
Как описано Эндрю Рамбо и др. (2020), [4] Линия Pango описывается как группа последовательностей, связанных с эпидемиологическим событием, например, проникновением вируса в определенную географическую область с признаками дальнейшего распространения. Линии происхождения созданы для того, чтобы уловить возникающий край пандемии, и имеют детальное разрешение, подходящее для геномного эпидемиологического надзора и расследования вспышек. [ нужна ссылка ]
И этот инструмент, и номенклатурная система PANGOLIN широко использовались во время пандемии COVID-19 . [4] [7] [8]
Описание [ править ]
Обозначение происхождения [ править ]
В отличие от инструмента PANGOLIN, линии Pango регулярно курируются вручную на основе текущего разнообразия, циркулирующего во всем мире. Большое филогенетическое дерево строится на основе сопоставления общедоступных геномов SARS-CoV-2, а подкластеры последовательностей в этом дереве исследуются вручную и сопоставляются с эпидемиологической информацией для обозначения новых линий; они могут быть указаны производителями данных, а предложения по происхождению могут быть отправлены команде Pango через запрос на выпуск GitHub . [9] [10] [ нужны дальнейшие объяснения ]
Обучение модели [ править ]
Эти вручную подобранные обозначения линий и связанные с ними последовательности генома являются входными данными для обучения модели машинного обучения. Эта модель, как обучения, так и задания, получила название «pangoLEARN». Текущая версия pangoLEARN использует дерево классификации, основанное на scikit-learn . реализации [11] классификатора дерева решений.
Назначение по происхождению [ править ]
Первоначально PANGOLIN использовал алгоритм назначения, основанный на максимальном правдоподобии, чтобы назначить запросу SARS-CoV-2 наиболее вероятную последовательность происхождения. Однако с момента выпуска версии 2.0 в июле 2020 года он использовал алгоритм назначения на основе машинного обучения pangoLEARN для определения линий происхождения новых геномов SARS-CoV-2. [12] Этот подход является быстрым и позволяет выявить большое количество геномов SARS-CoV-2 за относительно короткое время. [13]
Наличие [ править ]
PANGOLIN доступен как инструмент на основе командной строки , который можно загрузить с Conda и из репозитория GitHub. [12] и как веб-приложение [14] с графическим пользовательским интерфейсом с возможностью перетаскивания. По состоянию на январь 2021 года веб-приложение PANGOLIN присвоило более 512 000 уникальных последовательностей SARS-CoV-2. [ нужна ссылка ]
Создатели и разработчики [ править ]
PANGOLIN был создан Айн О'Тул и лабораторией Rambaut и выпущен 5 апреля 2020 года. Основными разработчиками PANGOLIN являются Айн О'Тул и Эмили Шер; многие другие внесли свой вклад в различные аспекты этого инструмента, в том числе Бен Джексон, Джей Ти МакКроун, Верити Хилл и Рэйчел Колкухун из лаборатории Рамбо. [5]
Веб-приложение PANGOLIN разработано Центром по надзору за геномными патогенами, [14] А именно Энтони Андервуд, Бен Тейлор, Корин Йейтс, Хали Абу-Дахаб и Дэвид Аненсен. [5]
См. также [ править ]
Ссылки [ править ]
- ^ «Выпуск 4.3.1» . 26 июля 2023 г. Проверено 1 августа 2023 г.
- ^ О'Тул, Айн; Шер, Эмили; Андервуд, Энтони; Джексон, Бен; Хилл, Верити; МакКроун, Джон Т; Колкухун, Рэйчел; Руис, Крис; Абу-Дахаб, Халил; Тейлор, Бен; Йейтс, Корин; Дю Плесси, Луи; Мэлони, Дэниел; Медд, Натан; Эттвуд, Стивен В.; Аненсен, Дэвид М; Холмс, Эдвард С; Пайбус, Оливер Дж; Рамбо, Эндрю (5 июля 2021 г.). «Определение эпидемиологических линий в условиях возникающей пандемии с использованием инструмента Pangolin» . Эволюция вирусов . 7 (2): veab064. дои : 10.1093/ve/veab064 . ПМЦ 8344591 . ПМИД 34527285 .
- ^ «Эпидемиология COVID-19 в реальном времени» . www.pathogensurveillance.net . Архивировано из оригинала 17 января 2021 года . Проверено 22 января 2021 г.
- ↑ Перейти обратно: Перейти обратно: а б с Рамбо, А.; Холмс, ЕС; О'Тул, А.; и др. (2020). «Предложение по динамической номенклатуре линий SARS-CoV-2 в помощь геномной эпидемиологии» . Природная микробиология . 5 (11): 1403–1407. дои : 10.1038/s41564-020-0770-5 . ПМЦ 7610519 . ПМИД 32669681 . S2CID 220544096 .
- ↑ Перейти обратно: Перейти обратно: а б с д и ж «Выпуск веб-приложения Pangolin» . вирусологический сайт . Май 2020. Архивировано из оригинала 10 февраля 2021 года . Проверено 18 февраля 2021 г.
- ^ Рамбо, Эндрю; Холмс, Эдвард К.; о'Тул, Айн; Хилл, Верити; МакКроун, Джон Т.; Руис, Кристофер; Дю Плесси, Луи; Пайбус, Оливер Г. (15 июля 2020 г.). «Приложение: Предложение по динамической номенклатуре линий SARS-CoV-2 в помощь геномной эпидемиологии» . Природная микробиология . 6 (3): 415. дои : 10.1038/s41564-021-00872-5 . ПМЦ 7845574 . ПМИД 33514928 .
- ^ Пайпс, Ленор; Ван, Хунру; Хюльзенбек, Джон П; Нильсен, Расмус (9 декабря 2020 г.). Малик, Хармит (ред.). «Оценка неопределенности в укоренении филогении SARS-CoV-2» . Молекулярная биология и эволюция . 38 (4). Издательство Оксфордского университета (OUP): 1537–1543. дои : 10.1093/molbev/msaa316 . ISSN 0737-4038 . ПМЦ 7798932 . ПМИД 33295605 . Архивировано из оригинала 10 декабря 2020 года . Проверено 22 января 2021 г.
- ^ Джейкоб, Джобин Джон; Васудеван, Картик; Прагасам, Агила Кумари; Гунасекаран, Картик; Канг, Гагандип; Вирарагаван, Баладжи; Мутреджа, Анкур (22 декабря 2020 г.). «Эволюционное отслеживание генетических вариантов SARS-CoV-2 подчеркивает сложный баланс стабилизирующих и дестабилизирующих мутаций». bioRxiv 10.1101/2020.12.22.423920 .
Инструмент Филогенетического определения названных глобальных вспышек LINEages (PANGOLIN) является наиболее широко используемым инструментом для определения происхождения вновь появляющихся вариантов.
- ^ «pangoLEARN Хранилище обученной модели для доступа PANGOLIN» . GitHub: cov-lineages/pangoLEARN . Архивировано из оригинала 3 января 2021 года . Проверено 13 февраля 2021 г.
- ^ «Линии ПАНГО» . cov-lineages.org . Архивировано из оригинала 28 февраля 2021 года . Проверено 4 марта 2021 г.
- ^ «sklearn.tree.DecisionTreeClassifier» . scikit-learn.org . Архивировано из оригинала 19 февраля 2021 года . Проверено 13 февраля 2021 г.
- ↑ Перейти обратно: Перейти обратно: а б "cov-lineages/панголин" . GitHub: cov-lineages/pangolin . Архивировано из оригинала 15 февраля 2021 года . Проверено 13 февраля 2021 г.
- ^ «pangoLEARN PANGOLIN 2.0: описание pangoLEARN» . cov-lineages.org . Архивировано из оригинала 4 ноября 2021 года . Проверено 19 ноября 2021 г.
Модель была обучена с использованием ~60 000 последовательностей SARS-CoV-2 из GISAID... обучение этой модели на нашем оборудовании занимает около 30 минут.
- ↑ Перейти обратно: Перейти обратно: а б «Назначитель линии Панголина COVID-19» . pangolin.cog-uk.io . Архивировано из оригинала 10 февраля 2021 года . Проверено 13 февраля 2021 г.
Внешние ссылки [ править ]
- панголин на GitHub
- Официальный сайт
- pango.network — информация о правилах системы Pango, комитете управления и комитете по определению происхождения.