Jump to content

Филогенетическая принадлежность названных линий глобальной вспышки

Филогенетическая принадлежность названных линий глобальной вспышки
Первоначальный выпуск 30 апреля 2020 г .; 4 года назад ( 30.04.2020 )
Стабильная версия
4.3.1 [1]  Отредактируйте это в Викиданных / 26 июля 2023 г .; 10 месяцев назад ( 26 июля 2023 г. )
Репозиторий github /cov-lineages /ящер
Написано в Питон
Лицензия Стандартная общественная лицензия GNU v3.0
Веб-сайт ящер .cog-uk .что  Edit this on Wikidata

Филогенетическое определение названных линий глобальной вспышки ( PANGOLIN ) — это программный инструмент, разработанный доктором Айн О'Тул. [2] и сотрудники лаборатории Эндрю Рамбо с соответствующим веб-приложением, разработанным Центром по надзору за геномными патогенами в Южном Кембриджшире . [3] Его цель — внедрить динамическую номенклатуру (известную как номенклатура Панго) для классификации генетических линий SARS -CoV-2 , вируса, вызывающего COVID-19 . [4] Пользователь с полной последовательностью генома образца SARS-CoV-2 может использовать этот инструмент для отправки этой последовательности, которая затем сравнивается с другими последовательностями генома и назначается наиболее вероятная линия (линия Pango). [5] Возможны один или несколько запусков, и инструмент может возвращать дополнительную информацию об известной истории назначенного происхождения. [5] Кроме того, он взаимодействует с Microreact, чтобы показать временную последовательность расположения отчетов о секвенированных образцах одной и той же линии. [5] Последняя функция основана на общедоступных геномах, полученных от Консорциума геномики COVID-19 Великобритании, а также на геномах, представленных в GISAID . [5] Он назван в честь ящера .

Контекст [ править ]

PANGOLIN — ключевой компонент, лежащий в основе номенклатурной системы Pango. [6]

Как описано Эндрю Рамбо и др. (2020), [4] Линия Pango описывается как группа последовательностей, связанных с эпидемиологическим событием, например, проникновением вируса в определенную географическую область с признаками дальнейшего распространения. Линии происхождения созданы для того, чтобы уловить возникающий край пандемии, и имеют детальное разрешение, подходящее для геномного эпидемиологического надзора и расследования вспышек. [ нужна ссылка ]

И этот инструмент, и номенклатурная система PANGOLIN широко использовались во время пандемии COVID-19 . [4] [7] [8]

Описание [ править ]

Обозначение происхождения [ править ]

В отличие от инструмента PANGOLIN, линии Pango регулярно курируются вручную на основе текущего разнообразия, циркулирующего во всем мире. Большое филогенетическое дерево строится на основе сопоставления общедоступных геномов SARS-CoV-2, а подкластеры последовательностей в этом дереве исследуются вручную и сопоставляются с эпидемиологической информацией для обозначения новых линий; они могут быть указаны производителями данных, а предложения по происхождению могут быть отправлены команде Pango через запрос на выпуск GitHub . [9] [10] [ нужны дальнейшие объяснения ]

Обучение модели [ править ]

Эти вручную подобранные обозначения линий и связанные с ними последовательности генома являются входными данными для обучения модели машинного обучения. Эта модель, как обучения, так и задания, получила название «pangoLEARN». Текущая версия pangoLEARN использует дерево классификации, основанное на scikit-learn . реализации [11] классификатора дерева решений.

Назначение по происхождению [ править ]

Первоначально PANGOLIN использовал алгоритм назначения, основанный на максимальном правдоподобии, чтобы назначить запросу SARS-CoV-2 наиболее вероятную последовательность происхождения. Однако с момента выпуска версии 2.0 в июле 2020 года он использовал алгоритм назначения на основе машинного обучения pangoLEARN для определения линий происхождения новых геномов SARS-CoV-2. [12] Этот подход является быстрым и позволяет выявить большое количество геномов SARS-CoV-2 за относительно короткое время. [13]

Наличие [ править ]

PANGOLIN доступен как инструмент на основе командной строки , который можно загрузить с Conda и из репозитория GitHub. [12] и как веб-приложение [14] с графическим пользовательским интерфейсом с возможностью перетаскивания. По состоянию на январь 2021 года веб-приложение PANGOLIN присвоило более 512 000 уникальных последовательностей SARS-CoV-2. [ нужна ссылка ]

Создатели и разработчики [ править ]

PANGOLIN был создан Айн О'Тул и лабораторией Rambaut и выпущен 5 апреля 2020 года. Основными разработчиками PANGOLIN являются Айн О'Тул и Эмили Шер; многие другие внесли свой вклад в различные аспекты этого инструмента, в том числе Бен Джексон, Джей Ти МакКроун, Верити Хилл и Рэйчел Колкухун из лаборатории Рамбо. [5]

Веб-приложение PANGOLIN разработано Центром по надзору за геномными патогенами, [14] А именно Энтони Андервуд, Бен Тейлор, Корин Йейтс, Хали Абу-Дахаб и Дэвид Аненсен. [5]

См. также [ править ]

Ссылки [ править ]

  1. ^ «Выпуск 4.3.1» . 26 июля 2023 г. Проверено 1 августа 2023 г.
  2. ^ О'Тул, Айн; Шер, Эмили; Андервуд, Энтони; Джексон, Бен; Хилл, Верити; МакКроун, Джон Т; Колкухун, Рэйчел; Руис, Крис; Абу-Дахаб, Халил; Тейлор, Бен; Йейтс, Корин; Дю Плесси, Луи; Мэлони, Дэниел; Медд, Натан; Эттвуд, Стивен В.; Аненсен, Дэвид М; Холмс, Эдвард С; Пайбус, Оливер Дж; Рамбо, Эндрю (5 июля 2021 г.). «Определение эпидемиологических линий в условиях возникающей пандемии с использованием инструмента Pangolin» . Эволюция вирусов . 7 (2): veab064. дои : 10.1093/ve/veab064 . ПМЦ   8344591 . ПМИД   34527285 .
  3. ^ «Эпидемиология COVID-19 в реальном времени» . www.pathogensurveillance.net . Архивировано из оригинала 17 января 2021 года . Проверено 22 января 2021 г.
  4. Перейти обратно: Перейти обратно: а б с Рамбо, А.; Холмс, ЕС; О'Тул, А.; и др. (2020). «Предложение по динамической номенклатуре линий SARS-CoV-2 в помощь геномной эпидемиологии» . Природная микробиология . 5 (11): 1403–1407. дои : 10.1038/s41564-020-0770-5 . ПМЦ   7610519 . ПМИД   32669681 . S2CID   220544096 .
  5. Перейти обратно: Перейти обратно: а б с д и ж «Выпуск веб-приложения Pangolin» . вирусологический сайт . Май 2020. Архивировано из оригинала 10 февраля 2021 года . Проверено 18 февраля 2021 г.
  6. ^ Рамбо, Эндрю; Холмс, Эдвард К.; о'Тул, Айн; Хилл, Верити; МакКроун, Джон Т.; Руис, Кристофер; Дю Плесси, Луи; Пайбус, Оливер Г. (15 июля 2020 г.). «Приложение: Предложение по динамической номенклатуре линий SARS-CoV-2 в помощь геномной эпидемиологии» . Природная микробиология . 6 (3): 415. дои : 10.1038/s41564-021-00872-5 . ПМЦ   7845574 . ПМИД   33514928 .
  7. ^ Пайпс, Ленор; Ван, Хунру; Хюльзенбек, Джон П; Нильсен, Расмус (9 декабря 2020 г.). Малик, Хармит (ред.). «Оценка неопределенности в укоренении филогении SARS-CoV-2» . Молекулярная биология и эволюция . 38 (4). Издательство Оксфордского университета (OUP): 1537–1543. дои : 10.1093/molbev/msaa316 . ISSN   0737-4038 . ПМЦ   7798932 . ПМИД   33295605 . Архивировано из оригинала 10 декабря 2020 года . Проверено 22 января 2021 г.
  8. ^ Джейкоб, Джобин Джон; Васудеван, Картик; Прагасам, Агила Кумари; Гунасекаран, Картик; Канг, Гагандип; Вирарагаван, Баладжи; Мутреджа, Анкур (22 декабря 2020 г.). «Эволюционное отслеживание генетических вариантов SARS-CoV-2 подчеркивает сложный баланс стабилизирующих и дестабилизирующих мутаций». bioRxiv   10.1101/2020.12.22.423920 . Инструмент Филогенетического определения названных глобальных вспышек LINEages (PANGOLIN) является наиболее широко используемым инструментом для определения происхождения вновь появляющихся вариантов.
  9. ^ «pangoLEARN Хранилище обученной модели для доступа PANGOLIN» . GitHub: cov-lineages/pangoLEARN . Архивировано из оригинала 3 января 2021 года . Проверено 13 февраля 2021 г.
  10. ^ «Линии ПАНГО» . cov-lineages.org . Архивировано из оригинала 28 февраля 2021 года . Проверено 4 марта 2021 г.
  11. ^ «sklearn.tree.DecisionTreeClassifier» . scikit-learn.org . Архивировано из оригинала 19 февраля 2021 года . Проверено 13 февраля 2021 г.
  12. Перейти обратно: Перейти обратно: а б "cov-lineages/панголин" . GitHub: cov-lineages/pangolin . Архивировано из оригинала 15 февраля 2021 года . Проверено 13 февраля 2021 г.
  13. ^ «pangoLEARN PANGOLIN 2.0: описание pangoLEARN» . cov-lineages.org . Архивировано из оригинала 4 ноября 2021 года . Проверено 19 ноября 2021 г. Модель была обучена с использованием ~60 000 последовательностей SARS-CoV-2 из GISAID... обучение этой модели на нашем оборудовании занимает около 30 минут.
  14. Перейти обратно: Перейти обратно: а б «Назначитель линии Панголина COVID-19» . pangolin.cog-uk.io . Архивировано из оригинала 10 февраля 2021 года . Проверено 13 февраля 2021 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1e755b512c0ea8dfcb008516600b9cb4__1704994500
URL1:https://arc.ask3.ru/arc/aa/1e/b4/1e755b512c0ea8dfcb008516600b9cb4.html
Заголовок, (Title) документа по адресу, URL1:
Phylogenetic Assignment of Named Global Outbreak Lineages - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)