Jump to content

Справочник по пангеному человека

Общие последовательности и структурные варианты геномов в справочнике по пангеному человека

Справочник по пангеному человека представляет собой коллекцию геномов различных групп людей, составленную Консорциумом по изучению пангенома человека (HPRC). Этот первый проект пангенома включает 47 поэтапных диплоидных сборок из разнообразной когорты особей и был предназначен для отражения генетического разнообразия человеческой популяции. Разработка этого пангенома направлена ​​на устранение очевидных недостатков текущего эталонного генома человека, предлагая более полный и всеобъемлющий ресурс для геномных исследований и анализа. [1]

Концепция пангенома , возникшая в результате изучения прокариотов , была распространена на многоклеточные эукариотические организмы , включая человека. Пангеном человека имеет важное значение для популяционной генетики , филогенетики и политики общественного здравоохранения, поскольку он может определять генетическую основу заболеваний и персонализированное лечение, предоставляя представление о генетическом разнообразии человеческих популяций. [2]

Новый справочник по пангеному человека объединяет недостающие 8% последовательности генома человека , добавляя более 100 миллионов новых оснований. Он направлен на охват большего разнообразия популяций, чем предыдущая эталонная последовательность, и основан на 94 высококачественных гаплоидных сборках от людей с широким генетическим разнообразием. Создание этого эталонного генома направлено на устранение пробелов, включение сложных особенностей геномной последовательности и охват более широкого спектра разнообразия генома человека. [3]

Эталонный геном человека, первоначально составленный более 20 лет назад, представляет собой совокупность слитых гаплотипов более чем 20 человек, причем один человек составляет примерно 70% последовательности. Однако у него есть ограничения, включая предвзятости и ошибки, и, как и в случае с любой линейной эталонной последовательностью генома человека, он не может полностью отражать глобальные вариации генома человека. Большинство геномных исследований было сосредоточено на людях европейского происхождения, что приводит к искажению доступных наборов данных для анализа. Следовательно, точная медицина в первую очередь опирается на геномные вариации, обнаруженные в популяциях европейского происхождения. Этот ограниченный объем упускает из виду значительную часть глобального генетического разнообразия, имеющего решающее значение для понимания клинических фенотипов. [4] Чтобы преодолеть эту проблему, Консорциум по изучению пангенома человека (HPRC) работает над созданием более полного эталонного генома человека с графическим представлением глобального геномного разнообразия от теломер к теломерам, интегрирующим последовательности генома от самых разных людей. Его основные цели включают в себя расширение исследований ассоциаций генов и заболеваний среди населения и предоставление обширного генетического ресурса для будущих биомедицинских исследований и усилий в области точной медицины. [1] [4]

Свойства эталонного пангенома человека

[ редактировать ]

Консорциум образцов пангенома разработал проект справочника пангенома человека, который включает 47 поэтапных диплоидных ансамблей из генетически разнообразной группы людей. Образцы HPRC были секвенированы с использованием высокоточного секвенирования Pacific Biosciences (PacBio) (HiFi) и Oxford Nanopore Technologies (ONT), оптических карт Bionano и высокоточного секвенирования Hi-C Illumina с коротким считыванием. [1]

Варианты захвата

[ редактировать ]

Сообщается, что эти сборки покрывают более 99% ожидаемой последовательности в каждом геноме и демонстрируют точность более 99% как на структурном уровне, так и на уровне пар оснований. Пангеном захватывает известные варианты и гаплотипы , выявляет новые аллели в структурно сложных локусах и добавляет 119 миллионов пар оснований эухроматической полиморфной последовательности и 1115 дупликаций генов по сравнению с существующим эталонным GRCh38, причем примерно 90 миллионов дополнительных пар оснований происходят из структурных вариаций. . Использование этого проекта пангенома для анализа данных короткого чтения показало снижение на 34% ошибок обнаружения небольших вариантов и увеличение на 104% обнаружения структурных вариантов на гаплотип по сравнению с рабочими процессами на основе GRCh38. [1]

Представление разнообразия

[ редактировать ]

Усилия КНР являются частью более широкой инициативы по секвенированию и сборке геномов людей из разных групп населения с целью лучшего представления геномного ландшафта человеческого разнообразия. Консорциум стремится увеличить количество последовательностей генома до 350 к середине 2024 года, предоставив более полный и инклюзивный ресурс для геномных исследований и анализа. [1] Разработка справочника по пангеному человека знаменует собой заметный прогресс в геномике, поскольку он предлагает более точное и разнообразное описание глобальных геномных вариаций. Ожидается, что эта разработка улучшит исследования ассоциаций генов и болезней среди популяций, расширит объем геномных исследований, включив в них наиболее повторяющиеся и полиморфные области генома, и послужит ценным генетическим ресурсом для будущих исследований. [1]

Субпопуляции HPRC включают ACB, Африканский Карибский бассейн на Барбадосе ; ASW, африканское происхождение на юго-западе США; CHS, Ханьский Юг Китая; CLM, колумбиец в Медельине, Колумбия ; ESN, Esan в Нигерии ; GWD, Гамбия в Западном дивизионе; KHV, Кинь в Хошимине, Вьетнам ; MKK, Масаи в Киньяве, Кения ; MSL, Менде в Сьерра-Леоне ; PEL, перуанец в Лиме, ​​Перу ; PJL, пенджаби в Лахоре, Пакистан ; PUR, пуэрториканец в Пуэрто-Рико ; YRI, йоруба в Ибадане, Нигерия. [1] Справочная информация о пангеноме человека является более полной, чем предыдущие эталонные последовательности. Он включает в себя более 100 миллионов новых баз от 47 человек разного происхождения, что отражает большее разнообразие населения, чем предыдущие ссылки. [5] [3]

Поколение пангенома человека

[ редактировать ]
Краткий обзор различных этапов сборки генома de novo.

Отбор образцов и секвенирование

[ редактировать ]

Справочник по пангеномам включает 47 полностью фазированных диплоидных геномов. Среди них 29 геномов были полностью созданы HPRC, а остальные 18 были созданы другими усилиями. [1]

Для сбора информации использовались следующие технологии секвенирования: Pacific Biosciences высокоточное секвенирование Oxford Nanopore Technologies (ONT) (PacBio) (HiFi) с глубиной покрытия последовательности HiFi 39,7×, секвенирование длительного считывания , а также оптические карты Bionano и Hi-Fi с высоким охватом. C Illumina Секвенирование короткого считывания . Для анализа 18 дополнительных образцов они использовали протокол несрезанного длинного считывания нанопор, что привело к примерно 60-кратному охвату данных несрезанного секвенирования. [1]

Сборка геномов

[ редактировать ]

Трио-Хифиазм. [6] [7] Инструмент был выбран в качестве основного ассемблера после тщательного сравнения множества альтернатив. Trio-Hifiasm использует последовательности длинного считывания PacBio HiFi и родительские последовательности короткого считывания Illumina для создания высокофазированных сборок контигов. [1]

Построение графа пангенома

[ редактировать ]

Для построения графа пангенома использовались три разных инструмента:

  • Minigraph : представляет собой методологию, которая отличается быстрым выполнением преобразования сборки в граф за счет использования алгоритма minimap2. [8] [9] добавляет новые обнаруженные SV (более или равные 50 п.н.) к графику, который изначально был создан на основе эталонных входных данных, которыми в данном случае был GRCh38 . В целом этот метод жадным образом
  • Minigraph-Cactus (MC) : Целью этого метода является включение в график меньших вариантов, в идеале вплоть до уровня SNP. [10] [11] это позволяет графу отображать большинство вариаций геномов и представляет каждый гаплотип как путь на графе.
  • Pangenome Graph Builder (PGGB) : метод сравнения всех со всеми, который строит график (без учета каких-либо ссылок), представляющий все совпадения между геномами. Этот метод состоит из 3 этапов: [ нужна ссылка ]
    1. Выравнивание: выравниватель wfmash использовался для создания выравнивания «все против всех» входных последовательностей.
    2. Индукция графа: секвиш
    3. Нормализация графа: Smoothxg

Приложения

[ редактировать ]

Маленькие варианты

[ редактировать ]

Следует отметить применение обнаружения коротких вариантов на основе пангенома, включающее выравнивание коротких чтений с графом пангенома для повышения точности вызова небольших вариантов, таких как SNP и indels . Этот метод должен демонстрировать улучшенную эффективность по сравнению с традиционными подходами, особенно в сложных регионах и генах, имеющих медицинское значение. Более того, пангеном якобы помогает в вызове вариантов в тройках родитель-потомок, потенциально повышая точность в этом контексте. [1]

Структурные варианты

[ редактировать ]

Другое ключевое применение заключается в SV генотипировании (SV) с разрешением последовательности , где структурные варианты внутри пангенома позволяют идентифицировать и генотипировать различные аллели SV . [1]

Тандемное повторение с переменным номером

[ редактировать ]

об улучшениях в VNTR (тандемных повторов с переменным числом) картировании областей секвенирования РНК , картировании , иммунопреципитации хроматина и анализе секвенирования . Также сообщалось [ нужна ссылка ] Таким образом, пангеном рассматривается как ресурс с потенциалом для улучшения обнаружения вариантов, популяционного генетического анализа и обнаружения сложных генетических событий, которые не могут быть идентифицированы с помощью обычных эталонных геномов . [1]

Ограничения

[ редактировать ]
Доступные в настоящее время приложения и инструменты для справочника по пангеному человека. [12]

Отсутствие устоявшихся инструментов

[ редактировать ]

Большинство разработанных в настоящее время инструментов совместимы с GRCh38 , эталонным геномом человека. Известно, что обнаружение вариантов с использованием эталонного генома человека не может охватить все вариации, поскольку ему не хватает разнообразия, а также оно не является полным и точным. Использование графических ссылок для выравнивания может повысить точность анализа, поскольку он становится более разнообразным и полным. [12]

Проблемы с масштабированием

[ редактировать ]

По оценкам, к 2025 году количество секвенированных геномов составит от 100 миллионов до 2 миллиардов, что, в соответствии с тенденциями цен, хранилище для хранения этих данных будет дорогим и проблематичным. [12] С ростом доступности данных о личном геноме первоначальный размер набора данных - в настоящее время исчисляемый тысячами геномов в масштабе гигабаз - будет расти в геометрической прогрессии. Этот рост потребует разработки более эффективных алгоритмов анализа и форматов представления данных, которые смогут справиться с растущими требованиями к времени, памяти и пространству для хранения. [12]

Проблемы конфиденциальности при расширении набора данных

[ редактировать ]

Расширение ссылки на пангеном человека до предложенных 700 гаплотипов (350 особей) создает проблемы с обеспечением инклюзивности из-за языковых, грамотных, социально-экономических барьеров и недоверия между расово-этническими меньшинствами и аборигенами. Получение информированного согласия становится сложным, поскольку участникам необходимо понимать последствия проекта. Сочетание публикации геномных данных после анализа с этическими соображениями представляет собой дилемму, касающуюся полного раскрытия информации. [12]

  1. ^ Перейти обратно: а б с д и ж г час я дж к л м Ляо, Вэнь-Вэй; Асри, Мобин; Эблер, Яна; Дорр, Дэниел; Хаукнесс, Марина; Хикки, Гленн; Лу, Шуанцзя; Лукас, Джулиан К.; Монлонг, Жан; Абель, Хейли Дж.; Буонаиуто, Сильвия; Чанг, Сиань Х.; Ченг, Хаоюй; Чу, Джастин; Колонна, Винченца (май 2023 г.). «Проект справочника по пангеному человека» . Природа . 617 (7960): 312–324. Бибкод : 2023Natur.617..312L . дои : 10.1038/s41586-023-05896-x . ISSN   1476-4687 . ПМЦ   10172123 . ПМИД   37165242 .
  2. ^ Абондио, Паоло; Чилли, Элизабетта; Луизелли, Доната (июнь 2023 г.). «Пангеномика человека: перспективы и проблемы распределенной геномной ссылки» . Жизнь . 13 (6): 1360. Бибкод : 2023Life...13.1360A . дои : 10.3390/life13061360 . ISSN   2075-1729 . ПМЦ   10304804 . ПМИД   37374141 .
  3. ^ Перейти обратно: а б Ли, ХоДжун; Грир, Стефани У.; Павличин Дмитрий С.; Чжоу, Бо; Урбан, Александр Э.; Вайсман, Цахи; Ляо, Вэнь-Вэй; Асри, Мобин; Эблер, Яна; Дорр, Дэниел; Хаукнесс, Марина; Хикки, Гленн; Лу, Шуанцзя; Лукас, Джулиан К.; Монлонг, Жан (28 августа 2023 г.). «Теги панконсервативных сегментов идентифицируют ультраконсервативные последовательности во всех сборках пангенома человека» . Методы отчетов по ячейкам . 3 (8): 100543. doi : 10.1016/j.crmeth.2023.100543 . ISSN   2667-2375 . ПМЦ   10475782 . ПМИД   37671027 .
  4. ^ Перейти обратно: а б Ван, Т; Антоначчи-Фултон, Л; Хау, К; Лоусон, штат Ха; Лукас, Дж. К.; Филиппи, AM; Попджой, AB; Асри, М; Карсон, К; Чессон, MJP; Чанг, X; Кук-Диган, Р.; Фельзенфельд, Алабама; Фултон, РС; Гаррисон, EP; Гаррисон, Северная Каролина; Грейвс-Линдси, штат Техас; Джи, Х; Кенни, Э.Э.; Кениг, бакалавр искусств; Ли, Д; Маршалл, Т; МакМайкл, Дж. Ф.; Новак, AM; Пурушотам, Д; Шнайдер, Вирджиния; Шульц, Б.И.; Смит, Миссури; София, HJ; Вайсман, Т; Фличек, П; Ли, Х; Мига, К.Х.; Патен, Б; Джарвис, Эд; Холл, ИМ; Эйхлер, Э.Э.; Хаусслер, Д; Справочник по пангеному человека, Консорциум (апрель 2022 г.). «Проект «Пангеном человека»: глобальный ресурс для картирования геномного разнообразия» . Природа . 604 (7906): 437–446. дои : 10.1038/s41586-022-04601-8 . ПМЦ   9402379 . ПМИД   35444317 .
  5. ^ «Новая ссылка на «пангеном» человека» . www.genome.gov . Проверено 23 февраля 2024 г.
  6. ^ Джарвис, Эрих Д.; Форменти, Джулио; Ри, Аран; Гуаррачино, Андреа; Ян, Чентао; Вуд, Джонатан; Трейси, Алан; Тибо-Ниссен, Франсуаза; Фоллгер, Митчелл Р.; Порубский, Дэвид; Ченг, Хаоюй; Асри, Мобин; Логсдон, Гленнис А.; Карневали, Паоло; Чессон, Марк Дж. П. (ноябрь 2022 г.). «Полуавтоматическая сборка высококачественных диплоидных эталонных геномов человека» . Природа . 611 (7936): 519–531. Бибкод : 2022Natur.611..519J . дои : 10.1038/s41586-022-05325-5 . ISSN   1476-4687 . ПМЦ   9668749 . ПМИД   36261518 .
  7. ^ Ли, Хэн; Блум, Джонатан М.; Фарджун, Йоси; Флехарти, Марк; Готье, Лаура; Нил, Бенджамин; Макартур, Дэниел (август 2018 г.). «Эталон синтетического диплоида для точной оценки вариантов» . Природные методы . 15 (8): 595–597. дои : 10.1038/s41592-018-0054-7 . ISSN   1548-7105 . ПМК   6341484 . ПМИД   30013044 .
  8. ^ Ли, Хэн; Фэн, Сяовэнь; Чу, Чонг (16 октября 2020 г.). «Проектирование и построение эталонных графов пангенома с миниграфикой» . Геномная биология . 21 (1): 265. дои : 10.1186/s13059-020-02168-z . ISSN   1474-760X . ПМЦ   7568353 . ПМИД   33066802 .
  9. ^ Ли, Хэн (10 мая 2018 г.). «Миникарта2: попарное выравнивание нуклеотидных последовательностей» . Биоинформатика . 34 (18): 3094–3100. doi : 10.1093/биоинформатика/bty191 . ISSN   1367-4803 . ПМК   6137996 . ПМИД   29750242 .
  10. ^ Хикки, Гленн; Монлонг, Жан; Эблер, Яна; Новак, Адам М.; Эйзенга, Джордан М.; Гао, Ян; Маршалл, Тобиас; Ли, Хэн; Патен, Бенедикт (10 мая 2023 г.). «Построение графа пангенома на основе выравнивания генома с помощью Minigraph-Cactus» . Природная биотехнология . 42 (4): 663–673. дои : 10.1038/s41587-023-01793-w . ISSN   1546-1696 . ПМЦ 10638906. ПМИД   37165083 .
  11. ^ Армстронг, Джоэл; Хикки, Гленн; Диканс, Марк; Фиддес, Ян Т.; Новак, Адам М.; Деран, Олден; Фан, Ци; Се, Дуо; Фэн, Шаохун; Стиллер, Жозефин; Женеро, Диана; Джонсон, Джереми; Маринеску, Войчита Дана; Альфельди, Джессика; Харрис, Роберт С. (ноябрь 2020 г.). «Progressive Cactus — это многогеномный выравниватель для эры тысяч геномов» . Природа . 587 (7833): 246–251. Бибкод : 2020Natur.587..246A . дои : 10.1038/s41586-020-2871-y . ISSN   1476-4687 . ПМЦ   7673649 . ПМИД   33177663 .
  12. ^ Перейти обратно: а б с д и Сингх, Випин; Панди, Света; Бхардвадж, Аншу (2022). «От эталонного генома человека к пангеному человека: предпосылка, обещание и вызов» . Границы генетики . 13 . дои : 10.3389/fgene.2022.1042550 . ISSN   1664-8021 . ПМЦ   9684177 . ПМИД   36437921 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d534df2ec51bc1267d4cb5d878729623__1719873900
URL1:https://arc.ask3.ru/arc/aa/d5/23/d534df2ec51bc1267d4cb5d878729623.html
Заголовок, (Title) документа по адресу, URL1:
Human Pangenome Reference - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)