PLINK (набор генетических инструментов)
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
ПЛИНК [ 1 ] — это бесплатный, широко используемый набор инструментов для анализа ассоциаций всего генома с открытым исходным кодом , разработанный Шоном Перселлом . Программное обеспечение спроектировано гибко и позволяет выполнять широкий спектр базовых крупномасштабных генетических анализов.
PLINK в настоящее время поддерживает следующие функции:
- управление данными;
- базовая статистика ( F ST , недостающие данные, тесты равновесия Харди–Вайнберга , коэффициент инбридинга и т. д.);
- расчет неравновесия по сцеплению (LD);
- идентичности по происхождению (IBD) и идентичности по состоянию (IBS); Расчет матрицы
- стратификация населения , такая как анализ главных компонентов ;
- ассоциативный анализ, такой как полногеномное исследование ассоциаций как для базовых исследований «случай/контроль», так и для количественных признаков;
- тесты на эпистаз
Входные и выходные файлы
[ редактировать ]PLINK имеет собственный формат текстовых файлов (.ped) и двоичных текстовых файлов (.bed), которые служат входными файлами для большинства анализов. [ 2 ] Файл .map сопровождает файл .ped и предоставляет информацию о вариантах, а файлы .bim и .fam сопровождают файлы .bed как часть двоичного набора данных. Кроме того, PLINK принимает входные файлы VCF , BCF, Oxford и 23andMe, которые обычно извлекаются в двоичный формат .bed перед выполнением желаемого анализа. В некоторых форматах, таких как VCF, некоторая информация, такая как фаза и дозировка, будет отброшена.
PLINK имеет множество выходных файлов в зависимости от анализа. PLINK имеет возможность выводить файлы для BEAGLE и может перекодировать файл .bed в VCF для анализа в других программах. Кроме того, PLINK предназначен для работы в сочетании с R и может выводить файлы для обработки определенными пакетами R.
Расширения и текущие разработки
[ редактировать ]- PLINK 2.0 — комплексное обновление PLINK, разработанное Кристофером Чангом, с улучшенной скоростью различных вычислений общегеномных ассоциаций (GWA), включая расчет матрицы идентичности по состоянию (IBS), обрезку на основе LD и анализ ассоциаций. [ 3 ]
- PLINK/SEQ — это библиотека C/C++ с открытым исходным кодом, предназначенная для анализа крупномасштабных исследований всего генома и всего экзома.
- MQFAM — это многомерный тест ассоциации (MQFAM), который можно эффективно применять к большим генеральным выборкам и который реализован в PLINK.
Ссылки
[ редактировать ]- ^ Перселл С; Нил Б; Тодд-Браун К.; Томас Л; Феррейра МАР; Бендер Д; Маллер Дж; Склар П; де Баккер PIW; Дейли М.Дж.; Фальшивый ПК (2007). «PLINK: набор инструментов для полногеномной ассоциации и популяционного анализа связей» . Американский журнал генетики человека . 81 (3): 559–75. дои : 10.1086/519795 . ПМК 1950838 . ПМИД 17701901 .
- ^ Кристофер Чанг (2017). «Справочник по форматам файлов PLINK 1.9» (PDF) . Биобанк Великобритании при Оксфордском университете . Проверено 5 августа 2022 г.
Форматы входных и выходных файлов PLINK, которые можно идентифицировать по расширению файла.
- ^ Ли, Джеймс Дж.; Перселл, Шон М.; Ваттикути, Шашаанк; Телье, Лоран САМ; Чоу, Карсон К.; Чанг, Кристофер К. (01 декабря 2015 г.). «PLINK второго поколения: решение проблемы более крупных и богатых наборов данных» . ГигаСайенс . 4 (1): 7. дои : 10.1186/s13742-015-0047-8 . ПМЦ 4342193 . ПМИД 25722852 .