Mega2, среда манипуляций для генетического анализа
Оригинальный автор(ы) | Предыдущие программисты: Чарльз П. Коллар, Нандита Мукхопадьяй, Ли Алмаси, Марк Шредер, Уильям П. Малвихилл. |
---|---|
Разработчик(и) | Дэниел Э. Уикс, Роберт В. Бэрон, Джастин Р. Стикель. |
Первоначальный выпуск | 16 января 2000 г |
Стабильная версия | 5.0.1
/ 13 декабря 2018 г |
Репозиторий | |
Написано в | С++ |
Операционная система | Linux , Mac OS X , Microsoft Windows |
Тип | Прикладная статистическая генетика, Биоинформатика |
Лицензия | Стандартная общественная лицензия GNU версии 3. |
Веб-сайт | Ватсон |
Mega2 — это программное обеспечение для обработки данных для прикладной статистической генетики. Мега — это аббревиатура от « Среда манипулирования для генетического анализа» .
Программное обеспечение позволяет специалистам по статистической генетике преобразовывать данные из нескольких входных форматов в большое количество выходных форматов, пригодных для анализа с помощью широко используемых пакетов программного обеспечения. [ 1 ] [ 2 ] [ 3 ] [ 4 ] В типичном исследовании генетики человека аналитику часто приходится использовать множество различных программ для анализа данных, и эти программы обычно требуют, чтобы данные были отформатированы в соответствии с точными входными спецификациями. Преобразование данных в эти различные форматы может быть утомительным, отнимающим много времени и подверженным ошибкам. Mega2, предоставляя проверенные конвейеры преобразования, может ускорить анализ и уменьшить количество ошибок.
Mega2 создает общее промежуточное представление данных с использованием SQLite3, которое обеспечивает доступ к данным из других программ и языков. В частности, пакет Mega2R R преобразует данные SQLite3 в кадры данных R. Предоставляется несколько функций R, которые иллюстрируют, как данные могут быть извлечены из кадров данных для общего анализа R, например SKAT и pedgene . Ключом к успеху является возможность эффективно извлекать генотипы, соответствующие выбранным подмножествам маркеров, чтобы облегчить тестирование ассоциаций на основе генов за счет автоматизации циклического перебора генов в геноме. Другая функция преобразует данные в формат VCF, а другая — в формат GenABEL . Подробнее о пакете Mega2R смотрите здесь .
Mega2 использовался для облегчения генетического анализа широкого спектра человеческих качеств, включая наследственную дистонию, [ 5 ] синдром Элерса-Данлоса, [ 6 ] рассеянный склероз, [ 7 ] и глиомы. [ 8 ] Список статей PubMed Central со ссылкой на Mega2 можно увидеть здесь .
Mega2, которая занимается переформатированием данных, не следует путать с программой MEGA, программой молекулярно-эволюционного генетического анализа , которая фокусируется на молекулярной эволюции и филогенетике.
Форматы входных файлов
[ редактировать ]Mega2 принимает входные данные в различных широко используемых форматах файлов. Они содержат, как минимум, данные о фенотипах, генотипах маркеров, любых семейных структурах и положениях маркеров на карте.
Формат ввода | Описание | Ссылки |
---|---|---|
СВЯЗЬ [ 9 ] [ 10 ] [ 11 ] [ 12 ] | предварительно созданные или пост-сделанные форматы | Руководство пользователя Linkage (PDF) , формат LINKAGE |
Мега2 [ 1 ] [ 2 ] [ 3 ] [ 4 ] | упрощенный/дополненный формат LINKAGE | формат Мега2 |
ПЛИНК [ 13 ] | пед-формат или бинарный формат кровати | Документация ПЛИНК |
VCF или BCF [ 14 ] | Вариант формата вызова или двоичный вариант формата вызова | Вариант формата вызова (запись в Википедии) , документация BCF |
ВМЕНИТЬ2 [ 15 ] [ 16 ] | Форматы IMPUTE2 GEN и BGEN | Документация IMPUTE2 , формат GEN , формат BGEN |
Форматы выходных файлов
[ редактировать ]Mega2 поддерживает преобразование в следующие выходные форматы.
Документация
[ редактировать ]Документация Mega2 доступна здесь в формате HTML и здесь в формате PDF.
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Мухопадхьяй, Н.; Алмасы Л; Шредер М; Малвихилл В.П.; Уикс DE (1999). «Mega2, программа обработки данных для облегчения анализа генетических связей и ассоциаций». Ам Джей Хум Жене . 65 : А436.
- ^ Перейти обратно: а б с Мухопадхьяй, Н.; Алмасы Л; Шредер М; Малвихилл В.П.; Уикс DE (2005). «Mega2: обработка данных для облегчения анализа генетических связей и ассоциаций» . Биоинформатика . 21 (10): 2556–2557. doi : 10.1093/биоинформатика/bti364 . ПМИД 15746282 .
- ^ Перейти обратно: а б с Коллар, КП; барон Р.В.; Мухопадхьяй Н; Weeks DE (октябрь 2013 г.). «Mega2: улучшенная обработка данных для облегчения анализа генетических связей и ассоциаций» . Представлено на 63-м ежегодном собрании Американского общества генетики человека, Бостон : Аннотация, 1831 г.
- ^ Перейти обратно: а б с Барон Р.В., Коллар С., Мухопадьяй Н., Уикс Д.Э. (2014). «Mega2: проверенное переформатирование данных для анализа связей и ассоциаций» . Исходный код Биол Мед . 9 (1): 26. дои : 10.1186/s13029-014-0026-y . ПМК 4269913 . ПМИД 25687422 .
- ^ Хершесон Дж., Менкаччи Н.Е., Дэвис М., Макдональд Н., Трабзуни Д., Райтен М., Питтман А., Паудел Р., Кара Э., Фосетт К., Планнол В., Бхатия К.П., Медлар А.Дж., Станеску ХК, Харди Дж., Клета Р., Вуд Н.В. , Хоулден Х (2013). «Мутации в ауторегуляторном домене бета-тубулина 4а вызывают наследственную дистонию» . Энн Нейрол . 73 (4): 546–553. дои : 10.1002/ana.23832 . ПМЦ 3698699 . ПМИД 23424103 .
- ^ Бауманн М, Джунта С, Крабихлер Б, Рушендорф Ф, Зоппи Н, Коломби М, Биттнер Р.Э., Кихано-Рой С, Мунтони Ф, Чирак С, Шрайбер Г, Зоу Ю, Ху Ю, Ромеро Н.Б., Карлье Р.Ю., Амбергер А, Дойчманн А., Штрауб В., Рорбах М., Штайнманн Б., Ростази К., Каралл Д., Боннеманн К.Г., Зшоке Дж., Фаут К. (2012). «Мутации в FKBP14 вызывают вариант синдрома Элерса-Данлоса с прогрессирующим кифосколиозом, миопатией и потерей слуха» . Ам Джей Хум Жене . 90 (2): 201–216. дои : 10.1016/j.ajhg.2011.12.004 . ПМЦ 3276673 . ПМИД 22265013 .
- ^ Даймент Д.А., Кадер М.З., Чао М.Дж., Линкольн М.Р., Моррисон К.М., Дисанто Дж., Морахан Дж.М., Де Лука Г.К., Садовник А.Д., Лепаж П., Монтпети А., Эберс Г.К., Рамагопалан С.В. (2012). «Секвенирование экзома идентифицирует новый вариант предрасположенности к рассеянному склерозу в гене TYK2» . Неврология . 79 (5): 406–411. дои : 10.1212/wnl.0b013e3182616fc4 . ПМК 3405256 . ПМИД 22744673 .
- ^ Шете С., Лау CC, Хоулстон Р.С., Клаус Э.Б., Барнхольц-Слоан Дж., Лай Р., Ильясова Д., Шильдкраут Дж., Садецки С., Йохансен С., Бернштейн Дж.Л., Олсон Ш., Дженкинс Р.Б., Ян П., Вик Н.А., Ренш М, Дэвис Ф.Г., Маккарти Б.Дж., Люн Э.Х., Дэвис К., Ченг Р., Хоскинг Ф.Дж., Армстронг Г.Н., Лю Ю., Ю.РК., Хенрикссон Р., Глиоген С., Мелин Б.С., Бонди М.Л. (2011). «Поиск SNP-связей высокой плотности по всему геному для локусов предрасположенности к глиоме: результаты Консорциума Gliogene» . Рак Рез . 71 (24): 7568–7575. дои : 10.1158/0008-5472.can-11-0013 . ПМК 3242820 . ПМИД 22037877 .
- ^ Перейти обратно: а б с Латроп Г.М., Лалуэль Дж.М. (1984). «Простые расчеты показателей лодыжки и генетических рисков на небольших компьютерах» . Ам Джей Хум Жене . 36 (2): 460–465. ПМК 1684427 . ПМИД 6585139 .
- ^ Перейти обратно: а б с Латроп Г.М., Лалуэль Дж.М., Жюльер С., Отт Дж. (1985). «Анализ мультилокусного сцепления у человека: обнаружение сцепления и оценка рекомбинации» . Ам Джей Хум Жене . 37 (3): 482–498. ПМК 1684598 . ПМИД 3859205 .
- ^ Перейти обратно: а б с Латроп Г.М., Лалуэль Дж.М., Уайт Р.Л. (1986). «Построение карт человеческих связей: расчеты вероятности для многолокусного анализа». Генет Эпидемиол . 3 (1): 39–52. дои : 10.1002/gepi.1370030105 . ПМИД 3957003 . S2CID 29289413 .
- ^ Перейти обратно: а б с Латроп Г.М., Лалуэль Дж.М. (1988). «Эффективные вычисления в анализе многолокусного сцепления» . Ам Джей Хум Жене . 42 (3): 498–505. ПМЦ 1715153 . ПМИД 3162348 .
- ^ Перейти обратно: а б Перселл С., Нил Б., Тодд-Браун К., Томас Л., Феррейра М.А., Бендер Д., Маллер Дж., Склар П., де Баккер П.И., Дейли М.Дж., Шам ПК (2007). «PLINK: набор инструментов для полногеномного анализа связей и популяционного анализа связей» . Ам Джей Хум Жене . 81 (3): 559–575. дои : 10.1086/519795 . ПМК 1950838 . ПМИД 17701901 .
- ^ Перейти обратно: а б Данечек П., Аутон А., Абекасис Г., Альберс К.А., Бэнкс Е., ДеПристо М.А. и др. (2011). «Вариант формата вызова и VCFtools» . Биоинформатика . 27 (15): 2156–8. doi : 10.1093/биоинформатика/btr330 . ПМК 3137218 . ПМИД 21653522 .
- ^ Хоуи Б.Н., Доннелли П., Марчини Дж. (2009). «Гибкий и точный метод вменения генотипа для нового поколения полногеномных исследований ассоциаций» . ПЛОС Генет . 5 (6): e1000529. дои : 10.1371/journal.pgen.1000529 . ПМЦ 2689936 . ПМИД 19543373 .
- ^ Марчини Дж., Хоуи Б. (2010). «Вменение генотипа для полногеномных исследований ассоциаций». Нат преподобный Жене . 11 (7): 499–511. дои : 10.1038/nrg2796 . ПМИД 20517342 . S2CID 1465707 .
- ^ Гудбьартссон Д.Ф., Йонассон К., Фригге М.Л., Конг А. (2000). «Аллегро, новая компьютерная программа для анализа многоточечных связей». Нат Жене . 25 (1): 12–13. дои : 10.1038/75514 . ПМИД 10802644 . S2CID 27362146 .
- ^ Браунинг С.Р., Браунинг Б.Л. (2007). «Быстрое и точное фазирование гаплотипов и вывод недостающих данных для исследований ассоциаций всего генома с использованием локализованной кластеризации гаплотипов» . Ам Джей Хум Жене . 81 (5): 1084–1097. дои : 10.1086/521987 . ПМК 2265661 . ПМИД 17924348 .
- ^ Браунинг Б.Л., Браунинг С.Р. (2009). «Единый подход к вменению генотипов и выводу гаплотипов для больших наборов данных по трио и неродственным людям» . Ам Джей Хум Жене . 84 (2): 210–223. дои : 10.1016/j.ajhg.2009.01.005 . ПМК 2668004 . ПМИД 19200528 .
- ^ Макинен В.П., Паркконен М., Вессман М., Груп ПХ, Каннинен Т., Каски К. (2005). «Высокопроизводительное рисование родословной» . Eur J Hum Genet . 13 (8): 987–989. дои : 10.1038/sj.ejhg.5201430 . ПМИД 15870825 .
- ^ Прайс А.Л., Паттерсон, Нью-Джерси, Пленге Р.М., Вайнблатт М.Е., Шадик Н.А., Райх Д. (2006). «Анализ основных компонентов корректирует стратификацию в полногеномных исследованиях ассоциаций». Нат Жене . 38 (8): 904–909. дои : 10.1038/ng1847 . ПМИД 16862161 . S2CID 8127858 .
- ^ Паттерсон Н., Прайс А.Л., Райх Д. (2006). «Структура населения и собственный анализ» . ПЛОС Генет . 2 (12): е190. дои : 10.1371/journal.pgen.0020190 . ПМЦ 1713260 . ПМИД 17194218 .
- ^ Лэрд Н.М., Хорват С., Сюй Икс (2000). «Внедрение единого подхода к семейным тестам ассоциации». Генет Эпидемиол . 19 (Приложение 1): S36–42. doi : 10.1002/1098-2272(2000)19:1+<::aid-gepi6>3.3.co;2-d . ПМИД 11055368 .
- ^ Кругляк Л., Дейли М.Дж., Рив-Дейли М.П., Ландер Э.С. (1996). «Параметрический и непараметрический анализ связей: единый многоточечный подход» . Ам Джей Хум Жене . 58 (6): 1347–1363. ПМК 1915045 . ПМИД 8651312 .
- ^ Конг А., Кокс, Нью-Джерси (1997). «Модели совместного использования аллелей: показатели LOD и точные тесты сцепления» . Ам Джей Хум Жене . 61 (5): 1179–1188. дои : 10.1086/301592 . ПМК 1716027 . ПМИД 9345087 .
- ^ Ван З, МакПик М.С. (2009). «Квазиправдоподобный подход к исследованию генетических ассоциаций на основе гаплотипов родственных лиц» . J Am Stat Assoc . 104 (487): 1251–1260. дои : 10.1198/jasa.2009.tm08507 . ПМК 2860453 . ПМИД 20428335 .
- ^ Эбни М. (2009). «Графический алгоритм для быстрого вычисления коэффициентов идентичности и обобщенных коэффициентов родства» . Биоинформатика . 25 (12): 1561–1563. doi : 10.1093/биоинформатика/btp185 . ПМЦ 2687941 . ПМИД 19359355 .
- ^ Хит СК (1997). «Сегрегация и анализ сцепления цепи Маркова по методу Монте-Карло для олигогенных моделей» . Ам Джей Хум Жене . 61 (3): 748–760. дои : 10.1086/515506 . ПМК 1715966 . ПМИД 9326339 .
- ^ Хоуи Б., Фуксбергер С., Стивенс М., Марчини Дж., Абекасис Г.Р. (2012). «Быстрое и точное определение генотипа в полногеномных исследованиях ассоциаций посредством предварительной фазы» . Нат Жене . 44 (8): 955–959. дои : 10.1038/ng.2354 . ПМК 3696580 . ПМИД 22820512 .
- ^ Фуксбергер С., Абекасис Г.Р., Хиндс Д.А. (2015). «minimac2: более быстрое определение генотипа» . Биоинформатика . 31 (5): 782–784. doi : 10.1093/биоинформатика/btu704 . ПМК 4341061 . ПМИД 25338720 .
- ^ Алькаис А., Филиппы А., Абель Л. (1999). «Анализ сцепления без генетической модели с использованием биномиального метода максимального правдоподобия для категориальных признаков» . Генет Эпидемиол . 17 (Приложение 1): S467–472. дои : 10.1002/gepi.1370170775 . ПМИД 10597477 .
- ^ Перейти обратно: а б Ланге К., Папп Дж.К., Зиншаймер Дж.С., Шрипрача Р., Чжоу Х., Собел Э.М. (2013). «Мендель: швейцарский армейский нож программ генетического анализа» . Биоинформатика . 29 (12): 1568–1570. doi : 10.1093/биоинформатика/btt187 . ПМЦ 3673222 . ПМИД 23610370 .
- ^ Перейти обратно: а б Абекасис Г.Р., Черный С.С., Куксон В.О., Кардон Л.Р. (2002). «Мерлин - быстрый анализ плотных генетических карт с использованием разреженных деревьев потоков генов». Нат Жене . 30 (1): 97–101. дои : 10.1038/ng786 . ПМИД 11731797 . S2CID 12226524 .
- ^ Перейти обратно: а б Собель Э, Ланге К (1996). «Графики происхождения в анализе родословной: приложения к гаплотипированию, оценкам местоположения и статистике совместного использования маркеров» . Ам Джей Хум Жене . 58 (6): 1323–1337. ПМК 1915074 . ПМИД 8651310 .
- ^ Томпсон Э.А. (1994). «Вероятность Монте-Карло в генетическом картировании сложных признаков». Philos Trans R Soc Lond B Biol Sci . 344 (1310): 345–350, обсуждение 350–341. дои : 10.1098/rstb.1994.0073 . ПМИД 7800704 .
- ^ Томпсон Э.А. (1994). «Вероятность Монте-Карло в генетическом картировании» . Статистическая наука . 9 (3): 355–366. дои : 10.1214/ss/1177010381 .
- ^ Хасстедт С.Дж. (2005). «jPAP: Программное обеспечение для генетического анализа, управляемое документами». Генет Эпидемиол . 29 : 255.
- ^ МакПик М.С., Сан Л. (2000). «Статистические тесты для выявления неверно определенных связей с использованием данных геномного скрининга» . Ам Джей Хум Жене . 66 (3): 1076–1094. дои : 10.1086/302800 . ПМЦ 1288143 . ПМИД 10712219 .
- ^ Сан Л., Уайлдер К., МакПик М.С. (2002). «Усовершенствованное обнаружение ошибок в родословной». Хум Херед . 54 (2): 99–110. дои : 10.1159/000067666 . ПМИД 12566741 . S2CID 26992288 .
- ^ Торнтон Т., МакПик М.С. (2010). «ROADTRIPS: тестирование ассоциации случай-контроль с частично или полностью неизвестной популяцией и родословной структурой» . Ам Джей Хум Жене . 86 (2): 172–184. дои : 10.1016/j.ajhg.2010.01.001 . ПМК 2820184 . ПМИД 20137780 .
- ^ Делано О., Марчини Дж., Загури Дж. Ф. (2012). «Метод поэтапного линейного усложнения для тысяч геномов». Нат-методы . 9 (2): 179–81. дои : 10.1038/nmeth.1785 . ПМИД 22138821 . S2CID 13765612 .
- ^ Делано О., Загури Дж. Ф., Марчини Дж. (2013). «Улучшенная полнохромосомная фазировка для исследований заболеваний и популяционной генетики». Нат-методы . 10 (1): 5–6. дои : 10.1038/nmeth.2307 . ПМИД 23269371 . S2CID 205421216 .
- ^ Делано О., Хоуи Б., Кокс А.Дж., Загури Дж.Ф., Марчини Дж. (2013). «Оценка гаплотипа с использованием считываний секвенирования» . Ам Джей Хум Жене . 93 (4): 687–96. дои : 10.1016/j.ajhg.2013.09.002 . ПМК 3791270 . ПМИД 24094745 .
- ^ О'Коннелл Дж., Гурдасани Д., Делано О., Пирасту Н., Уливи С., Кокка М. и др. (2014). «Общий подход к поэтапному распределению гаплотипов по всему спектру родства» . ПЛОС Генет . 10 (4): e1004234. дои : 10.1371/journal.pgen.1004234 . ПМК 3990520 . ПМИД 24743097 .
- ^ Делано О., Марчини Дж. Консорциум проекта «1000 геномов» (2014). «Интеграция данных последовательности и массива для создания улучшенной справочной панели гаплотипов Проекта 1000 геномов» . Нат Коммун . 5 : 3934. Бибкод : 2014NatCo...5.3934. . дои : 10.1038/ncomms4934 . ПМЦ 4338501 . ПМИД 25653097 .
- ^ Спир М., Тервиллигер Дж. Д., Отт Дж. (1992). «Хромосомный метод быстрого компьютерного моделирования». Ам Джей Хум Жене . 51 : А202.
- ^ Уикс Д.Э., Отт Дж., Латроп Г.М. (1990). «SLINK: общая программа моделирования для анализа связей». Ам Джей Хум Жене . 47 (3): А204.
- ^ Перейти обратно: а б Шеффер А.А., Лемир М., Отт Дж., Латроп Г.М., Уикс DE (2011). «Скоординированное условное моделирование с помощью SLINK и SUP многих маркеров, связанных или связанных с признаком в крупных родословных» . Хум Херед . 71 (2): 126–134. дои : 10.1159/000324177 . ПМК 3136384 . ПМИД 21734403 .
- ^ Бланджеро Дж., Алмаши Л. (1997). «Многоточечный анализ олигогенных связей количественных признаков». Генет Эпидемиол . 14 (6): 959–964. doi : 10.1002/(sici)1098-2272(1997)14:6<959::aid-gepi66>3.0.co;2-k . ПМИД 9433607 . S2CID 11630296 .
- ^ Алмаши Л., Бланджеро Дж. (1998). «Многоточечный количественный анализ связей признаков в общих родословных» . Ам Джей Хум Жене . 62 (5): 1198–1211. дои : 10.1086/301844 . ПМЦ 1377101 . ПМИД 9545414 .
- ^ Холманс П. (1993). «Асимптотические свойства анализа сцепления затронутых сибс-пар» . Ам Джей Хум Жене . 52 (2): 362–374. ПМЦ 1682211 . ПМИД 8430697 .
- ^ Лемир М (2006). «SUP: расширение SLINK, позволяющее моделировать большее количество маркерных локусов в родословных в зависимости от значений признаков» . БМК Генет . 7:40 . дои : 10.1186/1471-2156-7-40 . ПМЦ 1524809 . ПМИД 16803631 .
- ^ Причард Дж. К., Стивенс М., Доннелли П. (2000). «Вывод о структуре популяции с использованием данных мультилокусного генотипа» . Генетика . 155 (2): 945–959. дои : 10.1093/генетика/155.2.945 . ПМК 1461096 . ПМИД 10835412 .
- ^ Фалуш Д., Стивенс М., Причард Дж.К. (2003). «Вывод о структуре популяции с использованием данных мультилокусного генотипа: связанные локусы и коррелированные частоты аллелей» . Генетика . 164 (4): 1567–1587. дои : 10.1093/генетика/164.4.1567 . ПМЦ 1462648 . ПМИД 12930761 .
- ^ Фалуш Д., Стивенс М., Причард Дж.К. (2007). «Вывод о структуре популяции с использованием данных мультилокусного генотипа: доминантные маркеры и нулевые аллели» . Заметки Мол Экол . 7 (4): 574–578. дои : 10.1111/j.1471-8286.2007.01758.x . ЧВК 1974779 . ПМИД 18784791 .
- ^ Ланге К., Уикс Д., Бенке М. (1988). «Программы для анализа родословных: MENDEL, FISHER и dGENE» (PDF) . Генет Эпидемиол . 5 (6): 471–472. дои : 10.1002/gepi.1370050611 . hdl : 2027.42/101847 . ПМИД 3061869 . S2CID 44260724 .
- ^ О'Коннелл-младший, Уикс DE (1995). «Алгоритм VITESSE для быстрого точного анализа многолокусного сцепления посредством перекодирования набора генотипов и нечеткого наследования». Нат Жене . 11 (4): 402–408. дои : 10.1038/ng1295-402 . ПМИД 7493020 . S2CID 12496754 .