Многофакторное снижение размерности
Многофакторное снижение размерности ( MDR ) — это статистический подход, также используемый в машинного обучения . автоматических подходах [1] для обнаружения и описания комбинаций атрибутов или независимых переменных , которые взаимодействуют, оказывая влияние на зависимую переменную или переменную класса. [2] [3] [4] [5] [6] [7] [8] MDR был разработан специально для выявления неаддитивных взаимодействий между дискретными переменными, которые влияют на бинарный результат, и считается непараметрической и не требующей моделей альтернативой традиционным статистическим методам, таким как логистическая регрессия .
В основе метода MDR лежит конструктивный алгоритм индукции или проектирования признаков , который преобразует две или более переменных или атрибутов в один атрибут. [9] Этот процесс создания нового атрибута меняет пространство представления данных. [10] Конечная цель — создать или обнаружить представление, которое облегчает обнаружение нелинейных или неаддитивных взаимодействий между атрибутами, так что прогнозирование переменной класса улучшается по сравнению с исходным представлением данных.
Показательный пример
[ редактировать ]Рассмотрим следующий простой пример с использованием функции исключающее ИЛИ (XOR). XOR — это логический оператор , который обычно используется в интеллектуальном анализе данных и машинном обучении как пример функции, которая не является линейно разделимой. В таблице ниже представлен простой набор данных, в котором связь между атрибутами (X1 и X2) и переменной класса (Y) определяется функцией XOR, так что Y = X1 XOR X2.
Таблица 1
Х1 | Х2 | И |
---|---|---|
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 0 |
Алгоритму машинного обучения необходимо обнаружить или аппроксимировать функцию XOR, чтобы точно предсказать Y, используя информацию о X1 и X2. Альтернативной стратегией было бы сначала изменить представление данных с помощью конструктивной индукции, чтобы облегчить прогнозное моделирование. Алгоритм MDR изменит представление данных (X1 и X2) следующим образом. MDR начинается с выбора двух атрибутов. В этом простом примере выбраны X1 и X2. Проверяется каждая комбинация значений X1 и X2 и подсчитывается количество раз Y=1 и/или Y=0. В этом простом примере Y=1 встречается ноль раз, а Y=0 встречается один раз для комбинации X1=0 и X2=0. При использовании MDR соотношение этих значений вычисляется и сравнивается с фиксированным порогом. Здесь соотношение счетчиков равно 0/1, что меньше нашего фиксированного порога 1. Поскольку 0/1 <1, мы кодируем новый атрибут (Z) как 0. Когда соотношение больше единицы, мы кодируем Z как 1. Этот процесс повторяется для всех уникальных комбинаций значений X1 и X2. Таблица 2 иллюстрирует наше новое преобразование данных.
Таблица 2
С | И |
---|---|
0 | 0 |
1 | 1 |
1 | 1 |
0 | 0 |
Алгоритму машинного обучения теперь предстоит гораздо меньше работы по поиску хорошей прогнозирующей функции. Фактически, в этом очень простом примере функция Y = Z имеет точность классификации 1. Приятной особенностью методов конструктивной индукции, таких как MDR, является возможность использовать любой метод интеллектуального анализа данных или машинного обучения для анализа нового представления данные. Деревья решений , нейронные сети или простой байесовский классификатор могут использоваться в сочетании с показателями качества модели, такими как сбалансированная точность. [11] [12] и взаимная информация. [13]
Машинное обучение с MDR
[ редактировать ]Как показано выше, базовый алгоритм конструктивной индукции в MDR очень прост. Однако его реализация для извлечения шаблонов из реальных данных может быть сложной в вычислительном отношении. Как и в случае с любым алгоритмом машинного обучения, всегда существует опасность переобучения . То есть алгоритмы машинного обучения хорошо умеют находить закономерности в совершенно случайных данных. Часто бывает трудно определить, является ли сообщаемая закономерность важным сигналом или просто случайностью. Один из подходов заключается в оценке возможности обобщения модели на независимые наборы данных с использованием таких методов, как перекрестная проверка . [14] [15] [16] [17] Модели, описывающие случайные данные, обычно не обобщают. Другой подход состоит в том, чтобы сгенерировать множество случайных перестановок данных, чтобы увидеть, что обнаружит алгоритм интеллектуального анализа данных, когда ему будет предоставлена возможность переобучения. Тестирование перестановок позволяет получить эмпирическое значение p для результата. [18] [19] [20] [21] Репликация независимых данных также может служить доказательством модели МЛУ, но может быть чувствительна к различиям в наборах данных. [22] [23] Все эти подходы оказались полезными для выбора и оценки моделей MDR. Важным этапом в машинном обучении является интерпретация. С MDR использовалось несколько подходов, включая энтропийный анализ. [9] [24] и анализ путей. [25] [26] Были рассмотрены советы и подходы по использованию MDR для моделирования межгенных взаимодействий. [7] [27]
Расширения для MDR
[ редактировать ]Были введены многочисленные расширения MDR. К ним относятся семейные методы, [28] [29] [30] нечеткие методы, [31] ковариатная корректировка, [32] коэффициенты шансов , [33] оценки риска, [34] методы выживания, [35] [36] надежные методы, [37] методы количественных признаков, [38] [39] и многие другие.
Применение МЛУ
[ редактировать ]MDR в основном применялась для выявления межгенных взаимодействий или эпистаза в генетических исследованиях распространенных заболеваний человека, таких как фибрилляция предсердий , [40] [41] аутизм , [42] рак мочевого пузыря , [43] [44] [45] рак молочной железы , [46] сердечно-сосудистые заболевания , [14] гипертония , [47] [48] [49] ожирение , [50] [51] рак поджелудочной железы , [52] рак простаты [53] [54] [55] и туберкулез . [56] Его также применяли к другим биомедицинским проблемам, таким как генетический анализ результатов фармакологии . [57] [58] [59] Центральной проблемой является масштабирование МЛУ к большим данным , таким как данные полногеномных ассоциативных исследований (GWAS). [60] Было использовано несколько подходов. Один из подходов заключается в фильтрации признаков перед анализом MDR. [61] Это можно сделать, используя биологические знания с помощью таких инструментов, как BioFilter. [62] Это также можно сделать с помощью вычислительных инструментов, таких как ReliefF. [63] Другой подход заключается в использовании алгоритмов стохастического поиска , таких как генетическое программирование, для исследования пространства поиска комбинаций признаков. [64] Еще один подход — это перебор с использованием высокопроизводительных вычислений . [65] [66] [67]
Реализации
[ редактировать ]- www.epistasis.org предоставляет открытым исходным кодом . бесплатный пакет программного обеспечения MDR с
- Пакет R для MDR. [68]
- совместимая со sklearn Реализация Python, .
- Пакет R для MDR на основе моделей. [69]
- МДР в Weka .
- Генерализованная МЛУ .
См. также
[ редактировать ]- Интеллектуальный анализ данных
- Уменьшение размерности
- Эпистаз
- Особенности проектирования
- Машинное обучение
- Мультилинейное обучение подпространству
Ссылки
[ редактировать ]- ^ МакКинни, Бретт А.; Рейф, Дэвид М.; Ричи, Мэрилин Д.; Мур, Джейсон Х. (1 января 2006 г.). «Машинное обучение для обнаружения межгенных взаимодействий: обзор» . Прикладная биоинформатика . 5 (2): 77–88. дои : 10.2165/00822942-200605020-00002 . ISSN 1175-5636 . ПМК 3244050 . ПМИД 16722772 .
- ^ Ричи, Мэрилин Д.; Хан, Лэнс В.; Руди, Нади; Бейли, Л. Рене; Дюпон, Уильям Д.; Парл, Фриц Ф.; Мур, Джейсон Х. (1 июля 2001 г.). «Многофакторное снижение размерности выявляет взаимодействия высокого порядка между генами метаболизма эстрогена при спорадическом раке молочной железы» . Американский журнал генетики человека . 69 (1): 138–147. дои : 10.1086/321276 . ISSN 0002-9297 . ПМК 1226028 . ПМИД 11404819 .
- ^ Ричи, Мэрилин Д.; Хан, Лэнс В.; Мур, Джейсон Х. (1 февраля 2003 г.). «Сила многофакторного уменьшения размерности для обнаружения межгенных взаимодействий при наличии ошибок генотипирования, недостающих данных, фенокопии и генетической гетерогенности». Генетическая эпидемиология . 24 (2): 150–157. дои : 10.1002/gepi.10218 . ISSN 1098-2272 . ПМИД 12548676 . S2CID 6335612 .
- ^ Хан, ЛВ; Ричи, доктор медицины; Мур, Дж. Х. (12 февраля 2003 г.). «Программное обеспечение многофакторного уменьшения размерности для обнаружения взаимодействий ген-ген и ген-среда» . Биоинформатика . 19 (3): 376–382. doi : 10.1093/биоинформатика/btf869 . ISSN 1367-4803 . ПМИД 12584123 .
- ^ В., Хан, Лэнс; Х., Мур, Джейсон (1 января 2004 г.). «Идеальное различение дискретных клинических результатов с использованием мультилокусных генотипов» . В кремниевой биологии . 4 (2): 183–194. ISSN 1386-6338 . ПМИД 15107022 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Мур, Джейсон Х. (1 ноября 2004 г.). «Вычислительный анализ межгенных взаимодействий с использованием многофакторного снижения размерности». Экспертный обзор молекулярной диагностики . 4 (6): 795–803. дои : 10.1586/14737159.4.6.795 . ISSN 1473-7159 . ПМИД 15525222 . S2CID 26324399 .
- ^ Перейти обратно: а б Мур, Джейсон Х.; Эндрюс, Питер С. (1 января 2015 г.). «Анализ эпистаза с использованием многофакторного уменьшения размерности». В Мур, Джейсон Х.; Уильямс, Скотт М. (ред.). Эпистаз . Методы молекулярной биологии. Том. 1253. Спрингер Нью-Йорк. стр. 301–314. дои : 10.1007/978-1-4939-2155-3_16 . ISBN 9781493921546 . ПМИД 25403539 .
- ^ Мур, Джейсон Х. (1 января 2010 г.). «Обнаружение, характеристика и интерпретация нелинейных межгенных взаимодействий с использованием многофакторного уменьшения размерности». Достижения генетики . 72 : 101–116. дои : 10.1016/B978-0-12-380862-2.00005-9 . ISBN 978-0-12-380862-2 . ISSN 0065-2660 . ПМИД 21029850 .
- ^ Перейти обратно: а б Мур, Джейсон Х.; Гилберт, Джошуа К.; Цай, Чиа-Ти; Чан, Фу-Тянь; Холден, Тодд; Барни, Нейт; Уайт, Билл К. (21 июля 2006 г.). «Гибкая вычислительная система для обнаружения, характеристики и интерпретации статистических закономерностей эпистаза в генетических исследованиях восприимчивости человека к болезням». Журнал теоретической биологии . 241 (2): 252–261. дои : 10.1016/j.jtbi.2005.11.036 . ПМИД 16457852 .
- ^ Михальски, Р. (февраль 1983 г.). «Теория и методология индуктивного обучения». Искусственный интеллект . 20 (2): 111–161. дои : 10.1016/0004-3702(83)90016-4 .
- ^ Велес, Дигна Р.; Уайт, Билл С.; Моцингер, Элисон А.; Буш, Уильям С.; Ричи, Мэрилин Д.; Уильямс, Скотт М.; Мур, Джейсон Х. (1 мая 2007 г.). «Функция сбалансированной точности для моделирования эпистаза в несбалансированных наборах данных с использованием многофакторного уменьшения размерности». Генетическая эпидемиология . 31 (4): 306–315. дои : 10.1002/gepi.20211 . ISSN 0741-0395 . ПМИД 17323372 . S2CID 28156181 .
- ^ Намкун, Чонхён; Ким, Кёнга; Йи, Сунгон; Чунг, Вонил; Квон, Мин-Сок; Пак, Тэсон (1 февраля 2009 г.). «Новые меры оценки многофакторных классификаторов уменьшения размерности в анализе взаимодействия генов» . Биоинформатика . 25 (3): 338–345. doi : 10.1093/биоинформатика/btn629 . ISSN 1367-4811 . ПМИД 19164302 .
- ^ Буш, Уильям С.; Эдвардс, Тодд Л.; Дудек, Скотт М.; МакКинни, Бретт А.; Ричи, Мэрилин Д. (1 января 2008 г.). «Альтернативные меры таблицы непредвиденных обстоятельств улучшают эффективность и обнаружение многофакторного уменьшения размерности» . БМК Биоинформатика . 9 : 238. дои : 10.1186/1471-2105-9-238 . ISSN 1471-2105 . ПМЦ 2412877 . ПМИД 18485205 .
- ^ Перейти обратно: а б Коффи, Кристофер С.; Хеберт, Патрисия Р.; Ричи, Мэрилин Д.; Крумхольц, Харлан М.; Газиано, Дж. Майкл; Ридкер, Пол М.; Браун, Нэнси Дж.; Воган, Дуглас Э.; Мур, Джейсон Х. (1 января 2004 г.). «Применение условной логистической регрессии и многофакторного уменьшения размерности для выявления межгенных взаимодействий в отношении риска инфаркта миокарда: важность проверки модели» . БМК Биоинформатика . 5:49 . дои : 10.1186/1471-2105-5-49 . ISSN 1471-2105 . ПМК 419697 . ПМИД 15119966 .
- ^ Моцингер, Элисон А.; Ричи, Мэрилин Д. (1 сентября 2006 г.). «Влияние сокращения интервалов перекрестной проверки на эффективность многофакторного уменьшения размерности». Генетическая эпидемиология . 30 (6): 546–555. дои : 10.1002/gepi.20166 . ISSN 1098-2272 . ПМИД 16800004 . S2CID 20573232 .
- ^ Гори, Джеффри Дж.; Суини, Холли С.; Рейф, Дэвид М.; Моцингер-Рейф, Элисон А. (5 ноября 2012 г.). «Сравнение внутренних методов проверки моделей многофакторного снижения размерности в случае генетической гетерогенности» . Исследовательские заметки BMC . 5 : 623. дои : 10.1186/1756-0500-5-623 . ISSN 1756-0500 . ПМК 3599301 . ПМИД 23126544 .
- ^ Уинхэм, Стейси Дж.; Слейтер, Эндрю Дж.; Моцингер-Рейф, Элисон А. (22 июля 2010 г.). «Сравнение методов внутренней проверки многофакторного уменьшения размерности» . БМК Биоинформатика . 11 : 394. дои : 10.1186/1471-2105-11-394 . ISSN 1471-2105 . ПМК 2920275 . ПМИД 20650002 .
- ^ Паттин, Кристин А.; Уайт, Билл С.; Барни, Нейт; Гуй, Цзян; Нельсон, Хизер Х.; Келси, Карл Т.; Эндрю, Анджелина С.; Карагас, Маргарет Р.; Мур, Джейсон Х. (1 января 2009 г.). «Вычислительно эффективный метод проверки гипотез для эпистазного анализа с использованием многофакторного уменьшения размерности» . Генетическая эпидемиология . 33 (1): 87–94. дои : 10.1002/gepi.20360 . ISSN 1098-2272 . ПМК 2700860 . ПМИД 18671250 .
- ^ Грин, Кейси С.; Химмельштейн, Дэниел С.; Нельсон, Хизер Х.; Келси, Карл Т.; Уильямс, Скотт М.; Эндрю, Анджелина С.; Карагас, Маргарет Р.; Мур, Джейсон Х. (1 октября 2009 г.). «Включение личной геномики с явным тестом на эпистаз». Биокомпьютеры 2010: Тихоокеанский симпозиум по биокомпьютерам . Всемирная научная. стр. 327–336. дои : 10.1142/9789814295291_0035 . ISBN 9789814299473 . ПМК 2916690 . ПМИД 19908385 .
- ^ Дай, Хунъин; Бхандари, Мадхусудан; Беккер, Мара; Лидер, Дж. Стивен; Гейдик, Роджер; Моцингер-Рейф, Элисон А. (22 мая 2012 г.). «Глобальные тесты P-значений для многофакторных моделей уменьшения размерности при выборе оптимального количества целевых генов» . Добыча биоданных . 5 (1): 3. дои : 10.1186/1756-0381-5-3 . ISSN 1756-0381 . ПМЦ 3508622 . ПМИД 22616673 .
- ^ Моцингер-Рейф, Элисон А. (30 декабря 2008 г.). «Влияние альтернативных стратегий тестирования перестановок на эффективность многофакторного уменьшения размерности» . Исследовательские заметки BMC . 1 : 139. дои : 10.1186/1756-0500-1-139 . ISSN 1756-0500 . ПМК 2631601 . ПМИД 19116021 .
- ^ Грин, Кейси С.; Пенрод, Надя М.; Уильямс, Скотт М.; Мур, Джейсон Х. (2 июня 2009 г.). «Неспособность воспроизвести генетическую ассоциацию может дать важную информацию о генетической архитектуре» . ПЛОС ОДИН . 4 (6): е5639. Бибкод : 2009PLoSO...4.5639G . дои : 10.1371/journal.pone.0005639 . ISSN 1932-6203 . ПМЦ 2685469 . ПМИД 19503614 .
- ^ Пиетт, Элизабет Р.; Мур, Джейсон Х. (19 апреля 2017 г.). «Улучшение воспроизводимости результатов генетических ассоциаций с использованием методов повторной выборки генотипа». Приложения эволюционных вычислений . Конспекты лекций по информатике. Том. 10199. стр. 96–108. дои : 10.1007/978-3-319-55849-3_7 . ISBN 978-3-319-55848-6 .
- ^ Мур, Джейсон Х.; Ху, Тин (1 января 2015 г.). «Анализ эпистаза с использованием теории информации». Эпистаз . Методы молекулярной биологии . Том. 1253. стр. 257–268. дои : 10.1007/978-1-4939-2155-3_13 . ISBN 978-1-4939-2154-6 . ISSN 1940-6029 . ПМИД 25403536 .
- ^ Ким, Нора Чанг; Эндрюс, Питер С.; Ассельбергс, Фолкерт В.; Фрост, Х. Роберт; Уильямс, Скотт М.; Харрис, Брент Т.; Прочтите, Синтия; Аскленд, Кэтлин Д.; Мур, Джейсон Х. (28 июля 2012 г.). «Анализ онтологии генов парных генетических ассоциаций в двух полногеномных исследованиях спорадического БАС» . Добыча биоданных . 5 (1): 9. дои : 10.1186/1756-0381-5-9 . ISSN 1756-0381 . ПМЦ 3463436 . ПМИД 22839596 .
- ^ Ченг, Саманта; Эндрю, Анджелина С.; Эндрюс, Питер С.; Мур, Джейсон Х. (1 января 2016 г.). «Комплексный системный анализ предрасположенности к раку мочевого пузыря выявил роль активности декарбоксилазы в двух полногеномных исследованиях ассоциации» . Добыча биоданных . 9:40 . doi : 10.1186/s13040-016-0119-z . ПМК 5154053 . ПМИД 27999618 .
- ^ Гола, Дамиан; Махачи Джон, Джестина М.; ван Стин, Кристель; Кениг, Инке Р. (1 марта 2016 г.). «Дорожная карта по многофакторным методам уменьшения размерности» . Брифинги по биоинформатике . 17 (2): 293–308. дои : 10.1093/нагрудник/bbv038 . ISSN 1477-4054 . ПМЦ 4793893 . ПМИД 26108231 .
- ^ Мартин, скорая помощь; Ричи, доктор медицины; Хан, Л.; Канг, С.; Мур, Дж. Х. (1 февраля 2006 г.). «Новый метод выявления эффектов ген-ген в нуклеарных семьях: MDR-PDT». Генетическая эпидемиология . 30 (2): 111–123. дои : 10.1002/gepi.20128 . ISSN 0741-0395 . ПМИД 16374833 . S2CID 25772215 .
- ^ Лу, Сян-Ян; Чен, Го-Бо; Ян, Лей; Ма, Дженни З.; Мангольд, Джейми Э.; Чжу, Цзюнь; Элстон, Роберт С.; Ли, Мин Д. (1 октября 2008 г.). «Комбинаторный подход к выявлению взаимодействий ген-ген и ген-среда в семейных исследованиях» . Американский журнал генетики человека . 83 (4): 457–467. дои : 10.1016/j.ajhg.2008.09.001 . ISSN 1537-6605 . ПМК 2561932 . ПМИД 18834969 .
- ^ Каттаерт, Том; Урреа, Виктор; Надж, Адам С.; Де Лобель, Лиззи; Де Вит, Ванесса; Фу, Мао; Махачи Джон, Джестина М.; Шен, Хайцин; Калле, М. Луз (22 апреля 2010 г.). «FAM-MDR: гибкий метод многофакторного уменьшения размерности на основе семьи для выявления эпистаза с использованием родственных лиц» . ПЛОС ОДИН . 5 (4): е10304. Бибкод : 2010PLoSO...510304C . дои : 10.1371/journal.pone.0010304 . ISSN 1932-6203 . ПМЦ 2858665 . ПМИД 20421984 .
- ^ Лим, Сансоб; Пак, Тэсон (14 марта 2017 г.). «Эмпирический нечеткий многофакторный метод уменьшения размерности для обнаружения межгенных взаимодействий» . БМК Геномика . 18 (Приложение 2): 115. doi : 10.1186/s12864-017-3496-x . ISSN 1471-2164 . ПМЦ 5374597 . ПМИД 28361694 .
- ^ Гуй, Цзян; Эндрю, Анджелина С.; Эндрюс, Питер; Нельсон, Хизер М.; Келси, Карл Т.; Карагас, Маргарет Р.; Мур, Джейсон Х. (1 января 2010 г.). «Простой и вычислительно эффективный подход к выборке для корректировки ковариат для многофакторного анализа эпистаза с уменьшением размерности» . Наследственность человека . 70 (3): 219–225. дои : 10.1159/000319175 . ISSN 1423-0062 . ПМЦ 2982850 . ПМИД 20924193 .
- ^ Чанг, Юджин; Ли, Сын Ён; Элстон, Роберт С.; Пак, Тэсон (1 января 2007 г.). «Метод многофакторного уменьшения размерности, основанный на соотношении шансов, для обнаружения межгенных взаимодействий» . Биоинформатика . 23 (1): 71–76. doi : 10.1093/биоинформатика/btl557 . ISSN 1367-4811 . ПМИД 17092990 .
- ^ Дай, Хунъин; Чарниго, Ричард Дж.; Беккер, Мара Л.; Лидер, Дж. Стивен; Моцингер-Рейф, Элисон А. (8 января 2013 г.). «Моделирование оценки риска взаимодействия нескольких генов с использованием агрегированного многофакторного уменьшения размерности» . Добыча биоданных . 6 (1): 1. дои : 10.1186/1756-0381-6-1 . ПМК 3560267 . ПМИД 23294634 .
- ^ Гуй, Цзян; Мур, Джейсон Х.; Келси, Карл Т.; Марсит, Кармен Дж.; Карагас, Маргарет Р.; Эндрю, Анджелина С. (1 января 2011 г.). «Новый метод многофакторного уменьшения размерности выживания для обнаружения межгенных взаимодействий с применением для прогнозирования рака мочевого пузыря» . Генетика человека . 129 (1): 101–110. дои : 10.1007/s00439-010-0905-5 . ISSN 1432-1203 . ПМЦ 3255326 . ПМИД 20981448 .
- ^ Ли, Сынён; Сын, Донхи; Ю, Вэньбао; Пак, Тэсон (1 декабря 2016 г.). «Анализ взаимодействия генов для модели ускоренного времени отказа с использованием унифицированного метода многофакторного уменьшения размерности на основе модели» . Геномика и информатика . 14 (4): 166–172. дои : 10.5808/GI.2016.14.4.166 . ISSN 1598-866X . ПМК 5287120 . ПМИД 28154507 .
- ^ Гуй, Цзян; Эндрю, Анджелина С.; Эндрюс, Питер; Нельсон, Хизер М.; Келси, Карл Т.; Карагас, Маргарет Р.; Мур, Джейсон Х. (1 января 2011 г.). «Надежный многофакторный метод уменьшения размерности для обнаружения межгенных взаимодействий с применением к генетическому анализу предрасположенности к раку мочевого пузыря» . Анналы генетики человека . 75 (1): 20–28. дои : 10.1111/j.1469-1809.2010.00624.x . ISSN 1469-1809 . ПМК 3057873 . ПМИД 21091664 .
- ^ Гуй, Цзян; Мур, Джейсон Х.; Уильямс, Скотт М.; Эндрюс, Питер; Хилледж, Ханс Л.; ван дер Харст, Пим; Навис, Герьян; Ван Гилст, Вик Х.; Ассельбергс, Фолкерт В. (1 января 2013 г.). «Простой и вычислительно эффективный подход к многофакторному анализу уменьшения размерности межгенных взаимодействий для количественных признаков» . ПЛОС ОДИН . 8 (6): e66545. Бибкод : 2013PLoSO...866545G . дои : 10.1371/journal.pone.0066545 . ISSN 1932-6203 . ПМЦ 3689797 . ПМИД 23805232 .
- ^ Лу, Сян-Ян; Чен, Го-Бо; Ян, Лей; Ма, Дженни З.; Чжу, Цзюнь; Элстон, Роберт С.; Ли, Мин Д. (1 июня 2007 г.). «Обобщенный комбинаторный подход для обнаружения межгенных и межгенных взаимодействий с применением к никотиновой зависимости» . Американский журнал генетики человека . 80 (6): 1125–1137. дои : 10.1086/518312 . ISSN 0002-9297 . ПМК 1867100 . ПМИД 17503330 .
- ^ Цай, Чиа-Ти; Лай, Лин-Пин; Лин, Цзюнн-Ли; Чан, Фу-Тянь; Хван, Джуэй-Джен; Ричи, Мэрилин Д.; Мур, Джейсон Х.; Сюй, Куан-Лих; Ценг, Чуен-Ден (6 апреля 2004 г.). «Полиморфизм генов ренин-ангиотензиновой системы и фибрилляция предсердий» . Тираж . 109 (13): 1640–1646. дои : 10.1161/01.CIR.0000124487.36586.26 . ISSN 0009-7322 . ПМИД 15023884 .
- ^ Ассельбергс, Фолкерт В.; Мур, Джейсон Х.; ван ден Берг, Маартен П.; Римм, Эрик Б.; де Бур, Рудольф А.; Дуллаарт, Робин П.; Навис, Герьян; ван Гилст, Вик Х. (1 января 2006 г.). «Роль полиморфизма CETP TaqIB в определении предрасположенности к фибрилляции предсердий: вложенное исследование случай-контроль» . BMC Медицинская генетика . 7:39 . дои : 10.1186/1471-2350-7-39 . ISSN 1471-2350 . ПМК 1462991 . ПМИД 16623947 .
- ^ Ма, ДК; Уайтхед, Польша; Менольд, ММ; Мартин, скорая помощь; Эшли-Кох, AE; Мэй, Х.; Ричи, доктор медицины; Делонг, Греция; Абрамсон, РК (1 сентября 2005 г.). «Идентификация значимой ассоциации и ген-генного взаимодействия генов субъединицы ГАМК-рецептора при аутизме» . Американский журнал генетики человека . 77 (3): 377–388. дои : 10.1086/433195 . ISSN 0002-9297 . ПМК 1226204 . ПМИД 16080114 .
- ^ Эндрю, Анджелина С.; Нельсон, Хизер Х.; Келси, Карл Т.; Мур, Джейсон Х.; Мэн, Алексис С.; Казелла, Дэниел П.; Тостесон, Тор Д.; Шнед, Алан Р.; Карагас, Маргарет Р. (1 мая 2006 г.). «Согласование нескольких аналитических подходов демонстрирует сложную взаимосвязь между SNP гена репарации ДНК, курением и предрасположенностью к раку мочевого пузыря» . Канцерогенез . 27 (5): 1030–1037. дои : 10.1093/carcin/bgi284 . ISSN 0143-3334 . ПМИД 16311243 .
- ^ Эндрю, Анджелина С.; Карагас, Маргарет Р.; Нельсон, Хизер Х.; Гуаррера, Симонетта; Полидоро, Сильвия; Гамберини, Сара; Сасердот, Карлотта; Мур, Джейсон Х.; Келси, Карл Т. (1 января 2008 г.). «Полиморфизмы репарации ДНК изменяют риск рака мочевого пузыря: многофакторная аналитическая стратегия» . Наследственность человека . 65 (2): 105–118. дои : 10.1159/000108942 . ISSN 0001-5652 . ПМЦ 2857629 . ПМИД 17898541 .
- ^ Эндрю, Анджелина С.; Ху, Тин; Гу, Цзянь; Гуй, Цзян; Е, Юаньцин; Марсит, Кармен Дж.; Келси, Карл Т.; Шнед, Алан Р.; Таниос, Сэм А. (1 января 2012 г.). «HSD3B и взаимодействие генов в анализе генетической предрасположенности к раку мочевого пузыря на основе путей» . ПЛОС ОДИН . 7 (12): е51301. Бибкод : 2012PLoSO...751301A . дои : 10.1371/journal.pone.0051301 . ISSN 1932-6203 . ПМЦ 3526593 . ПМИД 23284679 .
- ^ Цао, Цзинцзин; Ло, Чэнлинь; Ян, Руи; Пэн, Руи; Ван, Кайдзюань; Ван, Пэн; Йе, Хуа; Сун, Чуньхуа (1 декабря 2016 г.). «rs15869 в сайте связывания микроРНК в BRCA2 связан с предрасположенностью к раку молочной железы». Медицинская онкология . 33 (12): 135. дои : 10.1007/s12032-016-0849-2 . ISSN 1357-0560 . ПМИД 27807724 . S2CID 26042128 .
- ^ Уильямс, Скотт М.; Ричи, Мэрилин Д.; III, Джон А. Филлипс; Доусон, Эллиот; Принц, Мелисса; Джура, Эльвира; Уиллис, Алесия; Семеня, Амма; Резюме, Маршалл (1 января 2004 г.). «Мультилокусный анализ гипертонии: иерархический подход». Наследственность человека . 57 (1): 28–38. дои : 10.1159/000077387 . ISSN 0001-5652 . ПМИД 15133310 . S2CID 21079485 .
- ^ Санада, Хиронобу; Ятабе, Дзюнъити; Мидорикава, Санаэ; Хасимото, Сигэацу; Ватанабэ, Цуёси; Мур, Джейсон Х.; Ричи, Мэрилин Д.; Уильямс, Скотт М.; Пеццулло, Джон К. (1 марта 2006 г.). «Однонуклеотидные полиморфизмы для диагностики солечувствительной гипертонии» . Клиническая химия . 52 (3): 352–360. дои : 10.1373/clinchem.2005.059139 . ISSN 0009-9147 . ПМИД 16439609 .
- ^ Мур, Джейсон Х.; Уильямс, Скотт М. (1 января 2002 г.). «Новые стратегии выявления межгенных взаимодействий при гипертонии». Анналы медицины . 34 (2): 88–95. дои : 10.1080/07853890252953473 . ISSN 0785-3890 . ПМИД 12108579 . S2CID 25398042 .
- ^ Де, Ришика; Верма, Шефали С.; Хольцингер, Эмили; Холл, Молли; Берт, Эмбер; Каррелл, Дэвид С.; Кросслин, Дэвид Р.; Джарвик, Гейл П.; Куиваниеми, Хелена (1 февраля 2017 г.). «Выявление межгенных взаимодействий, которые тесно связаны с четырьмя количественными липидными признаками в нескольких когортах» (PDF) . Генетика человека . 136 (2): 165–178. дои : 10.1007/s00439-016-1738-7 . ISSN 1432-1203 . ПМИД 27848076 . S2CID 24702049 .
- ^ Де, Ришика; Верма, Шефали С.; Дренос, Фотий; Хольцингер, Эмили Р.; Холмс, Майкл В.; Холл, Молли А.; Кросслин, Дэвид Р.; Каррелл, Дэвид С.; Хаконарсон, Хакон (1 января 2015 г.). «Идентификация межгенных взаимодействий, которые тесно связаны с индексом массы тела, с использованием количественного многофакторного уменьшения размерности (QMDR)» . Добыча биоданных . 8 : 41. дои : 10.1186/s13040-015-0074-0 . ПМЦ 4678717 . ПМИД 26674805 .
- ^ Дуэлл, Эрик Дж.; Браччи, Пейдж М.; Мур, Джейсон Х.; Берк, Роберт Д.; Келси, Карл Т.; Холли, Элизабет А. (1 июня 2008 г.). «Обнаружение взаимодействий ген-ген и ген-окружающая среда при раке поджелудочной железы» . Эпидемиология рака, биомаркеры и профилактика . 17 (6): 1470–1479. doi : 10.1158/1055-9965.EPI-07-2797 . ISSN 1055-9965 . ПМЦ 4410856 . ПМИД 18559563 .
- ^ Сюй, Цзяньфэн; Лоуи, Джеймс; Виклунд, Фредрик; Сунь, Цзелин; Линдмарк, Фредрик; Сюй, Фан-Чи; Димитров, Лачезар; Чанг, Баоли; Тернер, Обри Р. (1 ноября 2005 г.). «Взаимодействие четырех генов в путях воспаления существенно предсказывает риск рака простаты» . Эпидемиология рака, биомаркеры и профилактика . 14 (11): 2563–2568. doi : 10.1158/1055-9965.EPI-05-0356 . ISSN 1055-9965 . ПМИД 16284379 .
- ^ Лаванда, Николь А.; Роджерс, Эрика Н.; Йеоду, Сьюзен; Радд, Джеймс; Ху, Тин; Чжан, Цзе; Брок, Гай Н.; Кимбро, Кевин С.; Мур, Джейсон Х. (30 апреля 2012 г.). «Взаимодействие вариантов последовательностей, связанных с апоптозом, и совместное воздействие на агрессивный рак простаты» . BMC Медицинская Геномика . 5:11 . дои : 10.1186/1755-8794-5-11 . ISSN 1755-8794 . ПМК 3355002 . ПМИД 22546513 .
- ^ Лаванда, Николь А.; Бенфорд, Марнита Л.; ВанКлив, Тива Т.; Брок, Гай Н.; Киттлс, Рик А.; Мур, Джейсон Х.; Хейн, Дэвид В.; Кидд, Ла Крейс Р. (16 ноября 2009 г.). «Изучение генов полиморфной глутатион-S-трансферазы (GST), курения табака и риска рака простаты среди мужчин африканского происхождения: исследование случай-контроль» . БМК Рак . 9 : 397. дои : 10.1186/1471-2407-9-397 . ISSN 1471-2407 . ПМК 2783040 . ПМИД 19917083 .
- ^ Коллинз, Райан Л.; Ху, Тин; Вайсе, Кристиан; Сируго, Джорджио; Уильямс, Скотт М.; Мур, Джейсон Х. (18 февраля 2013 г.). «Многофакторное снижение размерности выявляет эпистатическое взаимодействие трех локусов, связанное с предрасположенностью к туберкулезу легких» . Добыча биоданных . 6 (1): 4. дои : 10.1186/1756-0381-6-4 . ПМК 3618340 . ПМИД 23418869 .
- ^ Уилке, Рассел А.; Рейф, Дэвид М.; Мур, Джейсон Х. (1 ноября 2005 г.). «Комбинаторная фармакогенетика». Nature Reviews Открытие лекарств . 4 (11): 911–918. дои : 10.1038/nrd1874 . ISSN 1474-1776 . ПМИД 16264434 . S2CID 11643026 .
- ^ Моцингер, Элисон А.; Ричи, Мэрилин Д.; Шафер, Роберт В.; Роббинс, Грегори К.; Морс, Джин Д.; Лаббе, Лайн; Уилкинсон, Грант Р.; Клиффорд, Дэвид Б.; Д'Акуила, Ричард Т. (1 ноября 2006 г.). «Мультилокусные генетические взаимодействия и реакция на схемы, содержащие эфавиренз: групповое исследование клинических испытаний СПИДа у взрослых». Фармакогенетика и геномика . 16 (11): 837–845. дои : 10.1097/01.fpc.0000230413.97596.fa . ISSN 1744-6872 . ПМИД 17047492 . S2CID 26266170 .
- ^ Ричи, Мэрилин Д.; Моцингер, Элисон А. (1 декабря 2005 г.). «Многофакторное снижение размерности для обнаружения взаимодействий ген-ген и ген-среда в исследованиях фармакогеномики». Фармакогеномика . 6 (8): 823–834. дои : 10.2217/14622416.6.8.823 . ISSN 1462-2416 . ПМИД 16296945 . S2CID 10348021 .
- ^ Мур, Джейсон Х.; Ассельбергс, Фолкерт В.; Уильямс, Скотт М. (15 февраля 2010 г.). «Задачи биоинформатики для полногеномных исследований ассоциаций» . Биоинформатика . 26 (4): 445–455. doi : 10.1093/биоинформатика/btp713 . ISSN 1367-4811 . ПМК 2820680 . ПМИД 20053841 .
- ^ Сунь, Сянцин; Лу, Цин; Мукерджи, Шубхабрата; Мукерджи, Шубхабрата; Крейн, Пол К.; Элстон, Роберт; Ричи, Мэрилин Д. (1 января 2014 г.). «Анализный конвейер для эпистазного поиска – статистическая или биологическая фильтрация» . Границы генетики . 5 : 106. дои : 10.3389/fgene.2014.00106 . ПМК 4012196 . ПМИД 24817878 .
- ^ Пендерграсс, Сара А.; Фрейз, Алекс; Уоллес, Джон; Вулф, Дэниел; Катияр, Нирджа; Мур, Кэрри; Ричи, Мэрилин Д. (30 декабря 2013 г.). «Геномный анализ с помощью биофильтра 2.0: фильтрация, основанная на знаниях, аннотация и разработка моделей» . Добыча биоданных . 6 (1): 25. дои : 10.1186/1756-0381-6-25 . ПМЦ 3917600 . ПМИД 24378202 .
- ^ Мур, Джейсон Х. (1 января 2015 г.). «Анализ эпистаза с использованием рельефа». Эпистаз . Методы молекулярной биологии . Том. 1253. С. 315–325. дои : 10.1007/978-1-4939-2155-3_17 . ISBN 978-1-4939-2154-6 . ISSN 1940-6029 . ПМИД 25403540 .
- ^ Мур, Джейсон Х.; Уайт, Билл К. (1 января 2007 г.). «Полногеномный генетический анализ с использованием генетического программирования: острая потребность в экспертных знаниях». В Риоло, Рик; Соул, Теренс; Ворзель, Билл (ред.). Теория и практика генетического программирования IV . Генетические и эволюционные вычисления. Спрингер США. стр. 11–28. дои : 10.1007/978-0-387-49650-4_2 . ISBN 9780387333755 . S2CID 55188394 .
- ^ Грин, Кейси С.; Синнотт-Армстронг, Николас А.; Химмельштейн, Дэниел С.; Парк, Пол Дж.; Мур, Джейсон Х.; Харрис, Брент Т. (1 марта 2010 г.). «Многофакторное уменьшение размерности графических процессоров позволяет проводить полногеномное тестирование эпистаза при спорадическом БАС» . Биоинформатика . 26 (5): 694–695. doi : 10.1093/биоинформатика/btq009 . ISSN 1367-4811 . ПМЦ 2828117 . ПМИД 20081222 .
- ^ Буш, Уильям С.; Дудек, Скотт М.; Ричи, Мэрилин Д. (1 сентября 2006 г.). «Параллельное многофакторное снижение размерности: инструмент для крупномасштабного анализа межгенных взаимодействий» . Биоинформатика . 22 (17): 2173–2174. doi : 10.1093/биоинформатика/btl347 . ISSN 1367-4811 . ПМЦ 4939609 . ПМИД 16809395 .
- ^ Синнотт-Армстронг, Николас А.; Грин, Кейси С.; Канкаре, Фабио; Мур, Джейсон Х. (24 июля 2009 г.). «Ускорение эпистазного анализа в генетике человека с помощью потребительского графического оборудования» . Исследовательские заметки BMC . 2 : 149. дои : 10.1186/1756-0500-2-149 . ISSN 1756-0500 . ПМЦ 2732631 . ПМИД 19630950 .
- ^ Уинхэм, Стейси Дж.; Моцингер-Рейф, Элисон А. (16 августа 2011 г.). «Реализация многофакторного уменьшения размерности в пакете R» . Добыча биоданных . 4 (1): 24. дои : 10.1186/1756-0381-4-24 . ISSN 1756-0381 . ПМК 3177775 . ПМИД 21846375 .
- ^ Калле, М. Луз; Урреа, Виктор; Малац, Нурия; Ван Стин, Кристель (1 сентября 2010 г.). «mbmdr: пакет R для изучения межгенных взаимодействий, связанных с бинарными или количественными признаками» . Биоинформатика . 26 (17): 2198–2199. doi : 10.1093/биоинформатика/btq352 . ISSN 1367-4811 . ПМИД 20595460 .
Дальнейшее чтение
[ редактировать ]- Михальски, Р.С., «Распознавание образов как компьютерная индукция, основанная на знаниях», Департамент компьютерных наук, № 927, Университет Иллинойса, Урбана, июнь 1978 г.