Модерация (статистика)
В статистике и анализе регрессионном модерация (также известная как модификация эффекта ) возникает, когда взаимосвязь между двумя переменными зависит от третьей переменной. Третья переменная называется переменной модератора (или модификатором эффекта ) или просто модератором (или модификатором ). [1] [2] Влияние смягчающей переменной статистически характеризуется как взаимодействие ; [1] то есть категориальная (например, пол, этническая принадлежность, класс) или непрерывная (например, возраст, уровень вознаграждения) переменная , которая связана с направлением и/или величиной связи между зависимыми и независимыми переменными . В частности, в рамках корреляционного анализа модератор — это третья переменная, которая влияет на корреляцию нулевого порядка между двумя другими переменными или на значение наклона зависимой переменной относительно независимой переменной. В терминах дисперсионного анализа (ANOVA) основной эффект модератора может быть представлен как взаимодействие между фокусной независимой переменной и фактором, который определяет соответствующие условия для ее действия. [3]
Пример
[ редактировать ]Анализ модерации в поведенческих науках включает использование линейного множественного регрессионного анализа или причинно-следственного моделирования . [1] Чтобы количественно оценить влияние модерирующей переменной в множественном регрессионном анализе, регрессируя случайную величину Y на X , в модель добавляется дополнительный термин. Этот термин представляет собой взаимодействие между X и предлагаемой регулирующей переменной. [1]
Таким образом, для ответа Y и двух переменных x 1 и модерирующей переменной x 2 ,:
В этом случае роль x 2 как регулирующей переменной достигается путем оценки b 3 , оценки параметра для члена взаимодействия. [1] См. линейную регрессию для обсуждения статистической оценки оценок параметров в регрессионном анализе.
Мультиколлинеарность в умеренной регрессии
[ редактировать ]В модерируемом регрессионном анализе появился новый предиктор взаимодействия ( ) рассчитывается. Однако новый термин взаимодействия можно соотнести с двумя основными эффектами, используемыми для его расчета. Это проблема мультиколлинеарности в умеренной регрессии. Мультиколлинеарность обычно приводит к тому, что коэффициенты оцениваются с более высокими стандартными ошибками и, следовательно, с большей неопределенностью.
Центрирование среднего значения (вычитание необработанных оценок из среднего значения) может уменьшить мультиколлинеарность, что приведет к более интерпретируемым коэффициентам регрессии. [4] [5] Однако на общую пригодность модели это не влияет.
Апостериорное исследование взаимодействий
[ редактировать ]Подобно простому анализу главного эффекта в ANOVA, при апостериорном исследовании взаимодействий в регрессии мы изучаем простой наклон одной независимой переменной при определенных значениях другой независимой переменной. Ниже приведен пример проверки двустороннего взаимодействия. Далее следует уравнение регрессии с двумя переменными A и B и членом взаимодействия A*B:
будет рассмотрено. [6]
Две категориальные независимые переменные
[ редактировать ]Если обе независимые переменные являются категориальными переменными, мы можем проанализировать результаты регрессии для одной независимой переменной на определенном уровне другой независимой переменной. Например, предположим, что и A, и B представляют собой переменные с одним фиктивным кодом (0,1), и что A представляет этническую принадлежность (0 = американцы европейского происхождения, 1 = выходцы из Восточной Азии), а B представляет состояние в исследовании (0 = контроль, 1 = экспериментальный). Затем эффект взаимодействия показывает, различно ли влияние состояния на зависимую переменную Y для американцев европейского происхождения и выходцев из Восточной Азии и различно ли влияние этнического статуса для этих двух условий. Коэффициент A показывает влияние этнической принадлежности на Y для контрольного условия, а коэффициент B показывает эффект навязывания экспериментальных условий для американцев европейского происхождения.
Чтобы выяснить, существует ли какая-либо значительная разница между американцами европейского происхождения и выходцами из Восточной Азии в экспериментальных условиях, мы можем просто запустить анализ с переменной условия, закодированной в обратном порядке (0 = экспериментальная, 1 = контрольная), так что коэффициент этнической принадлежности представляет собой Влияние этнической принадлежности на Y в экспериментальных условиях. Аналогичным образом, если мы хотим увидеть, оказывает ли лечение эффект на участников из Восточной Азии, мы можем перекодировать переменную этнической принадлежности (0 = выходцы из Восточной Азии, 1 = американцы европейского происхождения).
Одна категориальная и одна непрерывная независимая переменная
[ редактировать ]Если первая независимая переменная является категориальной переменной (например, пол), а вторая — непрерывной переменной (например, баллами по шкале удовлетворенности жизнью (SWLS)), то b 1 представляет собой разницу в зависимой переменной между мужчинами и женщинами, когда жизнь удовлетворение равно нулю. Однако нулевой балл по шкале удовлетворенности жизнью не имеет смысла, поскольку диапазон баллов составляет от 7 до 35. Именно здесь на помощь приходит центрирование. Если мы вычтем среднее значение показателя SWLS для выборки из балла каждого участника, среднее значение результирующей центрированной оценки SWLS равно нулю. При повторном проведении анализа b 1 теперь представляет собой разницу между мужчинами и женщинами на среднем уровне показателя SWLS выборки.
Коэн и др. (2003) рекомендовали использовать следующее для исследования простого влияния пола на зависимую переменную ( Y ) на трех уровнях непрерывной независимой переменной: высоком (одно стандартное отклонение выше среднего), умеренном (среднем) и низком (2003). на одно стандартное отклонение ниже среднего). [7] Если оценки непрерывной переменной не стандартизированы, можно просто вычислить эти три значения, добавив или вычитая одно стандартное отклонение исходных оценок; если баллы непрерывной переменной стандартизированы, можно рассчитать три значения следующим образом: высокий = стандартизированный балл минус 1, средний (среднее = 0), низкий = стандартизированный балл плюс 1. Затем можно изучить влияние пола. от зависимой переменной ( Y ) при высоких, средних и низких уровнях оценки SWLS. Как и в случае с двумя категориальными независимыми переменными, b 2 представляет влияние оценки SWLS на зависимую переменную для женщин. Путем обратного кодирования гендерной переменной можно получить влияние показателя SWLS на зависимую переменную для мужчин.
Кодирование в умеренной регрессии
[ редактировать ]При рассмотрении категориальных переменных, таких как этнические группы и экспериментальные методы лечения, как независимых переменных в умеренной регрессии, необходимо кодировать переменные так, чтобы каждая кодовая переменная представляла конкретную настройку категориальной переменной. Существует три основных способа кодирования: кодирование с фиктивными переменными, кодирование с эффектами и контрастное кодирование. Ниже приводится введение в эти системы кодирования. [8] [9]
Фиктивное кодирование используется, когда имеется контрольная группа или конкретное состояние (например, контрольная группа в эксперименте), которое необходимо сравнить с каждой из других экспериментальных групп. В этом случае точка пересечения представляет собой среднее значение контрольной группы, а каждый из нестандартизированных коэффициентов регрессии представляет собой разницу в зависимой переменной между одной из групп лечения и средним значением контрольной группы (или контрольной группы). Эта система кодирования аналогична анализу ANOVA и подходит, когда исследователи имеют определенную референтную группу и хотят сравнить с ней каждую из других групп.
Кодирование эффектов используется, когда нет конкретной группы сравнения или контрольной группы и нет запланированных ортогональных контрастов. Перехват — это среднее значение (среднее значение всех условий). Коэффициент регрессии представляет собой разницу между средним значением одной группы и средним значением всех групповых значений (например, среднее значение группы А минус среднее значение всех групп). Эта система кодирования подходит, когда группы представляют естественные категории.
Контрастное кодирование используется, когда имеется ряд ортогональных контрастов или групповых сравнений, которые необходимо исследовать. В этом случае точка пересечения представляет собой невзвешенное среднее средних значений отдельной группы. Нестандартизированный коэффициент регрессии представляет собой разницу между невзвешенным средним значением одной группы (A) и невзвешенным средним значением другой группы (B), где A и B представляют собой два набора контрастирующих групп. Эта система кодирования подходит, когда у исследователей есть априорная гипотеза относительно конкретных различий между групповыми средствами.
Две непрерывные независимые переменные
[ редактировать ]Если обе независимые переменные непрерывны, для интерпретации полезно либо центрировать, либо стандартизировать независимые X и Z. переменные (Центрирование включает вычитание общего среднего балла выборки из исходного балла; стандартизация делает то же самое с последующим делением на общее стандартное отклонение выборки.) Центрируя или стандартизируя независимые переменные, коэффициент X или Z можно интерпретировать как эффект эта переменная по Y находится на среднем уровне другой независимой переменной. [10]
Чтобы исследовать эффект взаимодействия, часто бывает полезно построить график влияния X на Y при низких и высоких значениях Z (некоторые люди предпочитают также отображать эффект при умеренных значениях Z , но в этом нет необходимости). Часто для этого выбираются значения Z , которые на одно стандартное отклонение выше и ниже среднего значения, но можно использовать любые разумные значения (а в некоторых случаях можно выбрать более значимые значения). График обычно рисуется путем оценки значений Y для высоких и низких значений X и Z представляющих влияние X на Y при двух значениях Z. и создания двух линий , Иногда это дополняется простым анализом наклона, который определяет, является ли влияние Y статистически значимым на при определенных значениях Z. X Распространенным методом простого анализа наклона является подход Джонсона-Неймана. [11] Существуют различные интернет-инструменты, которые помогают исследователям планировать и интерпретировать такие двусторонние взаимодействия. [12]
Взаимодействие на более высоком уровне
[ редактировать ]Принципы двустороннего взаимодействия применяются, когда мы хотим изучить трехсторонние взаимодействия или взаимодействия более высокого уровня. Например, если у нас есть трехстороннее взаимодействие между A , B и C , уравнение регрессии будет следующим:
Ложные эффекты высшего порядка
[ редактировать ]Стоит отметить, что надежность членов более высокого порядка зависит от надежности членов более низкого порядка. Например, если надежность для переменной A равна 0,70, надежность для переменной B равна 0,80, а их корреляция равна r = 0,2, то надежность для переменной взаимодействия A * B равна . [13] В этом случае низкая надежность члена взаимодействия приводит к малой мощности; следовательно, мы, возможно, не сможем найти эффекты взаимодействия между A и B, которые действительно существуют. Решение этой проблемы состоит в использовании высоконадежных мер для каждой независимой переменной.
Еще одно предостережение при интерпретации эффектов взаимодействия заключается в том, что, когда переменная A и переменная B сильно коррелируют, тогда термин A * B будет сильно коррелировать с пропущенной переменной A. 2 ; следовательно, то, что кажется значительным эффектом замедления, на самом деле может быть значительным нелинейным эффектом А. одного лишь Если это так, стоит протестировать модель нелинейной регрессии, добавив нелинейные члены в отдельные переменные в модерируемый регрессионный анализ, чтобы увидеть, остаются ли взаимодействия значимыми. Если эффект взаимодействия A * B по-прежнему значителен, мы будем с большей уверенностью говорить, что эффект модерации действительно существует; однако, если эффект взаимодействия перестает быть значимым после добавления нелинейного члена, мы будем менее уверены в существовании эффекта замедления, и нелинейная модель будет предпочтительнее, поскольку она более экономна.
Умеренный регрессионный анализ также имеет тенденцию включать дополнительные переменные, которые концептуализируются как не представляющие интереса ковариаты. Однако присутствие этих ковариат может вызвать ложные эффекты, когда либо (1) ковариата ( C ) коррелирует с одной из основных представляющих интерес переменных (например, переменной A или B ), либо (2) когда ковариата сама является модератором. корреляции A или B с Y. между [14] [15] [16] Решение состоит в том, чтобы включить в модель дополнительные условия взаимодействия для взаимодействия между каждым искажающим фактором и первичными переменными следующим образом:
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д и Коэн, Джейкоб; Коэн, Патрисия; Леона С. Эйкен ; Уэст, Стивен Х. (2003). Применил множественный регрессионный/корреляционный анализ для поведенческих наук . Хиллсдейл, Нью-Джерси: L. Erlbaum Associates. ISBN 0-8058-2223-2 .
- ^ Шандельмайер, Стефан; Бриэль, Матиас; Варадхан, Рави; Шмид, Кристофер Х.; Девасенапатия, Ниведитха; Хейворд, Родни А.; Ганье, Джоэл; Боренштейн, Майкл; ван дер Хейден, Герт Дж.М.Г.; Дахабре, Исса Дж.; Сунь, Синь; Зауэрбрей, Вилли; Уолш, Майкл; Иоаннидис, Джон П.А.; Табане, Лехана (10 августа 2020 г.). «Разработка инструмента для оценки достоверности анализа модификации эффектов (ICEMAN) в рандомизированных контролируемых исследованиях и метаанализах» . Журнал Канадской медицинской ассоциации . 192 (32): Е901–Е906. дои : 10.1503/cmaj.200077 . ISSN 0820-3946 . ПМК 7829020 . ПМИД 32778601 .
- ^ Барон, Р.М., и Кенни, Д.А. (1986). «Различие переменных модератора и посредника в социально-психологических исследованиях: концептуальные, стратегические и статистические соображения», Journal of Personality and Social Psychology , 5 (6), 1173–1182 (стр. 1174).
- ^ Якобуччи, Рассвет; Шнайдер, Мэтью Дж.; Попович, Дейдре Л.; Бакамитсос, Георгиос А. (2016). «Центрирование по среднему помогает смягчить «микро», но не «макро» мультиколлинеарность» . Методы исследования поведения . 48 (4): 1308–1317. дои : 10.3758/s13428-015-0624-x . ISSN 1554-3528 . ПМИД 26148824 .
- ^ Ольвера Астивиа, Оскар Л.; Крок, Эдвард (2019). «Центрирование в множественной регрессии не всегда уменьшает мультиколлинеарность: как определить, когда ваши оценки не выиграют от центрирования» . Образовательные и психологические измерения . 79 (5): 813–826. дои : 10.1177/0013164418817801 . ISSN 0013-1644 . ПМК 6713984 . ПМИД 31488914 .
- ^ Тейлор, Алан. «Тестирование и интерпретация взаимодействий в регрессии – в двух словах» (PDF) .
- ^ Коэн Джейкоб; Коэн Патрисия; Вест Стивен Г.; Айкен Леона С. Прикладной множественный регрессионно-корреляционный анализ в поведенческих науках (3-е изд.). Махва, Нью-Джерси [ua]: Эрлбаум. стр. 255–301. ISBN 0-8058-2223-2 .
- ^ Айкен Л.С., Вест., С.Г. (1996). Множественное регрессионное тестирование и интерпретация (1. Печать в мягкой обложке. Под ред.). Ньюбери-Парк, Калифорния [ua]: Sage Publications, Inc. ISBN 0-7619-0712-2 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Коэн Джейкоб; Коэн Патрисия; Вест Стивен Г.; Айкен Леона С. (2003). Прикладной множественный регрессионно-корреляционный анализ для поведенческих наук (3-е изд.). Махва, Нью-Джерси [ua]: Эрлбаум. стр. 302–353. ISBN 0-8058-2223-2 .
- ^ Доусон, Дж. Ф. (2013). Модерация в управленческих исследованиях: что, почему, когда и как. Журнал бизнеса и психологии. дои : 10.1007/s10869-013-9308-7 .
- ^ Джонсон, Палмер О.; Фэй, Лео К. (1 декабря 1950 г.). «Методика Джонсона-Неймана, ее теория и применение» . Психометрика . 15 (4): 349–367. дои : 10.1007/BF02288864 . ISSN 1860-0980 . ПМИД 14797902 . S2CID 43748836 .
- ^ «Интерпретация эффектов взаимодействия» .
- ^ Буземейер, Джером Р.; Джонс, Лоуренс Э. (1983). «Анализ правил мультипликативной комбинации, когда причинные переменные измеряются с ошибкой» . Психологический вестник . 93 (3): 549–562. дои : 10.1037/0033-2909.93.3.549 . ISSN 1939-1455 .
- ^ Келлер, Мэтью С. (2014). «Исследования взаимодействия генов и окружающей среды не позволили должным образом учесть потенциальные факторы, искажающие ситуацию: проблема и (простое) решение» . Биологическая психиатрия . 75 (1): 18–24. doi : 10.1016/j.biopsych.2013.09.006 . ПМЦ 3859520 . ПМИД 24135711 .
- ^ Изербит, Винсент Ю.; Мюллер, Доминик; Джадд, Чарльз М. (2004). «Подход исследователей к корректировке: об использовании ковариат при тестировании взаимодействий» . Журнал экспериментальной социальной психологии . 40 (3): 424–431. дои : 10.1016/j.jesp.2003.10.001 .
- ^ Халл, Джей Г.; Тедли, Джудит К.; Лен, Дэниел А. (1992). «Переменные модератора в исследованиях личности: проблема контроля вероятных альтернатив» . Бюллетень личности и социальной психологии . 18 (2): 115–117. дои : 10.1177/0146167292182001 . ISSN 0146-1672 . S2CID 145366173 .
- Хейс, А.Ф., и Маттес, Дж. (2009). «Вычислительные процедуры для исследования взаимодействий в OLS и логистической регрессии: реализации SPSS и SAS». Методы исследования поведения, Vol. 41, стр. 924–936.