Квази-эксперимент

Из Википедии, бесплатной энциклопедии

Квазиэксперимент интервенционное исследование , — это эмпирическое используемое для оценки причинного воздействия вмешательства на целевую группу населения без случайного распределения . Квази-экспериментальные исследования имеют сходство с традиционным экспериментальным дизайном или рандомизированным контролируемым исследованием , но в них отсутствует элемент случайного назначения лечения или контроля. Вместо этого квазиэкспериментальные планы обычно позволяют исследователю контролировать распределение по состоянию лечения, но с использованием какого-либо критерия, отличного от случайного распределения (например, порогового значения приемлемости). [1]

Квази-эксперименты вызывают сомнения относительно внутренней достоверности , поскольку экспериментальная и контрольная группы могут быть несопоставимы на исходном уровне. Другими словами, возможно, не удастся убедительно продемонстрировать причинную связь между условиями лечения и наблюдаемыми результатами. Это особенно верно, если существуют мешающие переменные , которые невозможно контролировать или учитывать. [2]

При случайном распределении участники исследования имеют одинаковые шансы попасть в группу вмешательства или группу сравнения. В результате различия между группами как по наблюдаемым, так и по ненаблюдаемым характеристикам будут обусловлены случайностью, а не систематическим фактором, связанным с лечением (например, тяжестью заболевания). Сама по себе рандомизация не гарантирует, что группы будут эквивалентны на исходном уровне. Любое изменение характеристик после вмешательства, скорее всего, связано с вмешательством.

Дизайн [ править ]

Первой частью создания квазиэкспериментального плана является идентификация переменных. Квазинезависимая переменная – это переменная, которой манипулируют, чтобы повлиять на зависимую переменную. Обычно это группирующая переменная с разными уровнями. Группировка означает две или более группы, например, две группы, получающие альтернативное лечение, или группу, получающую лечение, и группу, не получающую лечения (которой можно давать плацебо плацебо чаще используются в медицинских или физиологических экспериментах). Прогнозируемый результат является зависимой переменной . При анализе временных рядов зависимая переменная отслеживается с течением времени на предмет любых возможных изменений. В анализ обычно включаются одна или несколько ковариат , в идеале — переменных, которые предсказывают как группу лечения, так и результат. Это дополнительные переменные, которые часто используются для устранения искажений , например, посредством статистической корректировки или сопоставления. После того как переменные идентифицированы и определены, следует применить процедуру и изучить групповые различия. [3]

В эксперименте со случайным распределением исследовательские единицы имеют одинаковые шансы быть отнесенными к определенному состоянию лечения. Таким образом, случайное распределение гарантирует, что экспериментальная и контрольная группы эквивалентны. В квазиэкспериментальном плане назначение конкретного условия лечения основано не на случайном назначении. В зависимости от типа квазиэкспериментального плана исследователь может контролировать распределение условий лечения, но использовать некоторые критерии, отличные от случайного распределения (например, пороговый балл), чтобы определить, какие участники получают лечение, или у исследователя может не быть контроль над назначением условий лечения и критерии, используемые для назначения, могут быть неизвестны. Такие факторы, как стоимость, осуществимость, политические соображения или удобство, могут влиять на то, как или будут ли участники назначены на определенные условия лечения, и, как таковые, квазиэксперименты подвергаются сомнениям относительно внутренней достоверности (т. е. могут ли результаты эксперимента быть используется для причинно-следственных выводов?).

Квазиэксперименты эффективны еще и потому, что в них используется «пред-посттестирование». Это означает, что перед сбором каких-либо данных проводятся тесты, чтобы увидеть, есть ли какие-либо люди, которые сбивают с толку или есть ли у кого-либо из участников определенные тенденции. Затем проводится сам эксперимент с записью результатов послетестирования. Эти данные можно сравнить в рамках исследования или данные предварительных испытаний можно включить в объяснение фактических экспериментальных данных. В квазиэкспериментах уже существуют независимые переменные, такие как возраст, пол, цвет глаз. Эти переменные могут быть либо непрерывными (возраст), либо категориальными (пол). Короче говоря, естественные переменные измеряются в рамках квазиэкспериментов. [4]

Существует несколько типов квазиэкспериментальных проектов, каждый из которых имеет свои сильные и слабые стороны и области применения. Эти конструкции включают (но не ограничиваются): [5]

Из всех этих планов план с разрывом регрессии наиболее близок к плану эксперимента, поскольку экспериментатор сохраняет контроль над назначением лечения, и известно, что он «дает несмещенную оценку эффектов лечения». [5] : 242  Однако для достижения той же мощности, что и при традиционном плане эксперимента, требуется большое количество участников исследования и точное моделирование функциональной формы между заданием и исходной переменной.

Хотя квазиэксперименты иногда избегают те, кто считает себя пуристами-экспериментаторами (что привело к тому, что Дональд Т. Кэмпбелл придумал для них термин «тошные эксперименты»), [6] они исключительно полезны в тех областях, где невозможно или нежелательно проводить эксперименты или рандомизированные контрольные исследования. К таким примерам относится оценка воздействия изменений государственной политики, образовательных мер или крупномасштабных мер в области здравоохранения. Основной недостаток квазиэкспериментальных планов заключается в том, что они не могут исключить возможность искажающей предвзятости, которая может помешать сделать причинно-следственные выводы. Этот недостаток часто используется как предлог для дисконтирования квазиэкспериментальных результатов. Однако такое смещение можно контролировать с помощью различных статистических методов, таких как множественная регрессия, если можно идентифицировать и измерить искажающую переменную(и). Такие методы можно использовать для моделирования и частичного устранения эффектов методов смешивающих переменных, тем самым повышая точность результатов, полученных в результате квазиэкспериментов. Более того, развивающееся использование сопоставления показателей склонности для сопоставления участников по переменным, важным для процесса выбора лечения, также может повысить точность квазиэкспериментальных результатов. Фактически было показано, что данные, полученные в результате квазиэкспериментального анализа, в некоторых случаях близко соответствуют экспериментальным данным, даже когда использовались разные критерии. [7] В целом, квазиэксперименты являются ценным инструментом, особенно для исследователя-прикладника. Сами по себе квазиэкспериментальные планы не позволяют сделать окончательные причинно-следственные выводы; однако они дают необходимую и ценную информацию, которую невозможно получить только экспериментальными методами. Исследователи, особенно те, кто заинтересован в изучении прикладных исследовательских вопросов, должны выйти за рамки традиционного экспериментального плана и воспользоваться возможностями, присущими квазиэкспериментальным планам. [5]

Этика [ править ]

В настоящем эксперименте , например, детям будут случайным образом распределяться стипендии, чтобы контролировать все остальные переменные. Квази-эксперименты обычно используются в социальных науках , общественном здравоохранении , образовании и анализе политики , особенно когда нецелесообразно или нецелесообразно рандомизировать участников исследования в зависимости от условий лечения.

В качестве примера предположим, что мы разделили домохозяйства на две категории: домохозяйства, в которых родители шлепают своих детей, и домохозяйства, в которых родители не шлепают своих детей. Мы можем провести линейную регрессию, чтобы определить, существует ли положительная корреляция между поркой родителей и агрессивным поведением их детей. Однако просто рандомизировать родителей по категориям «шлепать» или «не шлепать» может быть непрактичным или этичным, поскольку некоторые родители могут полагать, что шлепать своих детей морально неправильно, и отказываться от участия.

Некоторые авторы различают естественный эксперимент и «квазиэксперимент». [5] Естественный эксперимент может приближаться к случайному распределению или включать реальную рандомизацию, проводимую не экспериментаторами и не для эксперимента. Квазиэксперимент обычно не предполагает фактической рандомизации. [1]

Квазиэксперименты имеют показатели результатов, методы лечения и экспериментальные единицы, но не используют случайное распределение . Квази-эксперименты часто представляют собой план, который большинство людей предпочитают настоящим экспериментам. Обычно его легко проводить в отличие от настоящих экспериментов, поскольку они включают в себя особенности как экспериментальных, так и неэкспериментальных проектов. Могут быть введены как измеряемые, так и манипулируемые переменные. Обычно экспериментаторы выбирают квазиэксперименты, поскольку они максимизируют внутреннюю и внешнюю достоверность. [8]

Преимущества [ править ]

Поскольку квазиэкспериментальные планы используются, когда рандомизация непрактична и/или неэтична, их обычно легче организовать, чем настоящие экспериментальные планы, которые требуют [9] случайное распределение предметов. Кроме того, использование квазиэкспериментальных проектов сводит к минимуму угрозы экологической обоснованности , поскольку природная среда не страдает от тех же проблем искусственности, что и хорошо контролируемые лабораторные условия. [10] Поскольку квазиэксперименты являются естественными экспериментами, результаты одного из них могут быть применены к другим субъектам и условиям, что позволяет некоторые обобщения сделать о популяции . Кроме того, этот метод экспериментирования эффективен в продольных исследованиях, которые включают более длительные периоды времени и которые можно отслеживать в различных условиях.

К другим преимуществам квазиэкспериментов относится возможность проведения любых манипуляций по выбору экспериментатора. В естественных экспериментах исследователям приходится позволять манипуляциям происходить самостоятельно и не иметь над ними никакого контроля. Кроме того, использование самостоятельно выбранных групп в квазиэкспериментах также исключает вероятность возникновения этических, условных и т. д. проблем при проведении исследования. [8]

Недостатки [ править ]

Квазиэкспериментальные оценки воздействия могут быть искажены мешающими переменными. [1] В приведенном выше примере на вариацию реакции детей на порку, вероятно, влияют факторы, которые нелегко измерить и контролировать, например, присущая ребенку дикость или раздражительность родителей. Отсутствие случайного распределения в методе квазиэкспериментального планирования может сделать исследования более осуществимыми, но это также создает множество проблем для исследователя с точки зрения внутренней валидности. Этот недостаток рандомизации затрудняет исключение мешающих переменных и создает новые угрозы для внутренней достоверности . [11] Поскольку рандомизация отсутствует, некоторые знания о данных могут быть аппроксимированы, но выводы о причинно-следственных связях трудно определить из-за множества посторонних и мешающих переменных, существующих в социальной среде. Более того, даже если эти угрозы внутренней валидности будут оценены, причинно-следственная связь все равно не может быть полностью установлена, поскольку экспериментатор не имеет полного контроля над внешними переменными . [12]

К недостаткам также относится то, что исследовательские группы могут предоставить более слабые доказательства из-за отсутствия случайности. Случайность приносит в исследование много полезной информации, поскольку она расширяет результаты и, следовательно, дает лучшее представление о популяции в целом. Использование неравных групп также может представлять угрозу внутренней валидности. Если группы неравны, что иногда случается в квазиэкспериментах, то экспериментатор может быть не уверен в определении причин результатов. [4]

Внутренняя валидность [ править ]

Внутренняя валидность — это приблизительная истина о выводах, касающихся причинно-следственных или причинно-следственных связей. Вот почему достоверность важна для квазиэкспериментов, поскольку все они касаются причинно-следственных связей. Это происходит, когда экспериментатор пытается контролировать все переменные, которые могут повлиять на результаты эксперимента. Статистическая регрессия, история и участники — все это возможные угрозы внутренней валидности. Пытаясь сохранить высокую внутреннюю валидность, вы хотели бы задать вопрос: «Есть ли какие-либо другие возможные причины для результата, кроме той, по которой я хочу, чтобы он был?» Если это так, то внутренняя валидность может быть не такой сильной. [8]

Внешняя валидность [ править ]

Внешняя валидность — это степень, в которой результаты, полученные из выборки исследования, могут быть обобщены «на» некоторую четко определенную популяцию, представляющую интерес, а также «на» субпопуляции людей, времен, контекстов и методов исследования. [13] Линч утверждал, что обобщение «на» популяцию почти никогда невозможно, потому что популяции, на которые мы хотели бы спроецировать, являются мерами будущего поведения, которые по определению не могут быть выбраны. [14] Следовательно, более актуальным вопросом является то, распространяются ли эффекты лечения на субпопуляции, которые различаются в зависимости от фоновых факторов, которые могут быть не существенны для исследователя. Внешняя валидность зависит от того, имеют ли исследования методов лечения однородные эффекты в разных подгруппах людей, в разные времена, контексты и методы исследования, или же знак и величина каких-либо эффектов лечения изменяются в разных подгруппах таким образом, что исследователи могут не признавать или понимать их. . [15] Эти и Имбенс , а также Эти и Вейгер стали пионерами методов машинного обучения для индуктивного понимания эффектов гетерогенного лечения. [16] [17]

Типы дизайна [ править ]

Планы « индивидуального лечения » являются наиболее распространенным типом планирования квазиэксперимента. В этом плане экспериментатор измеряет как минимум одну независимую переменную. Наряду с измерением одной переменной экспериментатор также будет манипулировать другой независимой переменной. Поскольку происходит манипулирование и измерение различных независимых переменных, исследования в основном проводятся в лабораториях. Важным фактором при индивидуальном дизайне лечения является то, что необходимо будет использовать случайное распределение, чтобы убедиться, что экспериментатор имеет полный контроль над манипуляциями, которые производятся в исследовании. [18]

Пример такого дизайна был реализован в Университете Нотр-Дам. Исследование было проведено с целью выяснить, приводит ли наставничество к повышению удовлетворенности работой. Результаты показали, что многие люди, у которых был наставник, демонстрировали очень высокую удовлетворенность работой. Однако исследование также показало, что среди тех, кто не получил наставника, также было большое количество довольных сотрудников. Зайберт пришел к выводу, что, хотя рабочие, у которых были наставники, были счастливы, он не мог предположить, что причиной этого были сами наставники, поскольку большое количество сотрудников, не имеющих наставников, заявили, что они удовлетворены. Вот почему предварительный отбор очень важен, чтобы вы могли свести к минимуму любые недостатки исследования до того, как они будут обнаружены. [19]

«Естественные эксперименты» — это другой тип квазиэкспериментов, используемый исследователями. Он отличается от индивидуального лечения тем, что экспериментатор не манипулирует переменной. Вместо того, чтобы контролировать хотя бы одну переменную, как, например, при индивидуальном планировании лечения, экспериментаторы не используют случайное распределение и оставляют экспериментальный контроль на волю случая. Отсюда и название « естественный произошло » эксперимент. Манипуляции происходят естественным образом, и хотя этот метод может показаться неточным, во многих случаях он на самом деле оказался полезным. Это исследования, проведенные на людях, с которыми произошло что-то внезапное. Это может означать хорошее или плохое, травмирующее или эйфорическое. Примером этого могут быть исследования, проведенные на тех, кто побывал в автомобильной аварии, и на тех, кто этого не сделал. Автомобильные аварии происходят естественным образом, поэтому было бы неэтично проводить эксперименты с целью травмирования участников исследования. Эти естественные события оказались полезными для изучения. случаи посттравматического стрессового расстройства . [18]

Ссылки [ править ]

  1. ^ Перейти обратно: а б с Динардо, Дж. (2008). «естественные эксперименты и квазиестественные эксперименты». Новый экономический словарь Пэлгрейва . стр. 856–859. дои : 10.1057/9780230226203.1162 . ISBN  978-0-333-78676-5 .
  2. ^ Росси, Питер Генри; Марк В. Липси; Говард Э. Фриман (2004). Оценка: систематический подход (7-е изд.). МУДРЕЦ. п. 237. ИСБН  978-0-7619-0894-4 .
  3. ^ Гриббонс, Барри; Герман, Джоан (1997). «Истинные и квазиэкспериментальные конструкции» . Практическая оценка, исследования и оценка . 5 (14). Архивировано из оригинала 2 мая 2013 г.
  4. ^ Перейти обратно: а б Морган, Джорджия (2000). «Квазиэкспериментальные разработки». Журнал Американской академии детской и подростковой психиатрии . 39 (6): 794–796. дои : 10.1097/00004583-200006000-00020 . ПМИД   10846316 .
  5. ^ Перейти обратно: а б с д Шадиш; Готовить; Кэмбелл (2002). Экспериментальные и квазиэкспериментальные планы для обобщенного причинного вывода . Бостон: Хоутон Миффлин. ISBN  0-395-61556-9 .
  6. ^ Кэмпбелл, DT (1988). Методология и эпистемология социальных наук: избранные статьи . Издательство Чикагского университета. ISBN  0-226-09248-8 .
  7. ^ Армстронг, Дж. Скотт; Патнаик, Сандип (1 июня 2009 г.). «Использование квазиэкспериментальных данных для разработки эмпирических обобщений для убедительной рекламы» (PDF) . Журнал рекламных исследований . 49 (2): 170–175. дои : 10.2501/s0021849909090230 . ISSN   0021-8499 . S2CID   14166537 . Архивировано (PDF) из оригинала 17 августа 2017 г.
  8. ^ Перейти обратно: а б с ДеРю, Скотт (сентябрь 2012 г.). «Квазиэкспериментальное исследование обзоров после событий» . Журнал прикладной психологии . 97 (5): 997–1015. дои : 10.1037/a0028244 . hdl : 1813/71444 . ПМИД   22506721 .
  9. ^ Эксперименты, контролируемые CHARM, заархивировано 22 июля 2012 г. в Wayback Machine.
  10. ^ http://www.osulb.edu/~msaintg/ppa696/696quasi.htm [ постоянная мертвая ссылка ]
  11. ^ Линда С. Робсон, Гарри С. Шеннон, Линда М. Голденхар, Эндрю Р. Хейл (2001) Квазиэкспериментальные и экспериментальные планы: более мощные схемы оценки. Архивировано 16 сентября 2012 г., в Wayback Machine , глава 4 Руководства по Оценка эффективности стратегий предотвращения производственных травм: как показать, действительно ли меры по обеспечению безопасности работают. Архивировано 28 марта 2012 г. в Wayback Machine , Институт труда и здоровья, Канада.
  12. ^ Методы исследования: Планирование: Квази-Экспер. Дизайны заархивированы 18 марта 2013 г. в Wayback Machine.
  13. ^ Кук, Томас Д. и Дональд Т. Кэмпбелл (1979), Квази-эксперименты: проблемы проектирования и анализа для полевых условий. Бостон: Хоутон-Миффлин
  14. ^ Линч, Джон Г. младший (1982), «О внешней достоверности экспериментов в исследованиях потребителей», Journal of Consumer Research , 9 (декабрь), 225–239.
  15. ^ Кронбах, Ли Дж. (1975), «За пределами двух дисциплин научной психологии» Американский психолог 30 (2), 116.
  16. ^ Ати, Сьюзан и Гвидо Имбенс (2016), «Рекурсивное разделение гетерогенных причинных эффектов». Труды Национальной академии наук 113, (27), 7353–7360.
  17. ^ Вейгер, Стефан и Сьюзан Эти (2018), «Оценка и вывод эффектов гетерогенного лечения с использованием случайных лесов». Журнал Американской статистической ассоциации 113 (523), 1228–1242.
  18. ^ Перейти обратно: а б Мейер, Брюс (апрель 1995 г.). «Квази- и естественные эксперименты в экономике» (PDF) . Журнал деловой и экономической статистики . 13 (2): 151–161. дои : 10.1080/07350015.1995.10524589 . S2CID   56341672 .
  19. ^ Зайберт, Скотт (1999). «Эффективность облегченного наставничества: продольный квазиэксперимент». Журнал профессионального поведения . 54 (3): 483–502. дои : 10.1006/jvbe.1998.1676 .

Внешние ссылки [ править ]