Полевой эксперимент
Часть серии о |
Исследовать |
---|
Философский портал |
Эта статья нуждается в дополнительных цитатах для проверки . ( июнь 2022 г. ) |
Полевые эксперименты — это эксперименты, проводимые за пределами лабораторных условий.
Они случайным образом распределяют субъектов (или другие единицы выборки) либо в экспериментальную, либо в контрольную группы, чтобы проверить утверждения о причинно-следственных связях. Случайное распределение помогает установить сопоставимость группы лечения и контрольной группы, так что любые различия между ними, возникающие после начала лечения, правдоподобно отражают влияние лечения, а не существовавшие ранее различия между группами. Отличительными характеристиками полевых экспериментов является то, что они проводятся в реальных условиях и часто ненавязчиво и контролируют не только круг участников, но и отбор и открытость, как это определяют такие лидеры, как Джон А. Лист . Это контрастирует с лабораторными экспериментами, которые обеспечивают научный контроль путем проверки гипотезы в искусственной и строго контролируемой обстановке лаборатории. Полевые эксперименты также имеют некоторые контекстуальные отличия от естественных экспериментов и квазиэкспериментов. [1] В то время как естественные эксперименты полагаются на внешнюю силу (например, правительство, некоммерческую организацию и т. д.), контролирующую назначение и реализацию рандомизационного лечения, полевые эксперименты требуют от исследователей сохранять контроль над рандомизацией и реализацией. Квази-эксперименты происходят, когда лечение проводится как бы случайным образом (например, округа Конгресса США, где кандидаты побеждают с небольшим перевесом, [2] погодные условия, стихийные бедствия и т. д.).
Полевые эксперименты охватывают широкий спектр экспериментальных планов, каждый из которых имеет разную степень общности. Некоторые критерии общности (например, подлинность лечения, участников, контекста и показателей результатов) относятся к контекстуальному сходству между субъектами экспериментальной выборки и остальной частью населения. Они все чаще используются в социальных науках для изучения последствий политических мер в таких областях, как здравоохранение, образование, преступность, социальное обеспечение и политика.
Характеристики
[ редактировать ]При случайном распределении результаты полевых экспериментов отражают реальный мир, поскольку испытуемые распределяются по группам на основе недетерминированных вероятностей. [3] Два других основных предположения лежат в основе способности исследователя собирать объективные потенциальные результаты: исключаемость и невмешательство. [4] [5] Допущение об исключении предусматривает, что единственным значимым причинным фактором является получение лечения. Асимметрия в назначении, назначении или измерении экспериментальной и контрольной групп нарушает это предположение. Допущение о невмешательстве, или предположение о ценности стабильного единичного лечения (SUTVA), указывает на то, что ценность результата зависит только от того, назначено ли субъекту лечение, а не от того, назначено ли лечение другим субъектам. Когда эти три основных предположения выполняются, исследователи с большей вероятностью предоставят объективные оценки посредством полевых экспериментов.
После разработки полевого эксперимента и сбора данных исследователи могут использовать статистические тесты вывода, чтобы определить размер и силу воздействия вмешательства на испытуемых. Полевые эксперименты позволяют исследователям собирать разнообразные объемы и типы данных. Например, исследователь может разработать эксперимент, в котором будет использоваться информация до и после испытания в соответствующем методе статистического вывода, чтобы увидеть, влияет ли вмешательство на изменения результатов на уровне субъектов.
Практическое использование
[ редактировать ]Полевые эксперименты предлагают исследователям возможность проверить теории и ответить на вопросы с большей внешней достоверностью , поскольку они моделируют события из реального мира. [6] Некоторые исследователи утверждают, что полевые эксперименты лучше защищают от потенциальной предвзятости и необъективных оценок . Кроме того, полевые эксперименты могут служить ориентиром для сравнения данных наблюдений с экспериментальными результатами. Использование полевых экспериментов в качестве критериев может помочь определить уровни систематической ошибки в наблюдательных исследованиях, а поскольку исследователи часто разрабатывают гипотезу на основе априорных суждений, критерии могут помочь повысить достоверность исследования. [7] Хотя некоторые утверждают, что ковариативная корректировка или схемы сопоставления могут работать так же хорошо для устранения предвзятости, полевые эксперименты могут повысить уверенность. [8] путем замены смещения пропущенных переменных, поскольку они лучше распределяют наблюдаемые и ненаблюдаемые факторы. [9]
Исследователи могут использовать методы машинного обучения для моделирования, переоценки и обобщения экспериментальных данных. [10] Это увеличивает скорость и эффективность сбора результатов эксперимента и снижает затраты на реализацию эксперимента. Еще одним передовым методом полевых экспериментов является использование конструкции «многорукого бандита» . [11] включая аналогичные адаптивные планы экспериментов с переменными результатами и различными видами лечения с течением времени. [12]
Ограничения
[ редактировать ]Существуют ограничения и аргументы против использования полевых экспериментов вместо других исследовательских проектов (например, лабораторных экспериментов, обзорных экспериментов, наблюдательных исследований и т. д.). Учитывая, что полевые эксперименты обязательно проводятся в определенных географических и политических условиях, существует обеспокоенность по поводу экстраполяции результатов для формулирования общей теории относительно интересующей популяции. Тем не менее, исследователи начали находить стратегии для эффективного обобщения причинных эффектов за пределами выборки путем сравнения условий пролеченной популяции и внешней популяции, доступа к информации из выборки большего размера, а также учета и моделирования неоднородности эффектов лечения внутри выборки. [13] Другие использовали методы блокировки ковариат для обобщения результатов полевых экспериментов на внешние популяции. [14]
Проблемы несоответствия, влияющие на полевые эксперименты (как одностороннее, так и двустороннее несоблюдение) [15] [16] может произойти, когда субъекты, отнесенные к определенной группе, никогда не получают назначенного им вмешательства. Другие проблемы со сбором данных включают в себя истощение (когда субъекты, проходящие лечение, не предоставляют данные о результатах), что при определенных условиях будет искажать собранные данные. Эти проблемы могут привести к неточному анализу данных; однако исследователи, проводящие полевые эксперименты, могут использовать статистические методы для расчета полезной информации, даже когда возникают эти трудности. [16]
Использование полевых экспериментов также может привести к опасениям по поводу помех. [17] между предметами. Когда субъект или группа, получающая лечение, влияет на результаты группы, не получающей лечения (через такие условия, как перемещение, общение, заражение и т. д.), группы, не получающие лечение, могут не иметь результата, который является истинным исходом, не подвергавшимся лечению. Подмножеством помех является побочный эффект, который возникает, когда лечение обработанных групп влияет на соседние необработанные группы.
Полевые эксперименты могут быть дорогостоящими, трудоемкими, их трудно воспроизвести и они сопряжены с этическими ошибками. Субъекты или группы населения могут подорвать процесс реализации, если существует ощущение несправедливости в выборе лечения (например, в экспериментах с « отрицательным подоходным налогом » сообщества могут лоббировать получение своего сообщества денежных переводов, чтобы назначение не было чисто случайным). Существуют ограничения на сбор форм согласия от всех субъектов. Товарищи, проводящие вмешательства или собирающие данные, могут испортить схему рандомизации. полученные данные Таким образом, могут быть более разнообразными: большее стандартное отклонение , меньшая точность и точность и т. д. Это приводит к использованию выборки большего размера для полевых испытаний. Однако другие утверждают, что, хотя воспроизводимость затруднена, если результаты эксперимента важны, вероятность того, что эксперимент будет повторен, выше. Кроме того, в полевых экспериментах можно использовать схему « ступенчатого клина », которая в конечном итоге предоставит всей выборке доступ к вмешательству в различных временных графиках. [18] Исследователи также могут разработать слепой полевой эксперимент, чтобы исключить возможность манипуляции.
Примеры
[ редактировать ]История экспериментов в лабораториях и на местах оказала давнее влияние на физические, естественные и биологические науки. Современные полевые эксперименты уходят корнями в 1700-е годы, когда Джеймс Линд провел контролируемый полевой эксперимент для определения метода лечения цинги . [19]
Другие категорические примеры наук, использующих полевые эксперименты, включают:
- Экономисты использовали полевые эксперименты для анализа дискриминации (например, на рынке труда, [20] [21] в жилье, [22] в экономике совместного потребления, [23] на кредитном рынке, [24] или в интеграции [25] ), здравоохранения , программы [26] благотворительный сбор средств , [27] образование , [28] агрегирование информации на рынках и программы микрофинансирования . [29]
- Инженеры часто проводят полевые испытания прототипов продуктов, чтобы подтвердить предыдущие лабораторные испытания и получить более широкую обратную связь.
- В социальной психологии есть новаторы, использовавшие полевые эксперименты, в том числе Курт Левин и Стэнли Милгрэм .
- сельскохозяйственной науки Исследователь Р.А. Фишер проанализировал рандомизированные фактические «полевые» экспериментальные данные. [30] для сельскохозяйственных культур.
- Исследователь политологии Гарольд Госнелл провел ранний полевой эксперимент по участию избирателей в 1924 и 1925 годах. [31]
- Экология Джозефа Х. Коннелла . Полевой эксперимент [32]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Мейер, Б.Д. (1995). «Естественные и квазиэксперименты в экономике» (PDF) . Журнал деловой и экономической статистики . 13 (2): 151–161. дои : 10.2307/1392369 . JSTOR 1392369 .
- ^ Ли, Д.С.; Моретти, Э.; Батлер, MJ (2004). «Влияют ли избиратели на политику или выбирают ее? Свидетельства Палаты представителей США». Ежеквартальный экономический журнал . 119 (3): 807–859. дои : 10.1162/0033553041502153 . JSTOR 25098703 .
- ^ Рубин, Дональд Б. (2005). «Причинно-следственный вывод с использованием потенциальных результатов». Журнал Американской статистической ассоциации . 100 (469): 322–331. дои : 10.1198/016214504000001880 . S2CID 842793 .
- ^ Найман, Пяр (2017). «Поквартирная агитация на европейских выборах: данные шведского полевого эксперимента» . Электоральные исследования . 45 : 110–118. дои : 10.1016/j.electstud.2016.12.002 .
- ^ Брукман, Дэвид Э.; Калла, Джошуа Л.; Сехон, Джасджит С. (2017). «План полевых экспериментов с результатами опросов: основа для выбора более эффективных, надежных и этических планов» . Политический анализ . 25 (4): 435–464. дои : 10.1017/pan.2017.27 . S2CID 233321039 .
- ^ Дюфло, Эстер (2006). Полевые эксперименты в экономике развития (Отчет). Массачусетский технологический институт.
- ^ Харрисон, GW; Список, Дж. А. (2004). «Полевые эксперименты». Журнал экономической литературы . 42 (4): 1009–1055. дои : 10.1257/0022051043004577 . JSTOR 3594915 .
- ^ ЛаЛонд, Р.Дж. (1986). «Оценка эконометрических оценок программ обучения с использованием экспериментальных данных». Американский экономический обзор . 76 (4): 604–620. JSTOR 1806062 .
- ^ Гордон, Бретт Р.; Зеттельмейер, Флориан; Бхаргава, Неха; Чапский, Дэн (2017). «Сравнение подходов к измерению рекламы: данные крупных полевых экспериментов в Facebook». Маркетинговая наука . дои : 10.2139/ssrn.3033144 . S2CID 197733986 .
- ^ Эти, Сьюзен ; Имбенс, Гвидо (2016). «Рекурсивное разделение гетерогенных причинных эффектов: Таблица 1» . Труды Национальной академии наук . 113 (27): 7353–7360. дои : 10.1073/pnas.1510489113 . ПМЦ 4941430 . ПМИД 27382149 .
- ^ Скотт, Стивен Л. (2010). «Современный байесовский взгляд на многорукого бандита». Прикладные стохастические модели в бизнесе и промышленности . 26 (6): 639–658. дои : 10.1002/asmb.874 .
- ^ Радж, В.; Кальяни, С. (2017). «Укрощение нестационарных бандитов: байесовский подход». arXiv : 1707.09727 [ stat.ML ].
- ^ Дехеджия, Р.; Поп-Элечес, К.; Самии, К. (2015). От местного к глобальному: внешняя достоверность естественного эксперимента по рождаемости (PDF) (отчет). Национальное бюро экономических исследований. w21459.
- ^ Эгами, Наоки; Хартман, Эрин (19 июля 2018 г.). «Выбор ковариат для обобщения экспериментальных результатов» (PDF) . Princeton.edu . Архивировано из оригинала (PDF) 10 июля 2020 года . Проверено 31 декабря 2018 г.
- ^ Блэквелл, Мэтью (2017). «Инструментальные методы переменных для определения условных эффектов и причинно-следственных взаимодействий в экспериментах по мобилизации избирателей» . Журнал Американской статистической ассоциации . 112 (518): 590–599. дои : 10.1080/01621459.2016.1246363 . S2CID 55878137 .
- ^ Jump up to: Перейти обратно: а б Аронов, Питер М.; Карнеги, Эллисон (2013). «За пределами ПОЗДНЕГО: оценка среднего эффекта лечения с помощью инструментальной переменной». Политический анализ . 21 (4): 492–506. дои : 10.1093/pan/mpt013 .
- ^ Аронов, премьер-министр; Самии, К. (2017). «Оценка средних причинных эффектов при общем вмешательстве с применением к эксперименту в социальных сетях». Анналы прикладной статистики . 11 (4): 1912–1947. arXiv : 1305.6156 . дои : 10.1214/16-AOAS1005 . S2CID 26963450 .
- ^ Вертман, В.; де Хооп, Э.; Мурбек, М.; Зуйдема, SU; Герритсен, Д.Л.; Тееренстра, С. (2013). «Ступенчатые клинья могут уменьшить необходимый размер выборки в кластерных рандомизированных исследованиях» . Журнал клинической эпидемиологии . 66 (7): 752–758. дои : 10.1016/j.jclinepi.2013.01.009 . hdl : 2066/117688 . ПМИД 23523551 .
- ^ Трелер, У. (2005). «Линд и цинга: 1747–1795 гг.» . Журнал Королевского медицинского общества . 98 (11): 519–522. дои : 10.1177/014107680509801120 . ПМК 1276007 . ПМИД 16260808 .
- ^ Бертран, Марианна; Муллайнатан, Сендхил (2004). «Являются ли Эмили и Грег более трудоспособными, чем Лакиша и Джамал? Полевой эксперимент по дискриминации на рынке труда» (PDF) . Американский экономический обзор . 94 (4): 991–1013. дои : 10.1257/0002828042002561 .
- ^ Гнизи, Ури; Список, Джон А. (2006). «Применение поведенческой экономики на практике: тестирование обмена подарками на рынках труда с помощью полевых экспериментов» (PDF) . Эконометрика . 74 (5): 1365–1384. дои : 10.1111/j.1468-0262.2006.00707.x .
- ^ Ахмед, Али М; Хаммарштедт, Матс (2008). «Дискриминация на рынке арендного жилья: полевой эксперимент в Интернете». Журнал городской экономики . 64 (2): 362–372. дои : 10.1016/j.jue.2008.02.004 .
- ^ Эдельман, Бенджамин; Лука, Майкл; Свирский, Дэн (2017). «Расовая дискриминация в экономике совместного использования: данные полевого эксперимента» . Американский экономический журнал: Прикладная экономика . 9 (2): 1–22. дои : 10.1257/app.20160213 .
- ^ Пейджер, Дева; Шепард, Хана (2008). «Социология дискриминации: расовая дискриминация в сфере занятости, жилья, кредита и потребительских рынков» . Ежегодный обзор социологии . 34 : 181–209. дои : 10.1146/annurev.soc.33.040406.131740 . ПМК 2915460 . ПМИД 20689680 .
- ^ Несселер, Корнел; Карлос, Гомес-Гонсалес; Дитль, Хельмут (2019). «Что в названии? Измерение доступа к социальной деятельности с помощью полевого эксперимента» . Пэлгрейв Коммуникейшнз . 5 : 1–7. дои : 10.1057/s41599-019-0372-0 . hdl : 11250/2635691 .
- ^ Ашраф, Нава; Берри, Джеймс; Шапиро, Джесси М (2010). «Могут ли более высокие цены стимулировать использование продукта? Данные полевого эксперимента в Замбии» (PDF) . Американский экономический обзор . 100 (5): 2383–2413. дои : 10.1257/aer.100.5.2383 . S2CID 6392533 .
- ^ Карлан, Дин; Список, Джон А. (2007). «Имеет ли значение цена в благотворительных пожертвованиях? Данные крупномасштабного эксперимента в естественных условиях» (PDF) . Американский экономический обзор . 97 (5): 1774–1793. дои : 10.1257/aer.97.5.1774 . S2CID 10041821 .
- ^ Фрайер-младший, Роланд Дж. (2014). «Внедрение лучших практик чартерных школ в традиционные государственные школы: данные полевых экспериментов». Ежеквартальный экономический журнал . 129 (3): 1355–1407. дои : 10.1093/qje/qju011 .
- ^ Филд, Эрика; Панде, Рохини (2008). «Частота погашения и дефолт в микрофинансировании: данные из Индии». Журнал Европейской экономической ассоциации . 6 (2–3): 501–509. дои : 10.1162/JEEA.2008.6.2-3.501 .
- ^ Фишер, Р.А. (1937). План экспериментов (PDF) . Оливер и Бойд, ООО.
- ^ Госнелл, Гарольд Ф. (1926). «Эксперимент по стимулированию голосования» . Американский обзор политической науки . 20 (4): 869–874. дои : 10.1017/S0003055400110524 .
- ^ Гродволь, Жан-Батист; Порту, Франко; Эль-Хани, Шарбель Н. (31 июля 2018 г.). «Нестабильность полевых экспериментов: формирование традиции экспериментальных исследований на скалистых берегах моря (1950–1985)» . История и философия наук о жизни . 40 (3): 45. дои : 10.1007/s40656-018-0209-y . ISSN 1742-6316 . ПМИД 30066110 . S2CID 51889466 .