Кризис репликации
Кризис репликации [а] Продолжается методологический кризис, при котором результаты многих научных исследований трудно или невозможно воспроизвести . Поскольку воспроизводимость эмпирических результатов является неотъемлемой частью научного метода , [2] такие неудачи подрывают доверие к теориям, основанным на них, и потенциально ставят под сомнение существенные части научных знаний.
Кризис репликации часто обсуждается в контексте психологии и медицины , где были предприняты значительные усилия для повторного исследования классических результатов, чтобы определить, надежны ли они, и, если они окажутся неправильными, причины неудачи. [3] [4] Данные убедительно свидетельствуют о том, что другие естественные и социальные науки . это затронуло и [5]
Термин «кризис репликации» был придуман в начале 2010-х годов. [6] как часть растущего осознания проблемы. Рассмотрение причин и средств лечения привело к возникновению новой научной дисциплины — метанауки . [7] который использует методы эмпирического исследования для изучения практики эмпирических исследований.
Соображения относительно воспроизводимости можно разделить на две категории. Воспроизводимость в узком смысле означает повторное изучение и проверку анализа данного набора данных. Репликация означает повторение эксперимента или исследования для получения новых независимых данных с целью достижения тех же или аналогичных выводов.
Фон
[ редактировать ]Репликация
[ редактировать ]Репликацию называют «краеугольным камнем науки». [8] [9] Ученый по вопросам гигиены окружающей среды Стефан Шмидт начал обзор 2009 года с такого описания репликации:
Репликация — одна из центральных проблем любой эмпирической науки. Подтверждение результатов или гипотез методом повторения лежит в основе любой научной концепции. Повторный эксперимент, призванный продемонстрировать, что те же результаты могут быть получены в любом другом месте любым другим исследователем, задуман как операционализация объективности. Это доказательство того, что эксперимент отражает знание, которое можно отделить от конкретных обстоятельств (таких как время, место или люди), при которых оно было получено. [10]
Но существует ограниченный консенсус относительно того, как определять репликацию и потенциально связанные с ней концепции. [11] [12] [10] Выделено несколько типов репликации:
- Прямая или точная репликация , при которой экспериментальная процедура повторяется как можно точнее. [10] [13]
- Систематическое повторение , при котором экспериментальная процедура в значительной степени повторяется с некоторыми преднамеренными изменениями. [13]
- Концептуальная репликация , при которой открытие или гипотеза проверяются с использованием другой процедуры. [10] [13] Концептуальная репликация позволяет проверить обобщаемость и достоверность результата или гипотезы. [13]
Воспроизводимость также можно отличить от репликации , поскольку она относится к воспроизведению одних и тех же результатов с использованием одного и того же набора данных. Воспроизводимость такого типа является причиной того, что многие исследователи предоставляют свои данные другим для тестирования. [14]
Кризис репликации не обязательно означает, что эти области ненаучны. [15] [16] [17] Скорее, этот процесс является частью научного процесса, в котором отсекаются старые идеи или те идеи, которые не выдерживают тщательного изучения. [18] [19] хотя этот процесс обрезки не всегда эффективен. [20] [21]
Гипотеза обычно считается подтвержденной, если результаты соответствуют предсказанному образцу и этот образец результатов оказывается статистически значимым . Результаты считаются значимыми, если относительная частота наблюдаемой закономерности падает ниже произвольно выбранного значения (т.е. уровня значимости ) при предположении, что нулевая гипотеза верна. В целом это отвечает на вопрос о том, насколько маловероятными были бы результаты, если бы на уровне статистической совокупности не существовало различий . Если вероятность, связанная со статистикой теста, превышает выбранное критическое значение , результаты считаются статистически значимыми. [22] Соответствующая вероятность превышения критического значения обозначается как p <0,05, где p (обычно называемое « p -значением ») — уровень вероятности. Это должно привести к тому, что 5% подтвержденных гипотез окажутся ложноположительными (неправильная гипотеза будет ошибочно признана правильной), при условии, что исследования соответствуют всем статистическим предположениям. В некоторых полях используются меньшие значения p, например p < 0,01 (вероятность ложноположительного результата 1%) или p < 0,001 (вероятность ложноположительного результата 0,1%). Но меньшая вероятность ложноположительного результата часто требует большего размера выборки или большей вероятности ложноотрицательного результата (правильная гипотеза ошибочно оказывается неверной) . Хотя тестирование p -значения является наиболее часто используемым методом, это не единственный метод.
Статистика
[ редактировать ]Этот раздел может содержать чрезмерное количество сложных деталей, которые могут заинтересовать только определенную аудиторию . ( Июль 2024 г. ) |
Некоторые термины, обычно используемые при обсуждении кризиса репликации, имеют технически точные значения, которые представлены здесь. [1]
В наиболее распространенном случае проверки нулевой гипотезы есть две гипотезы: нулевая гипотеза. и альтернативная гипотеза . Нулевая гипотеза обычно имеет форму «X и Y статистически независимы ». Например, нулевая гипотеза может заключаться в том, что «прием препарата X не меняет показатель выздоровления от болезни Y в течение 1 года», а альтернативная гипотеза состоит в том, что он действительно меняется.
Поскольку проверка полной статистической независимости затруднена, полную нулевую гипотезу часто упрощают до упрощенной нулевой гипотезы «размер эффекта равен 0», где « размер эффекта » — это действительное число, равное 0, если полная нулевая гипотеза верна, и чем больше размер эффекта, тем в большей степени ложна нулевая гипотеза. [23] Например, если X является двоичным, то размер эффекта можно определить как изменение ожидания Y при изменении X: Обратите внимание, что размер эффекта, определенный выше, может быть равен нулю, даже если X и Y не являются независимыми, например, когда . Поскольку разные определения «размера эффекта» отражают разные способы зависимости X и Y, существует много разных определений размера эффекта.
На практике размеры эффекта невозможно наблюдать напрямую, их необходимо измерять с помощью статистических оценок . Например, приведенное выше определение размера эффекта часто измеряется с помощью оценщика Коэна . Один и тот же размер эффекта может иметь несколько оценок, поскольку они имеют компромисс между эффективностью , смещением , дисперсией и т. д. Это еще больше увеличивает количество возможных статистических величин, которые можно вычислить на одном наборе данных. Когда для статистического тестирования используется оценщик размера эффекта, он называется тестовой статистикой .
нулевой гипотезы Проверка — это процедура принятия решения, которая принимает некоторые данные и выводит либо или . Если он выводит Обычно это формулируется как «имеется статистически значимый эффект» или «нулевая гипотеза отвергается».
Часто статистический тест представляет собой (односторонний) пороговый тест , который структурирован следующим образом:
- Сбор данных .
- Вычислить тестовую статистику для данных.
- Сравните статистику теста с критическим значением / порогом . Если , затем выведите , иначе, вывод .
Двусторонний пороговый тест аналогичен, но с двумя порогами, так что на выходе если либо или
Существует 4 возможных результата проверки нулевой гипотезы: ложноотрицательный, истинно отрицательный, ложноположительный, истинно положительный. Ложноотрицательный результат означает, что верно, но результат теста ; истинно отрицательный означает, что верно, и результат теста , и т. д.
Вероятность отклонения | Вероятность не отклонить | |
---|---|---|
Если это правда | а | 1-а |
Если это правда | 1-б (силовой) | б |
Уровень значимости , уровень ложных срабатываний или альфа-уровень — это вероятность того, что альтернатива окажется верной, когда нулевая гипотеза верна: Например, если тест является односторонним пороговым тестом, то где означает «данные взяты из ".
Статистическая мощность , истинно положительный показатель, — это вероятность того, что альтернатива окажется верной, когда альтернативная гипотеза верна: где также называется ложноотрицательным показателем. Например, если тест является односторонним пороговым тестом, то .
Учитывая статистический тест и набор данных , соответствующее значение p представляет собой вероятность того, что тестовая статистика будет, по крайней мере, столь же экстремальной, при условии, что . Например, для одностороннего порогового теста: Если нулевая гипотеза верна, то значение p распределяется равномерно по . В противном случае он обычно достигает максимума и примерно экспоненциально, хотя точная форма распределения значений p зависит от альтернативной гипотезы. [24] [25]
Поскольку значение p распределено равномерно на при условии нулевой гипотезы можно построить статистический тест с любым уровнем значимости просто вычислив значение p, а затем выведя если . Обычно это формулируется так: «нулевая гипотеза отвергается на уровне значимости». ", или " «, например, «курение коррелирует с раком (p <0,001)».
История
[ редактировать ]Начало репликационного кризиса можно отнести к ряду событий начала 2010-х годов. Философ науки и социальный эпистемолог Фелипе Ромеро выделил четыре события, которые можно считать предвестниками продолжающегося кризиса: [26]
- Споры вокруг исследований социального прайминга: в начале 2010-х годов было проведено известное исследование «пожилые люди ходят» [27] социальный психолог Джон Барг и его коллеги не смогли воспроизвести результат в двух прямых повторах. [28] Этот эксперимент был частью серии из трех исследований, которые на протяжении многих лет широко цитировались, регулярно преподавались на университетских курсах и послужили вдохновением для большого количества концептуальных повторений. Неспособность повторить исследование привела к многочисленным спорам и жарким дебатам с участием первоначальных авторов. [29] Примечательно, что многие из концептуальных копий первоначальных исследований также не удалось воспроизвести в последующих прямых репликациях. [30] [31] [32] [33]
- Споры вокруг экспериментов по экстрасенсорному восприятию: Социальный психолог Дэрил Бем провел серию экспериментов, предположительно доказывающих противоречивый феномен экстрасенсорного восприятия . [34] Бема подвергли резкой критике за методологию своего исследования, и при повторном анализе данных не было обнаружено никаких доказательств существования экстрасенсорного восприятия. [35] Эксперимент также не удалось повторить в последующих прямых репликациях. [36] По словам Ромеро, сообщество особенно расстроило то, что многие ошибочные процедуры и статистические инструменты, использованные в исследованиях Бема, были частью обычной исследовательской практики в психологии.
- Amgen и Bayer сообщают об отсутствии воспроизводимости биомедицинских исследований: ученые из биотехнологических компаний Amgen и Bayer Healthcare сообщили о тревожно низких показателях репликации (11–20%) важных результатов доклинических онкологических исследований. [37]
- Публикация исследований по хакингу и сомнительным исследовательским практикам : с конца 2000-х годов ряд исследований в области метанауки показал, как широко распространенные практики во многих научных областях, такие как использование гибкости процесса сбора данных и отчетности, могут значительно повысить вероятность ложноположительных результатов. [38] [39] [40] Эти исследования показали, что значительная часть опубликованной литературы в нескольких научных областях может представлять собой невоспроизводимые исследования.
Эта серия событий породила большой скептицизм по поводу достоверности существующих исследований в свете широко распространенных методологических ошибок и неспособности воспроизвести результаты. Это побудило видных учёных объявить о «кризисе доверия» в психологии и других областях. [41] и последовавшая за этим ситуация стала известна как «кризис репликации».
Хотя начало кризиса репликации можно отнести к началу 2010-х годов, некоторые авторы отмечают, что опасения по поводу воспроизводимости и исследовательской практики в социальных науках были выражены гораздо раньше. Ромеро отмечает, что авторы выражали обеспокоенность по поводу отсутствия прямых повторов в психологических исследованиях конца 1960-х — начала 1970-х годов. [42] [43] Он также пишет, что в некоторых исследованиях 1990-х годов уже сообщалось, что редакторы и рецензенты журналов, как правило, предвзято относятся к публикации повторных исследований. [44] [45]
В социальных науках блог Data Colada (трое авторов которого в 2014 году ввели термин « p-хакинг ») считается вкладом в начало кризиса репликации. [46] [47] [48]
Профессор Университета Вирджинии и когнитивный психолог Барбара А. Спеллман написала, что многие критические замечания в отношении исследовательской практики и опасения по поводу воспроизводимости исследований не новы. [49] Она сообщает, что между концом 1950-х и 1990-ми годами ученые уже выражали обеспокоенность по поводу возможного кризиса репликации. [50] подозрительно высокий процент положительных результатов, [51] сомнительные исследовательские практики (QRP), [52] последствия предвзятости публикаций, [53] проблемы со статистической мощностью, [54] [55] и плохие стандарты отчетности. [50]
Спеллман также называет причины, по которым повторение этой критики и опасений в последние годы привело к полномасштабному кризису и угрозе статус-кво. Во-первых, технологические усовершенствования облегчили проведение и распространение повторных исследований, а также анализ большого количества литературы по системным проблемам. Во-вторых, растущий размер и разнообразие исследовательского сообщества облегчили работу его авторитетных членов для более тщательного изучения другими членами сообщества, с ними незнакомыми. По мнению Спеллмана, эти факторы в сочетании со все более ограниченными ресурсами и несогласованными стимулами для занятий научной работой привели к кризису в психологии и других областях. [49]
По словам Эндрю Гельмана , [56] работы Пола Миля, Джейкоба Коэна, Тверски и Канемана в 1960-70-х годах были ранними предупреждениями о кризисе репликации. Обсуждая истоки проблемы, Канеман сам отмечал исторические прецеденты неудач в репликации подсознательного восприятия и уменьшения диссонанса . [57]
На это неоднократно указывалось, начиная с 1962 г. [54] что большинство психологических исследований имеют низкую мощность (истинно положительный показатель), но низкая мощность сохранялась в течение 50 лет, что указывает на структурную и постоянную проблему в психологических исследованиях. [58] [59]
Распространенность
[ редактировать ]В психологии
[ редактировать ]Сочетание нескольких факторов поставило психологию в центр разговора. [60] [61] Некоторые области психологии, когда-то считавшиеся солидными, такие как социальная подготовка и истощение эго , [62] попали под пристальное внимание из-за неудачных попыток репликации. [63] Большое внимание уделялось социальной психологии . [64] хотя другие области психологии, такие как клиническая психология , [65] [66] [67] психология развития , [68] [69] [70] и образовательные исследования также были замешаны. [71] [72] [73] [74] [75]
В августе 2015 года было опубликовано первое открытое эмпирическое исследование воспроизводимости в психологии под названием « Проект воспроизводимости: психология» . Под руководством психолога Брайана Носека исследователи переделали 100 исследований по психологической науке из трёх высокорейтинговых журналов по психологии ( «Журнал личности и социальной психологии» , «Журнал экспериментальной психологии: обучение, память и познание» и «Психологическая наука» ). 97 первоначальных исследований имели значительные эффекты, но из этих 97 только 36% повторов дали значимые результаты ( значение p ниже 0,05). [11] Средний размер эффекта в повторениях был примерно вдвое меньше эффектов, о которых сообщалось в первоначальных исследованиях. В той же статье были рассмотрены показатели воспроизводимости и величины эффекта по журналам и дисциплинам. Коэффициент повторения исследования составил 23% для « Журнала личности и социальной психологии» , 48% для «Журнала экспериментальной психологии: обучение, память и познание » и 38% для «Психологической науки» . Исследования в области когнитивной психологии имели более высокий уровень репликации (50%), чем исследования в области социальной психологии (25%). [76]
Из 64% нерепликаций только 25% опровергли первоначальный результат (при статистической значимости). Остальные 49% не дали окончательных результатов, не подтверждая и не опровергая первоначальный результат. Это связано с тем, что многие репликации были недостаточно мощными: выборка была в 2,5 раза меньше исходной. [77]
Исследование, опубликованное в 2018 году в журнале Nature Human Behavior, воспроизвело 21 социальную и поведенческую научную статью из журнала Nature and Science , обнаружив, что только около 62% из них смогли успешно воспроизвести оригинальные результаты. [78] [79]
Аналогичным образом, в исследовании, проведенном под эгидой Центра открытой науки , группа из 186 исследователей из 60 различных лабораторий (представляющих 36 разных национальностей с шести разных континентов) повторила 28 классических и современных открытий в области психологии. [80] [81] В центре внимания исследования было не только то, повторяются ли выводы оригинальных статей, но и степень, в которой результаты различаются в зависимости от вариаций в выборках и контекстах. В целом, 50% из 28 результатов не удалось повторить, несмотря на огромные размеры выборки. Но если результат повторялся, то он воспроизводился в большинстве образцов. Если результат не был воспроизведен, значит, он не смог воспроизвестися с небольшими вариациями в разных образцах и контекстах. Эти данные не согласуются с предлагаемым объяснением того, что неудачи в воспроизведении в психологии, вероятно, связаны с изменениями в выборке между исходным и повторным исследованием. [81]
Результаты исследования 2022 года показывают, что многие более ранние ( мозга исследования фенотипа «исследования ассоциаций всего мозга» (BWAS)) привели к неверным выводам, поскольку для повторения таких исследований требуются образцы от тысяч людей из-за небольшой величины эффекта . [82] [83]
В медицине
[ редактировать ]Из 49 медицинских исследований с 1990 по 2003 год, получивших более 1000 цитирований, 92% обнаружили, что изучаемые методы лечения эффективны. Из этих исследований 16% противоречили последующим исследованиям, 16% обнаружили более сильные эффекты, чем последующие исследования, 44% были повторены, а 24% остались практически неоспоримыми. [84] Анализ, проведенный в 2011 году исследователями фармацевтической компании Bayer, показал, что не более четверти собственных результатов Bayer повторяют первоначальные результаты. [85] Но анализ результатов Байера показал, что повторяющиеся результаты часто могут быть успешно использованы в клинических целях. [86]
В статье 2012 года К. Гленн Бегли , консультант по биотехнологиям, работающий в Amgen , и Ли Эллис, медицинский исследователь из Техасского университета, обнаружили, что только 11% из 53 доклинических исследований рака имели повторы, которые могли подтвердить выводы оригинальные исследования. [37] В конце 2021 года проект «Проект воспроизводимости: биология рака» изучил 53 ведущие статьи о раке, опубликованные в период с 2010 по 2012 год, и показал, что среди исследований, которые предоставили достаточно информации для переделки, размеры эффекта были в среднем на 85% меньше, чем первоначальные результаты. [87] [88] Опрос исследователей рака показал, что половина из них не смогла воспроизвести опубликованный результат. [89] По оценкам другого отчета, почти половина рандомизированных контролируемых исследований содержала ошибочные данные (на основе анализа анонимных данных отдельных участников (IPD) из более чем 150 исследований). [90]
По другим дисциплинам
[ редактировать ]В экономике
[ редактировать ]Экономика отстала от других социальных наук и психологии в своих попытках оценить скорость повторения и увеличить количество исследований, пытающихся повторить. [12] Исследование 2016 года, опубликованное в журнале Science, воспроизвело 18 экспериментальных исследований, опубликованных в двух ведущих экономических журналах, The American Economic Review и Quarterly Journal of Economics , в период с 2011 по 2014 год. Было обнаружено, что около 39% из них не смогли воспроизвести исходные результаты. [91] [92] [93] Около 20% исследований, опубликованных в The American Economic Review, противоречат другим исследованиям, несмотря на то, что они основаны на тех же или похожих наборах данных. [94] Исследование эмпирических данных, опубликованное в журнале Strategic Management Journal, показало, что около 30% из 27 повторно протестированных статей показали статистически незначимые результаты для ранее значимых результатов, тогда как около 4% показали статистически значимые результаты для ранее незначимых результатов. [95]
В управлении водными ресурсами
[ редактировать ]Исследование, проведенное в журнале Scientific Data в 2019 году , с уверенностью 95% подсчитало, что из 1989 статей по водным ресурсам и управлению, опубликованных в 2017 году, результаты исследования могут быть воспроизведены только в 0,6–6,8%, даже если каждая из этих статей предоставит достаточную информацию, которая позволит для репликации. [96]
По полям
[ редактировать ]Опрос, проведенный в 2016 году журналом Nature среди 1576 исследователей, которые заполнили краткую онлайн-анкету о воспроизводимости, показал, что более 70% исследователей пытались, но не смогли воспроизвести результаты экспериментов другого ученого (в том числе 87% химиков , 77% биологов , 69% физиков) . инженеров исследователей - , 67% медиков , 64% учёных, занимающихся землей и окружающей средой , и 62% всех остальных), и более половины не смогли воспроизвести свои собственные эксперименты. Но менее чем с 20% связались с другими исследователями, которые не смогли воспроизвести их работу. Опрос показал, что менее 31% исследователей считают, что неспособность воспроизвести результаты означает, что первоначальный результат, вероятно, неверен, хотя 52% согласны с тем, что существует серьезный кризис репликации. Большинство исследователей заявили, что по-прежнему доверяют опубликованной литературе. [5] [97] В 2010 году Фанелли (2010) [98] обнаружили, что 91,5% психиатрических/психологических исследований подтвердили эффекты, которые они искали, и пришли к выводу, что вероятность этого события (положительный результат) была примерно в пять раз выше, чем в таких областях, как астрономия или геонауки . Фанелли утверждал, что это происходит потому, что исследователи «мягких» наук меньше ограничивают свои сознательные и бессознательные предубеждения.
Ранний анализ экспертной оценки без учета результатов , на которую меньше влияет предвзятость публикаций, показал, что 61% слепых исследований в биомедицине и психологии привели к нулевым результатам , в отличие от примерно 5–20% в более ранних исследованиях. . [99]
В 2021 году исследование, проведенное Калифорнийским университетом в Сан-Диего, показало, что статьи, которые невозможно воспроизвести, цитируются в 153 раза чаще. Среди статей, опубликованных в журнале Nature Science , нереплицируемые статьи цитировались в 300 раз чаще, чем тиражируемые. [100] Нереплицируемые публикации часто цитируются чаще даже после публикации повторного исследования. [101]
Причины
[ редактировать ]Существует множество предполагаемых причин кризиса репликации.
Исторические и социологические причины
[ редактировать ]Кризис репликации может быть вызван «генерацией новых данных и научных публикаций с беспрецедентной скоростью», что приводит к «отчаянию опубликовать или погибнуть» и неспособности придерживаться хорошей научной практики. [102]
Предсказания о надвигающемся кризисе механизма контроля качества науки можно проследить уже несколько десятилетий. Дерек де Солла Прайс , считающийся отцом наукометрики , количественного исследования науки, предсказал в 1963 году, что наука может достичь «старости» в результате своего собственного экспоненциального роста. [103] Некоторая современная литература, кажется, подтверждает это пророчество о «переполнении», сокрушаясь об упадке как внимания, так и качества. [104] [105]
Историк Филип Мировски утверждает, что снижение качества науки может быть связано с ее коммерциализацией, особенно вызванное решением крупных корпораций, ориентированным на получение прибыли, передать свои исследования на аутсорсинг университетам и контрактным исследовательским организациям . [106]
Теория социальных систем , изложенная в работах немецкого социолога Никласа Лумана , позволяет поставить аналогичный диагноз. Эта теория утверждает, что каждая система, такая как экономика, наука, религия и средства массовой информации, общается, используя свой собственный код: истинный и ложный для науки, прибыли и убытки для экономики, новости и неновости для средств массовой информации и так далее. [107] [108] науки По мнению некоторых социологов, медиатизация , [109] коммодификация, [106] и политизация, [109] [110] в результате структурной связи между системами привели к путанице исходных системных кодов.
Проблемы с системой публикаций в науке
[ редактировать ]Предвзятость публикации
[ редактировать ]Основной причиной низкой воспроизводимости является систематическая ошибка публикации, возникающая из-за того, что статистически незначимые результаты и, казалось бы, неоригинальные повторы публикуются редко. Лишь очень небольшая часть академических журналов по психологии и нейробиологии открыто приветствовала представление повторных исследований с указанием их целей и масштабов или инструкций для авторов. [111] [112] Это не поощряет отчетность или даже попытки провести повторные исследования. Среди 1576 исследователей, опрошенных Nature в 2016 году, лишь меньшинство когда-либо пытались опубликовать повторные исследования, а несколько респондентов, опубликовавших неудачные повторения, отметили, что редакторы и рецензенты требовали, чтобы они преуменьшали сравнение с оригинальными исследованиями. [5] [97] Анализ 4270 эмпирических исследований в 18 деловых журналах с 1970 по 1991 год показал, что менее 10% статей по бухгалтерскому учету, экономике и финансам и 5% статей по менеджменту и маркетингу представляют собой исследования, повторяющиеся. [91] [113] Предвзятость публикации усиливается давлением со стороны автора и собственной предвзятостью подтверждения . [б] и представляет собой неотъемлемую опасность в этой области, требующую определенной степени скептицизма со стороны читателей. [40]
Предвзятость публикации приводит к тому, что психолог Роберт Розенталь называет « эффектом ящика с папками ». Эффект ящика с файлами — это идея о том, что вследствие предвзятости публикации значительное количество отрицательных результатов [с] не публикуются. По словам философа науки Фелипе Ромеро, это имеет тенденцию создавать «вводящую в заблуждение литературу и предвзятые метааналитические исследования». [26] и если принять во внимание предвзятость публикаций наряду с тем фактом, что большинство проверенных гипотез могут быть ложными априори , вполне вероятно, что значительная часть результатов исследований может быть ложноположительными, как показал метаученый Джон Иоаннидис. [1] В свою очередь, высокая доля ложноположительных результатов в опубликованной литературе может объяснить, почему многие результаты невоспроизводимы. [26]
Еще одна предвзятость публикаций заключается в том, что исследования, которые не отвергают нулевую гипотезу, изучаются асимметрично. Например, они, скорее всего, будут отклонены как трудные для интерпретации или содержащие ошибку второго рода. Исследования, которые отвергают нулевую гипотезу, вряд ли будут отклонены по этим причинам. [115]
В популярных средствах массовой информации существует еще один элемент предвзятости публикаций: желание сделать исследования доступными для общественности привело к чрезмерному упрощению и преувеличению результатов, создавая нереалистичные ожидания и усиливая влияние неповторения результатов. Напротив, о нулевых результатах и неудачах при воспроизведении, как правило, не сообщается. Это объяснение может быть применимо и к власти . кризису репликации [116]
Математические ошибки
[ редактировать ]Даже влиятельные журналы имеют значительную долю математических ошибок при использовании статистики. Например, 11% статистических результатов, опубликованных в журналах Nature и BMJ в 2001 году, являются «неконгруэнтными», что означает, что заявленное значение p математически отличается от того, каким оно должно быть, если бы оно было правильно рассчитано на основе сообщенной статистики испытаний. Эти ошибки, вероятно, были вызваны ошибками набора, округления и транскрипции. [117]
Среди 157 нейробиологических статей, опубликованных в пяти ведущих журналах и пытающихся показать, что два экспериментальных эффекта различны, 78 вместо этого ошибочно проверяли, является ли один эффект значимым, а другой нет, а 79 правильно проверяли, существенно ли их различие отличается от 0. [118]
Культура «Публикуй или погибни»
[ редактировать ]Последствия для воспроизводимости предвзятости публикаций усугубляются академической культурой «опубликуй или погибни». Как объяснил метаученый Даниэле Фанелли, культура «публикуй или погибни» — это социологический аспект академических кругов, в соответствии с которым ученые работают в среде с очень высоким давлением, требующим публикации их работ в признанных журналах. Это является следствием гиперконкуренции в академической рабочей среде и того, что библиометрические параметры (например, количество публикаций) все чаще используются для оценки научной карьеры. [119] По словам Фанелли, это подталкивает ученых к использованию ряда стратегий, направленных на то, чтобы сделать результаты «доступными для публикации». В контексте предвзятости публикаций это может означать принятие поведения, направленного на получение положительных или статистически значимых результатов, часто в ущерб их достоверности (см. QRP, раздел 4.3). [119]
По мнению основателя Центра открытой науки Брайана Носека и его коллег, культура «публикуй или погибни» создала ситуацию, в которой цели и ценности отдельных ученых (например, возможность публикации) не совпадают с общими целями науки (например, поиск научной истины). ). Это наносит ущерб достоверности опубликованных результатов. [120]
Философ Брайан Д. Эрп и психолог Джим Эверетт утверждают, что, хотя копирование отвечает интересам ученых и исследователей как группы, особенности академической психологической культуры препятствуют воспроизведению отдельными исследователями. Они утверждают, что выполнение репликаций может занять много времени и отнять ресурсы у проектов, которые отражают оригинальное мышление исследователя. Их сложнее публиковать, главным образом потому, что они неоригинальны, и даже когда их можно будет опубликовать, они вряд ли будут рассматриваться как важный вклад в эту область. Реплики «приносят меньше признания и вознаграждений, в том числе грантов, своим авторам». [121]
В своей книге 1971 года «Научное знание и его социальные проблемы » философ и историк науки Джером Р. Равец предсказал, что наука — в ее развитии от «маленькой» науки, состоящей из изолированных сообществ исследователей, к «большой» науке или «технонауке» — столкнется с серьезными проблемами во внутренней системе контроля качества. Он признал, что структура стимулов для современных ученых может стать дисфункциональной, создавая извращенные стимулы для публикации любых результатов, какими бы сомнительными они ни были. По мнению Равеца, качество науки поддерживается только тогда, когда существует сообщество ученых, связанных набором общих норм и стандартов, которые хотят и могут привлекать друг друга к ответственности.
Стандарты отчетности
[ редактировать ]Определенная издательская практика также затрудняет воспроизведение и отслеживание серьезности кризиса воспроизводимости, поскольку статьи часто содержат недостаточно описаний, чтобы другие ученые могли воспроизвести исследование. Проект воспроизводимости: биология рака показал, что из 193 экспериментов из 53 ведущих статей о раке, опубликованных в период с 2010 по 2012 год, только у 50 экспериментов из 23 статей есть авторы, которые предоставили исследователям достаточно информации, чтобы переделать исследования, иногда с изменениями. Ни в одной из 193 рассмотренных статей не были полностью описаны протоколы экспериментов, а для воспроизведения 70% экспериментов требовалось запросить ключевые реагенты. [87] [88] Вышеупомянутое исследование эмпирических результатов в журнале «Стратегический менеджмент» показало, что 70% из 88 статей не удалось воспроизвести из-за отсутствия достаточной информации для данных или процедур. [91] [95] В сфере водных ресурсов и управления большинство из 1987 статей, опубликованных в 2017 году, не удалось воспроизвести из-за отсутствия доступной информации, размещенной в Интернете. [96] В исследованиях потенциалов, связанных с событиями , только две трети информации, необходимой для воспроизведения исследования, были представлены в выборке из 150 исследований, что подчеркивает наличие существенных пробелов в отчетности. [122]
Процедурная предвзятость
[ редактировать ]Согласно тезису Дюэма-Куайна , научные результаты интерпретируются как содержательной теорией, так и теорией инструментов. Например, астрономические наблюдения зависят как от теории астрономических объектов, так и от теории телескопов. Большой объем невоспроизводимых исследований может накопиться, если существует предвзятость следующего типа: столкнувшись с нулевым результатом, ученый предпочитает относиться к данным так, будто инструмент недостаточен; Столкнувшись с ненулевым результатом, учёный предпочитает признать прибор хорошим и рассматривать данные как говорящие что-то об основной теории. [123]
Культурная эволюция
[ редактировать ]Смальдино и МакЭлрит [59] предложил простую модель культурной эволюции научной практики. Каждая лаборатория случайным образом решает провести новое исследование или повторное исследование с разными фиксированными уровнями ложноположительных результатов, истинно положительных результатов, уровня репликации и продуктивности (ее «характеристик»). Лаборатория может приложить больше «усилий», что сделает кривую ROC более выпуклой, но снизит производительность. Лаборатория за время своего существования накапливает оценку, которая увеличивается с появлением публикаций и снижается, когда другая лаборатория не может воспроизвести ее результаты. Через определенные промежутки времени одна случайная лаборатория «умирает», а другая «воспроизводит» дочернюю лабораторию с такой же чертой, как и ее родительская. Лаборатории с более высокими оценками имеют больше шансов на воспроизводство. При определенных настройках параметров совокупность лабораторий достигает максимальной производительности даже ценой очень высокого уровня ложноположительных результатов.
Сомнительные исследовательские практики и мошенничество
[ редактировать ]Сомнительные исследовательские практики (QRP) — это преднамеренное поведение, которое извлекает выгоду из серой зоны приемлемого научного поведения или использует степени свободы исследователя (исследователь DF), что может способствовать невоспроизводимости результатов за счет увеличения вероятности ложноположительных результатов. [124] [125] [40] Исследовательский DF проявляется в формулировании гипотез , планировании экспериментов , данных сборе и анализе , а также в составлении отчетов об исследованиях . [125] Некоторыми примерами QRP являются сбор данных , [125] [126] [39] [д] выборочная отчетность , [124] [125] [126] [39] [и] и HARKing (выдвижение гипотез после того, как станут известны результаты). [125] [126] [39] [ф] В медицине невоспроизводимые исследования имеют шесть общих черт. К ним относятся исследователи, которые не закрывают глаза на экспериментальные группы по сравнению с контрольными группами, отказ от повторения экспериментов, отсутствие положительного и отрицательного контроля , неспособность сообщить все данные, ненадлежащее использование статистических тестов и использование реагентов, которые не были должным образом проверены. . [128]
QRP не включает более явные нарушения научной честности, такие как фальсификация данных. [124] [125] Мошеннические исследования действительно имеют место, как в случае с научным мошенничеством социального психолога Дидерика Стапеля . [129] [13] когнитивный психолог Марк Хаузер и социальный психолог Лоуренс Санна, [13] но, похоже, это редкость. [13]
Распространенность
[ редактировать ]По словам профессора Международного университета Эрнеста О'Бойла и психолога Мартина Гетца, около 50% исследователей, опрошенных в ходе различных исследований, признались, что занимаются HARKing. [130] В опросе 2000 психологов, проведенном ученым-бихевиористом Лесли К. Джоном и его коллегами, около 94% психологов признались, что использовали хотя бы один QRP. В частности, 63% признались, что не сообщили обо всех зависимых показателях исследования, 28% сообщили обо всех условиях исследования и 46% выборочно сообщили об исследованиях, которые дали желаемую картину результатов. Кроме того, 56% признались, что собрали больше данных после проверки уже собранных данных, а 16% — что прекратили сбор данных, поскольку желаемый результат уже был виден. [39] По оценкам исследователя биотехнологий Дж. Лесли Глика в 1992 году, от 10% до 20% исследований и разработок включали либо QRP, либо откровенное мошенничество. [131] Методология, используемая для оценки QRP, оспаривается, и более поздние исследования показали, что в среднем уровень распространенности ниже. [132]
Метаанализ 2009 года показал, что 2% ученых в разных областях хотя бы один раз признались в фальсификации исследований, а 14% признались, что знали кого-то, кто это сделал. Согласно одному исследованию, о таких нарушениях чаще сообщали медицинские исследователи, чем другие. [133]
Статистические вопросы
[ редактировать ]Низкая статистическая мощность
[ редактировать ]По мнению профессора Университета Дикина Тома Стэнли и его коллег, одной из вероятных причин, по которой исследования не воспроизводятся, является низкая статистическая мощность . Это происходит по трем причинам. Во-первых, повторное исследование с низкой мощностью вряд ли будет успешным, поскольку по определению оно имеет низкую вероятность обнаружить истинный эффект. Во-вторых, если исходное исследование имеет низкую мощность, оно даст необъективные оценки размера эффекта . При проведении априорного анализа мощности для исследования репликации это приведет к недооценке необходимого размера выборки. В-третьих, если исходное исследование имеет низкую мощность, вероятность того, что после исследования будет получен статистически значимый результат, отражающий истинный эффект, довольно низка. Поэтому вполне вероятно, что попытка повторить оригинальное исследование потерпит неудачу. [14]
Математически вероятность повторения предыдущей публикации, отвергающей нулевую гипотезу. в пользу альтернативы является предполагая, что значимость меньше мощности. Таким образом, низкая мощность подразумевает низкую вероятность повторения, независимо от того, как была разработана предыдущая публикация, и независимо от того, какая гипотеза действительно верна. [77]
Стэнли и его коллеги оценили среднюю статистическую мощность психологической литературы, проанализировав данные 200 метаанализов . Они обнаружили, что в среднем статистические данные психологических исследований составляют от 33,1% до 36,4%. Эти значения довольно низкие по сравнению с 80%, которые считаются адекватной статистической мощностью для эксперимента. Среди 200 метаанализов медиана исследований с адекватной статистической мощностью составляла от 7,7% до 9,1%, что означает, что положительный результат будет воспроизводиться с вероятностью менее 10%, независимо от того, был ли положительный результат истинно положительным или ложным. позитивный. [14]
Статистическая мощность нейробиологических исследований довольно низка. Расчетная статистическая мощность исследования фМРТ составляет от 0,08 до 0,31. [134] а показатель исследований связанных с событиями потенциалов оценивался как 0,72–0,98 для больших размеров эффекта, 0,35–0,73 для средних эффектов и 0,10–0,18 для малых эффектов. [122]
В исследовании, опубликованном в журнале Nature , психолог Кэтрин Баттон и ее коллеги провели аналогичное исследование с 49 метаанализами в области нейробиологии, оценивая медианную статистическую мощность в 21%. [135] Метаученый Джон Иоаннидис и его коллеги рассчитали оценку средней мощности для эмпирических экономических исследований, определив медианную мощность 18% на основе литературы, основанной на 6700 исследованиях. [136] В свете этих результатов вполне вероятно, что основной причиной широко распространенных неудач в воспроизведении результатов в нескольких научных областях может быть очень низкая в среднем статистическая мощность.
Тот же статистический тест с тем же уровнем значимости будет иметь меньшую статистическую мощность, если размер эффекта невелик согласно альтернативной гипотезе. Сложные наследуемые признаки обычно коррелируют с большим количеством генов, каждый из которых имеет небольшой размер эффекта, поэтому высокая мощность требует большого размера выборки. В частности, многие результаты из литературы по генам-кандидатам страдали от небольшого размера эффекта и небольшого размера выборки и не могли быть воспроизведены. Дополнительные данные полногеномных ассоциативных исследований (GWAS) приближаются к решению этой проблемы. [137] [138] В качестве числового примера: большинство генов, связанных с риском шизофрении, имеют низкую величину эффекта (генотипический относительный риск, GRR). Статистическое исследование с 1000 случаями и 1000 контрольными группами имеет мощность 0,03% для гена с GRR = 1,15, что уже много для шизофрении. Напротив, самый крупный на сегодняшний день GWAS имеет мощность ~ 100%. [139]
Положительная ошибка размера эффекта
[ редактировать ]Даже когда исследование повторяется, повторение обычно имеет меньший размер эффекта. Исследования с недостаточной статистикой имеют большую погрешность в размере эффекта. [140]
В исследованиях, которые статистически оценивают фактор регрессии, такой как в , когда набор данных большой, шум имеет тенденцию вызывать недооценку коэффициента регрессии, но когда набор данных небольшой, шум имеет тенденцию вызывать переоценку коэффициента регрессии. [141]
Проблемы метаанализа
[ редактировать ]Метаанализ имеет свои методологические проблемы и споры, что приводит к неприятию метааналитического метода исследователями, чья теория подвергается сомнению со стороны метаанализа. [115]
Розенталь предложил «безотказный номер» (FSN). [53] во избежание предвзятости публикации в отношении нулевых результатов. Оно определяется следующим образом: Предположим, что нулевая гипотеза верна; сколько публикаций потребуется, чтобы сделать текущий результат неотличимым от нулевой гипотезы?
Точка зрения Розенталя заключается в том, что некоторые размеры эффекта достаточно велики, так что даже если существует полное предвзятое отношение публикации к нулевым результатам («проблема с ящиком для файлов»), количество неопубликованных нулевых результатов будет невозможно большим, чтобы заглушить размер эффекта. Таким образом, размер эффекта должен быть статистически значимым даже после учета неопубликованных нулевых результатов.
Одним из возражений против FSN является то, что он рассчитывается так, как будто неопубликованные результаты представляют собой несмещенные выборки из нулевой гипотезы. Но если проблема с файловым ящиком верна, то неопубликованные результаты будут иметь размеры эффекта, сосредоточенные вокруг 0. Таким образом, для замены размера эффекта потребуется меньше неопубликованных нулевых результатов, и поэтому FSN является завышенной оценкой. [115]
Другая проблема метаанализа заключается в том, что плохие исследования «заразительны» в том смысле, что одно плохое исследование может привести к переоценке статистической значимости всего метаанализа. [77]
П-хакерство
[ редактировать ]Можно применять различные статистические методы, чтобы значение p казалось меньшим, чем оно есть на самом деле. Это не обязательно должно быть злонамеренным, поскольку умеренно гибкий анализ данных, рутинный в исследованиях, может увеличить уровень ложноположительных результатов до уровня выше 60%. [40]
Например, если кто-то собирает некоторые данные, применяет к ним несколько разных тестов значимости и публикует только тот, значение p которого меньше 0,05, то общее значение p для «хотя бы одного теста значимости достигает p < 0,05" может быть намного больше, чем 0,05, потому что даже если бы нулевая гипотеза была верна, вероятность того, что один из многих тестов значимости является экстремальным, сама по себе не является экстремальной.
Как правило, статистическое исследование состоит из нескольких этапов, с несколькими вариантами выбора на каждом этапе, например, во время сбора данных, отбраковка выбросов, выбор статистики теста, выбор одностороннего или двустороннего критерия и т. д . разветвления «размножаются», создавая множество «исследовательских степеней свободы». Эффект аналогичен проблеме с ящиком файлов, поскольку непройденные пути не публикуются. [142]
Рассмотрим простую иллюстрацию. Предположим, что нулевая гипотеза верна, и у нас есть 20 возможных тестов значимости, которые можно применить к набору данных. Также предположим, что результаты тестов значимости независимы. По определению «значимости» каждый тест имеет вероятность прохождения 0,05 с уровнем значимости 0,05. Вероятность того, что хотя бы 1 из 20 является значимым, в предположении независимости равна . [143]
Другая возможность – проблема множественных сравнений . В 2009 году дважды было отмечено, что исследования фМРТ дали подозрительное количество положительных результатов с большой величиной эффекта, больше, чем можно было ожидать, поскольку исследования имеют низкую мощность (один пример). [144] было всего 13 предметов). Он отметил, что более половины исследований будут проверять корреляцию между явлением и отдельными вокселами фМРТ и сообщать только о вокселах, превышающих выбранные пороговые значения. [145]
Необязательная остановка — это практика, при которой данные собираются до тех пор, пока не будет достигнут некоторый критерий остановки. Несмотря на то, что это действительная процедура, ее легко использовать неправильно. Проблема в том, что значение p необязательно остановленного статистического теста больше, чем кажется. Интуитивно это происходит потому, что значение p должно быть суммой всех событий, по крайней мере столь же редких, как и те, которые наблюдаются. При необязательной остановке возникают еще более редкие события, которые трудно учесть, например, не срабатывает правило необязательной остановки и перед остановкой собирается еще больше данных. Игнорирование этих событий приводит к слишком низкому значению p. Фактически, если нулевая гипотеза верна, любой уровень значимости может быть достигнут, если разрешено продолжать сбор данных и остановиться, когда будет получено желаемое значение p (рассчитанное так, как если бы вы всегда планировали собрать именно такой объем данных). . [146] Конкретный пример проверки честной монеты см. в p -value#optional stoping .
Короче говоря, правильный расчет значения p требует учета контрфактов, то есть того, что экспериментатор мог бы сделать в ответ на данные, которые могли бы быть такими. Объяснить то, что могло бы быть, сложно даже честным исследователям. [146] Одним из преимуществ предварительной регистрации является учет всех несоответствий, что позволяет правильно рассчитать значение p. [147]
Проблема ранней остановки не ограничивается только неправомерными действиями исследователей. Часто возникает необходимость прекратить работу раньше, если стоимость сбора данных высока. Некоторые советы по этике животных даже требуют досрочного прекращения исследования, если в середине исследования получен значительный результат. [143]
Подобные практики широко распространены в психологии. В опросе 2012 года 56% психологов признались в раннем прекращении анализа, 46% в сообщении только о том анализе, который «сработал», и 38% в исключении post hoc , то есть удалении некоторых данных после того, как анализ данных уже был проведен. [39]
Статистическая неоднородность
[ редактировать ]Как также сообщили Стэнли и его коллеги, еще одной причиной, по которой исследования могут не воспроизвестися, является высокая гетерогенность эффектов, которые предстоит воспроизвести. В метаанализе «гетерогенность» относится к расхождениям в результатах исследований, возникающим в результате отсутствия единого истинного размера эффекта. Вместо этого результаты в таких случаях лучше рассматривать как распределение истинных эффектов. [14] Статистическая неоднородность рассчитывается с использованием статистики I-квадрат, [148] определяется как «доля (или процент) наблюдаемых различий между сообщаемыми размерами эффекта, которые не могут быть объяснены рассчитанными стандартными ошибками, связанными с этими сообщаемыми размерами эффекта». [14] Это изменение может быть связано с различиями в экспериментальных методах, популяциях, когортах и статистических методах между повторными исследованиями. Гетерогенность представляет собой проблему для исследований, пытающихся воспроизвести ранее обнаруженные размеры эффекта . Когда гетерогенность высока, последующие повторы имеют высокую вероятность обнаружить размер эффекта, радикально отличающийся от исходного исследования. [г]
Важно отметить, что значительные уровни гетерогенности также обнаруживаются при прямой/точной репликации исследования. Стэнли и его коллеги обсуждают это, сообщая об исследовании количественного поведенческого ученого Ричарда Кляйна и его коллег, в котором авторы попытались воспроизвести 15 психологических эффектов в 36 различных местах в Европе и США. из 16 эффектов (I-квадрат = от 23% до 91%). Важно отметить, что хотя сайты репликации намеренно различались по ряду характеристик, такие различия могли объяснить очень небольшую гетерогенность. По мнению Стэнли и его коллег, это предполагает, что гетерогенность могла быть подлинной характеристикой исследуемых явлений. Например, на явления могут влиять так называемые «скрытые модераторы» — соответствующие факторы, которые ранее не считались важными для производства определенного эффекта.
В своем анализе 200 метаанализов психологических эффектов Стэнли и его коллеги обнаружили, что средний процент гетерогенности I-квадрата = 74%. По мнению авторов, такой уровень неоднородности можно считать «огромным». Это в три раза больше, чем дисперсия величины эффекта случайной выборки, измеренная в их исследовании. Если рассматривать ошибку выборки , гетерогенность дает стандартное отклонение от одного исследования к другому, даже превышающее средний размер эффекта 200 метаанализов, которые они исследовали. [час] Авторы приходят к выводу, что если репликация определяется последующим исследованием, обнаружившим размер эффекта, достаточно похожий на исходный, успех репликации маловероятен, даже если репликации имеют очень большие размеры выборки. Важно отметить, что это происходит, даже если репликации являются прямыми или точными, поскольку гетерогенность, тем не менее, в этих случаях остается относительно высокой.
Другие
[ редактировать ]В экономике кризис репликации также может усугубиться из-за хрупкости эконометрических результатов: [149] использование различных, но приемлемых процедур оценки или методов предварительной обработки данных может привести к противоречивым результатам. [150] [151] [152]
Контекстная чувствительность
[ редактировать ]Профессор Нью-Йоркского университета Джей Ван Бавел и его коллеги утверждают, что еще одна причина, по которой результаты трудно воспроизвести, — это чувствительность к контексту определенных психологических эффектов. С этой точки зрения, неудачи при воспроизведении могут быть объяснены контекстуальными различиями между исходным экспериментом и репликацией, часто называемыми «скрытыми модераторами ». [153] Ван Бавел и его коллеги проверили влияние контекстной чувствительности, повторно проанализировав данные широко цитируемого проекта воспроизводимости, реализованного Open Science Collaboration. [11] Они перекодировали эффекты в соответствии с их чувствительностью к контекстуальным факторам, а затем проверили взаимосвязь между контекстной чувствительностью и успехом репликации в различных регрессионных моделях .
Было обнаружено, что чувствительность к контексту отрицательно коррелирует с успехом репликации, так что более высокие оценки чувствительности к контексту были связаны с более низкой вероятностью воспроизведения эффекта. [я] Важно отметить, что чувствительность к контексту значительно коррелировала с успехом репликации даже с поправкой на другие факторы, считающиеся важными для воспроизведения результатов (например, размер эффекта и размер выборки оригинала, статистическая мощность репликации, методологическое сходство между оригиналом и репликацией). [Дж] В свете результатов авторы пришли к выводу, что попытка репликации в другое время, в другом месте или с другим образцом может существенно изменить результаты эксперимента. Таким образом, чувствительность к контексту может быть причиной того, что некоторые эффекты не воспроизводятся в психологии. [153]
Байесовское объяснение
[ редактировать ]В рамках байесовской вероятности, по теореме Байеса , отклонение нулевой гипотезы на уровне значимости 5% не означает, что апостериорная вероятность альтернативной гипотезы равна 95%, а апостериорная вероятность также отличается от вероятности репликации. [154] [155] Рассмотрим упрощенный случай, когда имеется только две гипотезы. Пусть априорная вероятность нулевой гипотезы равна и альтернатива . Для данного статистического исследования пусть уровень ложноположительных результатов (уровень значимости) будет равен , а истинно положительная скорость (степень) будет . Для наглядности пусть уровень значимости будет 0,05, а мощность — 0,45 (недостаточная мощность).
Теперь, по теореме Байеса, при условии статистического исследования, полученного верно, апостериорная вероятность на самом деле быть правдой - это не , но
и вероятность повторения статистического исследования равна который также отличается от . В частности, для фиксированного уровня значимости вероятность репликации увеличивается с увеличением мощности, а априорная вероятность для . Если априорная вероятность мала, то для репликации потребуется большая мощность.
Например, если априорная вероятность нулевой гипотезы равна , и исследование дало положительный результат, то апостериорная вероятность для является , а вероятность репликации равна .
Проблема с проверкой нулевой гипотезы
[ редактировать ]Некоторые утверждают, что проверка нулевых гипотез сама по себе неуместна, особенно в «мягких науках», таких как социальная психология. [156] [157]
Как неоднократно отмечали статистики, [158] в сложных системах, таких как социальная психология, «нулевая гипотеза всегда ложна» или «все коррелирует». Если да, то если нулевая гипотеза не отвергается, это не означает, что нулевая гипотеза верна, а просто означает, что она была ложноотрицательной, обычно из-за низкой мощности. [159] Низкая мощность особенно распространена в предметных областях, где размеры эффекта невелики, а получение данных дорого, например, в социальной психологии. [156] [160]
Более того, когда нулевая гипотеза отвергается, это может не служить доказательством существенной альтернативной гипотезы. В мягких науках многие гипотезы могут предсказать корреляцию между двумя переменными. Таким образом, доказательства против нулевой гипотезы «нет корреляции» не являются доказательствами в пользу одной из многих альтернативных гипотез, которые одинаково хорошо предсказывают «существует корреляция». Фишер разработал NHST для агрономии, где отказ от нулевой гипотезы обычно является хорошим доказательством альтернативной гипотезы, поскольку их не так много. Отрицание гипотезы «удобрения не помогают» является доказательством «удобрения помогают». Но в психологии на каждую нулевую гипотезу существует множество альтернативных гипотез. [160] [161]
В частности, когда статистические исследования экстрасенсорного восприятия отвергают нулевую гипотезу при чрезвычайно низком значении p, это не подразумевает альтернативную гипотезу «существование экстрасенсорного восприятия». Гораздо более вероятно, что в экспериментальной установке присутствовал небольшой (не экстрасенсорный) сигнал, который точно измерялся. [162]
Пол Мил отметил, что проверка статистических гипотез в «мягкой» психологии (личностной, социальной и т. д.) используется иначе, чем в физике. В физике теория делает количественные предсказания и проверяется путем проверки того, попадает ли предсказание в статистически измеренный интервал. В мягкой психологии теория делает направленное предсказание и проверяется путем проверки того, отклонена ли нулевая гипотеза в правильном направлении. Следовательно, улучшенная экспериментальная техника повышает вероятность фальсификации теорий в физике, но снижает вероятность фальсификации в мягкой психологии, поскольку нулевая гипотеза всегда ложна, поскольку любые две переменные коррелируют с «грубым коэффициентом» около 0,30. Конечным эффектом является накопление теорий со слабыми доказательствами ни для одной из них. [22] [161]
Ошибка базовой ставки
[ редактировать ]По мнению философа Александра Берда , возможная причина низких показателей воспроизводимости в некоторых научных областях заключается в том, что большинство проверенных гипотез априори ложны . [163] С этой точки зрения, низкие показатели воспроизводимости могут соответствовать качеству науки. Кроме того, ожидание того, что большинство результатов должны быть воспроизведены, было бы ошибочным и, по мнению Бёрда, является формой ошибки базовой ставки. Аргумент Берда работает следующим образом. Предполагая идеальную ситуацию теста значимости, при которой вероятность неправильного отклонения нулевой гипотезы составляет 5% (т.е. ошибка типа I ), а вероятность правильного отклонения нулевой гипотезы составляет 80% (т.е. мощность ), в контексте, где высокая доля проверенных гипотез оказывается ложной, вполне возможно, что количество ложноположительных результатов будет выше, чем истинно положительных. [163] Например, в ситуации, когда только 10% проверенных гипотез на самом деле верны, можно подсчитать, что до 36% результатов будут ложноположительными. [к]
Утверждение о том, что ложность большинства проверенных гипотез может объяснить низкие показатели воспроизводимости, становится еще более актуальным, если учесть, что средняя мощность статистических тестов в определенных областях может быть намного ниже 80%. Например, доля ложноположительных результатов увеличивается до значения от 55,2% до 57,6% при расчете с оценками средней мощности от 34,1% до 36,4% для психологических исследований, как это предоставили Стэнли и его коллеги в своем анализе 200 мета-положительных результатов. анализы в полевых условиях. [14] Высокая доля ложноположительных результатов приведет к тому, что многие результаты исследований станут невоспроизводимыми.
Бёрд отмечает, что утверждение о том, что большинство проверенных гипотез априори ложны в определенных научных областях, может быть правдоподобным, учитывая такие факторы, как сложность исследуемых явлений, тот факт, что теории редко являются бесспорными, «дистанция вывода» между теориями и гипотезы и легкость, с которой можно генерировать гипотезы. В этом отношении Берд приводит в качестве примера клиническую медицину, генетическую и молекулярную эпидемиологию и социальную психологию. Эта ситуация радикально отличается в областях, где теории имеют выдающуюся эмпирическую основу и гипотезы могут быть легко выведены из теорий (например, экспериментальная физика). [163]
Последствия
[ редактировать ]Когда в литературе эффекты ошибочно указываются как релевантные, неспособность обнаружить это путем репликации приведет к канонизации таких ложных фактов. [164]
Исследование 2021 года показало, что статьи в ведущих журналах по общей тематике, психологии и экономике с выводами, которые невозможно воспроизвести, с течением времени имеют тенденцию цитироваться чаще, чем воспроизводимые исследовательские статьи, вероятно, потому, что эти результаты неожиданны или интересны. На эту тенденцию не влияет публикация неудачных репродукций, после чего только 12% статей, цитирующих оригинальные исследования, будут упоминать о неудачных репликациях. [165] [166] Кроме того, эксперты могут предсказать, какие исследования будут воспроизводиться, что привело авторов исследования 2021 года Марты Серра-Гарсия и Ури Гнизи к выводу, что эксперты применяют более низкие стандарты к интересным результатам при принятии решения о их публикации. [166]
Осведомленность и восприятие общественности
[ редактировать ]В научном сообществе были выражены опасения, что широкая общественность может считать науку менее заслуживающей доверия из-за неудачных попыток повторения. [167] Исследования, подтверждающие эту обеспокоенность, редки, но общенациональное репрезентативное исследование в Германии показало, что более 75% немцев не слышали о неудачах в науке. [168] Исследование также показало, что большинство немцев положительно воспринимают усилия по тиражированию: только 18% считают, что отсутствие тиражирования показывает, что науке нельзя доверять, в то время как 65% считают, что исследования тиражирования показывают, что наука применяет контроль качества, и 80% согласны с тем, что ошибки и исправления являются частью науки. [168]
Ответ в академических кругах
[ редактировать ]В связи с тем, что кризис репликации психологии привлек внимание, психолог из Принстонского университета Сьюзен Фиск вызвала споры за то, что выступила против критиков психологии за то, что она назвала издевательствами и подрывом науки. [169] [170] [171] [172] Она назвала этих неопознанных «противников» такими именами, как «методологический террорист» и «самопровозглашенная полиция данных», заявив, что критику психологии следует высказывать только в частном порядке или путем обращения в журналы. [169] Статистик и политолог Колумбийского университета Эндрю Гельман ответил Фиске, заявив, что она обнаружила, что готова терпеть «мертвую парадигму» ошибочной статистики и отказывалась отозвать публикации, даже когда были указаны ошибки. [169] Он добавил, что ее пребывание на посту редактора было ужасным и что ряд опубликованных статей, которые она редактировала, были основаны на крайне слабых статистических данных; одна из опубликованных самим Фиске статей содержала серьезную статистическую ошибку и «невозможные» выводы. [169]
Революция доверия
[ редактировать ]Некоторые исследователи в области психологии указывают, что кризис репликации является основой для «революции доверия», когда изменения в стандартах, по которым оценивается психологическая наука, могут включать в себя акцент на прозрачности и открытости, предварительную регистрацию исследовательских проектов и тиражирование исследований с более высокими стандартами для улучшения доказательств. Сила научных утверждений. [173] Такие изменения могут снизить продуктивность отдельных исследователей, но этого эффекта можно избежать путем обмена данными и более тесного сотрудничества. [173] Революция доверия может быть полезна для исследовательской среды. [174]
Средства правовой защиты
[ редактировать ]Сосредоточение внимания на кризисе репликации привело к возобновлению усилий в психологии по повторной проверке важных результатов. [40] [175] Специальный выпуск журнала «Социальная психология» за 2013 год был посвящен исследованиям репликации. [12]
стандартизация, а также (требование) прозрачности используемых статистических и экспериментальных методов. Предложены [176] Тщательное документирование экспериментальной установки считается решающим для воспроизводимости экспериментов, и различные переменные не могут быть документированы и стандартизированы, например, рационы животных в исследованиях на животных. [177]
В статье Джона Иоаннидиса 2016 года подробно обсуждалась тема «Почему большинство клинических исследований бесполезны». [178] Иоаннидис описывает то, что он считает некоторыми проблемами, и призывает к реформе, характеризуя определенные моменты, позволяющие медицинским исследованиям снова стать полезными; Одним из примеров, который он приводит, является необходимость того, чтобы медицина была ориентирована на пациента (например, в форме Института исследования результатов, ориентированных на пациента ), а не в нынешней практике, которая в основном заботится о «потребностях врачей, исследователей или спонсоров».
Реформа научных публикаций
[ редактировать ]Метанаука
[ редактировать ]Метанаука — это использование научной методологии для изучения самой науки. Он стремится повысить качество научных исследований при одновременном сокращении отходов. Он также известен как «исследовательские исследования» и «наука о науке», поскольку он использует методы исследования для изучения того, как исследования проводятся и где можно внести улучшения. Метанаука касается всех областей исследований, и ее называют «взглядом на науку с высоты птичьего полета». [179] По словам Иоаннидиса: «Наука – это лучшее, что случилось с людьми… но мы можем сделать это лучше». [180]
Мета-исследования продолжают проводиться для выявления причин кризиса и их устранения. Методы преодоления кризиса включают предварительную регистрацию научных исследований и клинических испытаний , а также создание таких организаций, как CONSORT и EQUATOR Network , которые выпускают рекомендации по методологии и отчетности. Продолжаются усилия по реформированию системы академического стимулирования, совершенствованию процесса рецензирования , сокращению злоупотреблений статистикой , борьбе с предвзятостью в научной литературе, а также повышению общего качества и эффективности научного процесса.
Презентация методологии
[ редактировать ]Некоторые авторы утверждают, что недостаточное информирование об экспериментальных методах является основной причиной кризиса воспроизводимости и что лучшее сообщение о планировании эксперимента и статистическом анализе могло бы улучшить ситуацию. Эти авторы склонны выступать за широкие культурные изменения в научном сообществе в том, как рассматривать статистику, и за более принудительное давление со стороны научных журналов и финансирующих организаций. [181] Но были высказаны опасения по поводу возможности неправильного применения стандартов прозрачности и тиражирования как к качественным, так и к количественным исследованиям. [182]
К журналам о бизнесе и менеджменте, которые ввели редакционную политику в отношении доступности, репликации и прозрачности данных, относятся журнал «Стратегический менеджмент» , «Журнал международных бизнес-исследований » и « Обзор менеджмента и организации» . [91]
Экспертная оценка без учета результатов
[ редактировать ]В ответ на обеспокоенность психологов по поводу предвзятости публикаций и сбора данных более 140 психологических журналов приняли рецензирование без учета результатов. При таком подходе исследования принимаются не на основе их результатов и после завершения исследований, а до их проведения, а также на основе методологической строгости их экспериментальных планов и теоретического обоснования методов статистического анализа до того, как данные будут получены. проводится сбор или анализ. [183] Ранний анализ этой процедуры показал, что 61% слепых исследований привели к нулевым результатам , в отличие от примерно 5–20% в более ранних исследованиях. [99] Кроме того, в психологии стало гораздо более распространенным явлением крупномасштабное сотрудничество между исследователями, работающими в нескольких лабораториях в разных странах и регулярно предоставляющими свои данные для оценки различным исследователям. [184]
Предварительная запись на обучение
[ редактировать ]Научные издания начали использовать отчеты предварительной регистрации, чтобы справиться с кризисом репликации. [185] [186] Формат зарегистрированного отчета требует, чтобы авторы предоставили описание методов исследования и анализа до сбора данных. После того как метод и план анализа проходят рецензирование, публикация результатов предварительно гарантируется в зависимости от того, соблюдают ли авторы предложенный протокол. Одна из целей зарегистрированных отчетов — избежать предвзятости публикаций в отношении важных выводов, которые могут привести к использованию сомнительных исследовательских практик. Другой вариант – поощрять публикацию исследований с использованием строгих методов.
Журнал Psychoological Science поощряет предварительную регистрацию исследований и сообщение о величине эффекта и доверительных интервалах. [187] Главный редактор также отметил, что перед публикацией рукописей редакция будет просить повторить исследования с неожиданными результатами с использованием небольших выборок.
Метаданные и цифровые инструменты для отслеживания репликаций
[ редактировать ]Было высказано предположение, что необходим «простой способ проверить, как часто исследования повторялись и подтверждаются ли первоначальные результаты». [165] Категоризация и рейтинг воспроизводимости на уровне исследования или результатов, а также добавление ссылок и рейтинг сторонних подтверждений могут проводиться рецензентами, научным журналом или читателями в сочетании с новыми цифровыми платформами или инструменты.
Статистическая реформа
[ редактировать ]Требование меньших p значений
[ редактировать ]Многие публикации требуют, чтобы p значение было статистической <0,05, чтобы заявить о значимости . Статья «Переопределить статистическую значимость», [188] подписанный большим количеством ученых и математиков, предлагает, чтобы «в областях, где порог для определения статистической значимости новых открытий составляет p < 0,05, мы предлагаем изменение до p < 0,005. Этот простой шаг немедленно улучшит воспроизводимость научных исследований». во многих областях». что «основная причина невоспроизводимости заключается в том, что статистические стандарты доказательности для заявлений о новых открытиях во многих областях науки просто слишком низки. Их обоснование заключается в том , ложных срабатываний даже при отсутствии других экспериментальных, процедурных проблем и проблем с отчетностью». [188]
Этот призыв впоследствии подвергся критике со стороны другой большой группы, которая утверждала, что «переопределение» пороговых значений не решит существующие проблемы, а приведет к появлению некоторых новых, и что, в конечном итоге, все пороговые значения необходимо обосновывать в каждом конкретном случае, а не следуя общим соглашениям. [189]
Решение проблемы неправильной интерпретации p -значений
[ редактировать ]Хотя статистики единодушны в том, что использование « p < 0,05» в качестве стандарта значимости дает более слабые доказательства, чем обычно принято считать, отсутствует единодушие в отношении того, что следует с этим делать. Некоторые выступают за то, чтобы байесовские методы заменили p -значения. Это не произошло в широком масштабе, отчасти потому, что это сложно, а отчасти потому, что многие пользователи не доверяют спецификациям предыдущих дистрибутивов в отсутствие точных данных. Упрощенную версию байесовского аргумента, основанную на проверке нулевой гипотезы точки, предложил фармаколог Дэвид Колкухун . [190] [191] Логические проблемы индуктивного вывода обсуждались в «Проблеме с p-значениями» (2016). [192]
Опасность зависимости от значений p возникает отчасти потому, что даже наблюдение p = 0,001 не обязательно является убедительным доказательством против нулевой гипотезы. [191] Несмотря на то, что отношение правдоподобия в пользу альтернативной гипотезы по сравнению с нулевой близко к 100, если бы гипотеза была неправдоподобной, а априорная вероятность реального эффекта была бы равна 0,1, даже наблюдение p = 0,001 имело бы ложноположительный результат. риск 8 процентов. Ему все равно не удастся достичь уровня 5 процентов.
Было рекомендовано не использовать термины «значительный» и «незначительный». [191] Значения p и доверительные интервалы по-прежнему должны быть указаны, но они должны сопровождаться указанием риска ложноположительного результата. Было высказано предположение, что лучший способ сделать это — вычислить априорную вероятность, в которую необходимо поверить, чтобы достичь ложноположительного риска определенного уровня, например 5%. Расчеты можно производить с помощью различных компьютерных программ. [191] [193] Этот обратный байесовский подход, предложенный физиком Робертом Мэтьюзом в 2001 году, [194] Это один из способов избежать проблемы, заключающейся в том, что априорная вероятность редко известна.
Поощрение увеличения размера выборки
[ редактировать ]Чтобы улучшить качество репликации, часто необходимы более крупные размеры выборки , чем те, которые использовались в исходном исследовании. [195] Необходимы большие размеры выборки, поскольку оценки размеров эффекта в опубликованных работах часто преувеличены из-за систематической ошибки публикации и большой вариативности выборки, связанной с небольшими размерами выборки в оригинальном исследовании. [196] [197] [198] Кроме того, использование порогов значимости обычно приводит к завышенным эффектам, поскольку, особенно при небольших размерах выборки, значимыми станут только самые большие эффекты. [157]
Перекрестная проверка
[ редактировать ]Одной из распространенных статистических проблем является переоснащение , то есть когда исследователи подгоняют модель регрессии по большому количеству переменных, но небольшому количеству точек данных. Например, в типичном фМРТ-исследовании эмоций, личности и социального познания участвуют менее 100 субъектов, но каждый субъект имеет 10 000 вокселей. Исследование соответствует разреженной модели линейной регрессии, которая использует вокселы для прогнозирования интересующей переменной, такой как самооценка стресса. Но тогда исследование сообщит о p-значении модели на тех же данных, к которым она была адаптирована. Стандартный подход в статистике, при котором данные разделяются на обучающий и проверочный наборы , вызывает сопротивление, поскольку приобретение испытуемых дорого. [145] [199]
Одним из возможных решений является перекрестная проверка , которая позволяет проверять модель, а также позволяет использовать весь набор данных для подбора модели. [200]
Усилия по репликации
[ редактировать ]Финансирование
[ редактировать ]В июле 2016 года Нидерландская организация научных исследований выделила 3 миллиона евро на повторные исследования. Финансирование предназначено для тиражирования на основе повторного анализа существующих данных и тиражирования путем сбора и анализа новых данных. Финансирование доступно в области социальных наук, медицинских исследований и инноваций в области здравоохранения. [201]
В 2013 году Фонд Лоры и Джона Арнольдов профинансировал запуск Центра открытой науки , выделив грант в размере 5,25 миллиона долларов. К 2017 году он предоставил дополнительно 10 миллионов долларов финансирования. [202] Он также профинансировал открытие Инновационного центра метаисследований в Стэнфорде при Стэнфордском университете, которым руководят Иоаннидис и ученый-медик Стивен Гудман для изучения способов улучшения научных исследований. [202] Он также обеспечил финансирование инициативы AllTrials , частично возглавляемой ученым-медиком Беном Голдакром . [202]
Упор на послесреднее образование
[ редактировать ]На основании курсовой работы по экспериментальным методам в Массачусетском технологическом институте, Стэнфорде и Вашингтонском университете было высказано предположение, что курсы по психологии и другим областям должны делать упор на попытках воспроизведения, а не на оригинальных исследованиях. [203] [204] [205] Такой подход поможет студентам изучить научную методологию и обеспечить многочисленные независимые повторы значимых научных результатов, которые проверят воспроизводимость научных результатов. Некоторые рекомендовали обязать аспирантов опубликовать попытку высококачественного воспроизведения темы, связанной с их докторским исследованием, до окончания учебы. [206]
Диссертация за последний год
[ редактировать ]Некоторые учебные заведения требуют, чтобы студенты бакалавриата представили дипломную работу за последний год, состоящую из оригинального исследования. Дэниел Кинтана, психолог из Университета Осло в Норвегии, рекомендовал поощрять студентов к повторным исследованиям в дипломных проектах, а также обучать их открытой науке . [207]
Полуавтоматический
[ редактировать ]Исследователи продемонстрировали способ полуавтоматического тестирования на воспроизводимость: утверждения об экспериментальных результатах были извлечены, начиная с 2022 года, из несемантических статей по исследованию экспрессии генов рака и впоследствии воспроизведены с помощью робота-ученого « Ева ». [208] [209] Проблемы этого подхода заключаются в том, что он может быть неприменим для многих областей исследований и что достаточные экспериментальные данные не могут быть извлечены из некоторых или многих статей, даже если они доступны.
Привлечение оригинальных авторов
[ редактировать ]Психолог Дэниел Канеман утверждал, что в психологии к повторению следует привлекать первоначальных авторов, поскольку опубликованные методы часто слишком расплывчаты. [210] [211] Другие, такие как психолог Эндрю Уилсон, не согласны с этим, утверждая, что первоначальные авторы должны подробно описать методы. [210] Исследование скорости репликации в психологии в 2012 году показало более высокие показатели успеха репликации в исследованиях репликации, когда авторы пересекались с первоначальными авторами исследования. [212] (91,7% успешных показателей повторения в исследованиях с дублированием авторов по сравнению с 64,6% успешных показателей повторения без совпадения авторов).
Большая командная наука
[ редактировать ]Кризис репликации привел к формированию и развитию различных крупномасштабных и совместных сообществ, объединяющих свои ресурсы для решения одного вопроса в разных культурах, странах и дисциплинах. [213] Основное внимание уделяется репликации, чтобы гарантировать, что эффект распространяется за пределы конкретной культуры, и выяснить, является ли этот эффект воспроизводимым и подлинным. [214] Это позволяет проводить междисциплинарные внутренние проверки, использовать различные точки зрения, использовать единые протоколы во всех лабораториях и набирать более крупные и разнообразные образцы. [214] Исследователи могут сотрудничать, координируя сбор данных или финансируя сбор данных исследователями, которые могут не иметь доступа к фондам, что позволяет увеличить размер выборки и повысить надежность выводов.
Более широкие изменения в научном подходе
[ редактировать ]Уделяйте особое внимание триангуляции, а не просто репликации
[ редактировать ]Психолог Маркус Р. Мунафо и эпидемиолог Джордж Дэйви Смит в статье, опубликованной в журнале Nature , утверждают, что исследования должны делать акцент на триангуляции , а не только на репликации, чтобы защититься от ошибочных идей. Они утверждают, что
одна только репликация приведет нас лишь к определенному результату (и) на самом деле может усугубить ситуацию ... [Триангуляция] - это стратегическое использование нескольких подходов для решения одного вопроса. Каждый подход имеет свои собственные несвязанные предположения, сильные и слабые стороны. Результаты, согласующиеся при использовании различных методологий, с меньшей вероятностью будут артефактами . ... Возможно, одной из причин, по которой копирование вызвало такой большой интерес, является часто повторяемая идея о том, что фальсификация лежит в основе научной деятельности. Эта идея была популяризирована максимой Карла Поппера 1950-х годов о том, что теории невозможно доказать, а только фальсифицировать. Тем не менее, чрезмерный акцент на повторении экспериментов может создать необоснованное чувство уверенности в результатах, основанных на одном подходе. ... философы науки пошли дальше со времен Поппера. Лучшие описания того, как на самом деле работают ученые, включают то, что эпистемолог Питер Липтон в 1991 году назвал «выводом к лучшему объяснению». [215]
Парадигма сложных систем
[ редактировать ]Доминирующей научной и статистической моделью причинно-следственной связи является линейная модель. [216] Линейная модель предполагает, что ментальные переменные — это стабильные свойства, независимые друг от друга. Другими словами, ожидается, что эти переменные не будут влиять друг на друга. Вместо этого модель предполагает, что переменные будут иметь независимое линейное влияние на наблюдаемые результаты. [216]
Социологи Себастьян Уоллот и Дамиан Келти-Стивен утверждают, что линейная модель не всегда подходит. [216] Альтернативой является модель сложной системы, которая предполагает, что ментальные переменные взаимозависимы. Эти переменные не считаются стабильными, скорее, они будут взаимодействовать и адаптироваться к каждому конкретному контексту. [216] Они утверждают, что модель сложной системы часто более уместна в психологии и что использование линейной модели, когда модель сложной системы более уместна, приведет к неудачному повторению. [216]
...психология, возможно, надеется на повторение в тех самых измерениях и в тех самых условиях, когда растущее количество психологических данных явно препятствует прогнозированию повторения. Неспособность воспроизвести может быть явно связана с потенциально неполной, но широкомасштабной неспособностью человеческого поведения соответствовать стандарту независимости... [216]
Репликация должна быть направлена на пересмотр теорий
[ редактировать ]Воспроизведение имеет основополагающее значение для научного прогресса и позволяет подтвердить оригинальные результаты. Однако одной лишь репликации недостаточно для разрешения кризиса репликации. Усилия по воспроизведению должны быть направлены не только на поддержку или сомнение в первоначальных результатах, но и на замену их пересмотренными, более сильными теориями с большей объяснительной силой. Таким образом, этот подход предполагает сокращение существующих теорий, сравнение всех альтернативных теорий и придание усилиям по воспроизведению более продуктивного характера и вовлечению в построение теорий. [217] [218] Однако одного лишь повторения недостаточно. Важно оценить степень обобщения результатов в географических, исторических и социальных контекстах. Это важно для нескольких научных областей, особенно для практиков и политиков, чтобы проводить анализ для принятия важных стратегических решений. Воспроизводимые и воспроизводимые результаты были лучшим предиктором возможности обобщения за пределами исторического и географического контекста, указывая на то, что для социальных наук результаты, полученные в определенный период времени и в определенном месте, могут существенно влиять на то, что универсально присутствует у людей. [219]
Открытая наука
[ редактировать ]Открытые данные, программное обеспечение с открытым исходным кодом и аппаратное обеспечение с открытым исходным кодом имеют решающее значение для обеспечения воспроизводимости в смысле проверки исходного анализа данных. Использование проприетарного программного обеспечения, отсутствие публикации аналитического программного обеспечения и отсутствие открытых данных препятствуют тиражированию исследований. Если программное обеспечение, используемое в исследованиях, не является открытым исходным кодом, воспроизведение результатов с использованием различных конфигураций программного и аппаратного обеспечения невозможно. [220] В ЦЕРН есть проекты «Открытые данные» и «Сохранение анализа ЦЕРН» для хранения данных, всей соответствующей информации, а также всего программного обеспечения и инструментов, необходимых для сохранения анализа в ходе крупных экспериментов БАК . Помимо всего программного обеспечения и данных, сохраненные аналитические активы включают метаданные, которые позволяют понять рабочий процесс анализа, соответствующее программное обеспечение, систематические неопределенности, статистические процедуры и значимые способы поиска анализа, а также ссылки на публикации и резервные материалы. [221] Программное обеспечение CERN имеет открытый исходный код и доступно для использования за пределами физики элементарных частиц , а для других областей предоставляются некоторые рекомендации по широким подходам и стратегиям, используемым для открытой науки в современной физике элементарных частиц. [222]
Онлайн-хранилища, в которых данные, протоколы и результаты могут храниться и оцениваться общественностью, стремятся улучшить целостность и воспроизводимость исследований. Примеры таких репозиториев включают Open Science Framework , Registry of Research Data Repositories и Psychfiledrawer.org. Такие сайты, как Open Science Framework, предлагают значки за использование практик открытой науки, чтобы стимулировать ученых. Однако существуют опасения, что те, кто, скорее всего, предоставят свои данные и код для анализа, являются наиболее опытными исследователями. [223] Иоаннидис предположил, что «может возникнуть парадокс: самые дотошные, изощренные, методически подкованные и осторожные исследователи могут стать более восприимчивыми к критике и атакам на репутацию со стороны реанализаторов, которые охотятся за ошибками, какими бы незначительными они ни были». [223]
См. также
[ редактировать ]- Ошибка базовой ставки
- Теория черного лебедя
- Корреляция не подразумевает причинно-следственную связь
- Извлечение данных
- Эффект снижения
- Статистика оценки
- Исследовательский анализ данных
- Пренебрежение расширением
- Фальсифицируемость
- Неверная наука
- Неправильное использование статистики
- Натурализм
- Предвзятость наблюдателя
- p-значение
- Проблема индукции
- Смещение выборки
- Предвзятость выбора
- Статистическая проверка гипотез
- Униформизм
Примечания
[ редактировать ]- ^ Также называется кризисом воспроизводимости , кризисом воспроизводимости , кризисом воспроизводства или кризисом невоспроизводимости .
- ^ Согласно Психологическому словарю APA , предвзятость подтверждения - это «тенденция собирать доказательства, подтверждающие ранее существовавшие ожидания, обычно путем подчеркивания или поиска подтверждающих доказательств, одновременно отклоняя или не ища противоречивые доказательства». [114]
- ^ В контексте проверки значимости нулевой гипотезы результаты, которые не являются статистически значимыми
- ^ Извлечение данных, также известное как p -хакинг или p -рыбалка , представляет собой неправильное использование данных с помощью множества методов для поиска поддержки гипотез, для которых данные недостаточны. [127]
- ^ Выборочная отчетность также известна как частичная публикация . Отчетность — это возможность раскрыть все использованные или эксплуатируемые степени свободы исследователя. Выборочная отчетность — это неспособность сообщить соответствующие детали или варианты выбора, такие как некоторые независимые и зависимые переменные, недостающие данные, исключения данных и исключения выбросов. [125]
- ^ HARKing, также известный как апостериорное повествование , - это когда исследовательский анализ оформляется как подтверждающий анализ. Он предполагает изменение гипотезы после проведения исследования, чтобы новая гипотеза могла быть подтверждена результатами эксперимента. [125]
- ^ Авторы приводят пример, в котором, предполагая, что истинная средняя корреляция, отражающая эффект, равна 0,2, а стандартное отклонение распределения эффектов также составляет 0,2, повторное исследование будет иметь 62% вероятность обнаружения истинного значения от среднего до большого. эффект (r > 0,3) или незначительный истинный эффект (r < 0,1).
- ^ 0,412 против 0,389 в единицах стандартизированных средних разностей (SMD).
- ^ Основным используемым DV был субъективный бинарный рейтинг (т. е. реплицированный/не реплицируемый), использованный в исходном исследовании OSC. Авторы также измерили корреляции с другими показателями воспроизводимости (например, доверительными интервалами) и обнаружили почти равные корреляции между контекстной чувствительностью и успехом репликации.
- ^ Независимый эффект контекстной чувствительности можно наблюдать как в множественной логистической регрессии, так и в модели иерархической регрессии. В последнем случае контекстная чувствительность была включена во вторую ступень иерархии и изменение коэффициента множественной детерминации оказалось значимым.
- ^ Следуя аргументу Берда, этот процент получается путем расчета вероятности ложноположительного отчета (FPRP) следующим образом.
- FPRP = Количество ложных срабатываний / Общее количество срабатываний
- Количество ложноположительных результатов = Вероятность получения ложноположительного результата x Количество отрицательных тестов.
- Количество истинно положительных результатов = Вероятность получения истинно положительного результата x Количество положительных тестов.
- Количество тестов = 1000
- Доля истинных гипотез p = 0,10
- Вероятность получения ложноположительного результата а = 0,05.
- Вероятность получения истинно положительного результата 1 – B = 0,8.
Ссылки
[ редактировать ]- ^ Jump up to: а б с Иоаннидис Дж. П. (август 2005 г.). «Почему большинство опубликованных результатов исследований являются ложными» . ПЛОС Медицина . 2 (8): е124. doi : 10.1371/journal.pmed.0020124 . ПМЦ 1182327 . ПМИД 16060722 .
- ^ Джон С. (8 декабря 2017 г.). Научный метод . Нью-Йорк, штат Нью-Йорк: Рутледж. дои : 10.4324/9781315100708 . ISBN 978-1-315-10070-8 . S2CID 201781341 .
- ^ Лерер Дж. (13 декабря 2010 г.). «Правда уходит» . Житель Нью-Йорка . Проверено 30 января 2020 г.
- ^ Маркус Дж. (1 мая 2013 г.). «Кризис социальной психологии, которого нет» . Житель Нью-Йорка . Проверено 30 января 2020 г.
- ^ Jump up to: а б с Бейкер М. (май 2016 г.). «1500 ученых приоткрывают крышку воспроизводимости» . Природа (новостной сюжет). 533 (7604). Спрингер Природа : 452–454. Бибкод : 2016Natur.533..452B . дои : 10.1038/533452а . ПМИД 27225100 . S2CID 4460617 . (Ошибка: [1] )
- ^ Пашлер Х., Харрис Ч.Р. (ноябрь 2012 г.). «Раздут ли кризис воспроизводимости? Рассмотрены три аргумента». Перспективы психологической науки . 7 (6): 531–536. дои : 10.1177/1745691612463401 . ПМИД 26168109 . S2CID 1342421 .
- ^ Фидлер Ф. , Уилкокс Дж. (2018). «Воспроизводимость научных результатов» . Стэнфордская энциклопедия философии . Лаборатория метафизических исследований Стэнфордского университета . Проверено 19 мая 2019 г.
- ^ Мунесингхе Р., Хури М.Дж., Янссенс AC (февраль 2007 г.). «Большинство опубликованных результатов исследований являются ложными, но небольшое повторение имеет большое значение» . ПЛОС Медицина . 4 (2): е28. doi : 10.1371/journal.pmed.0040028 . ПМК 1808082 . ПМИД 17326704 .
- ^ Саймонс DJ (январь 2014 г.). «Ценность прямой репликации». Перспективы психологической науки . 9 (1): 76–80. дои : 10.1177/1745691613514755 . ПМИД 26173243 . S2CID 1149441 .
- ^ Jump up to: а б с д Шмидт С (2009). «Действительно ли мы сделаем это снова? Мощная концепция репликации игнорируется в социальных науках». Обзор общей психологии . 13 (2). Публикации SAGE: 90–100. дои : 10.1037/a0015108 . ISSN 1089-2680 . S2CID 143855611 .
- ^ Jump up to: а б с Открытое научное сотрудничество (август 2015 г.). «ПСИХОЛОГИЯ. Оценка воспроизводимости психологической науки». Наука . 349 (6251): аас4716. дои : 10.1126/science.aac4716 . hdl : 10722/230596 . ПМИД 26315443 . S2CID 218065162 .
- ^ Jump up to: а б с Дювендак М., Палмер-Джонс Р., Рид Р.В. (май 2017 г.). «Что подразумевается под «репликацией» и почему она встречает сопротивление в экономике?» . Американский экономический обзор . 107 (5): 46–51. дои : 10.1257/aer.p20171031 . ISSN 0002-8282 .
- ^ Jump up to: а б с д и ж г Шраут П.Е., Роджерс Дж.Л. (январь 2018 г.). «Психология, наука и построение знаний: расширение перспектив благодаря кризису репликации». Ежегодный обзор психологии . 69 (1). Годовые обзоры: 487–510. doi : 10.1146/annurev-psych-122216-011845 . ПМИД 29300688 . S2CID 19593610 .
- ^ Jump up to: а б с д и ж Стэнли Т.Д., Картер Э.К., Дукульягос Х. (декабрь 2018 г.). «Что метаанализ показывает о воспроизводимости психологических исследований». Психологический вестник . 144 (12): 1325–1346. дои : 10.1037/bul0000169 . ПМИД 30321017 . S2CID 51951232 .
- ^ Мейер С., Шабри С. (31 июля 2014 г.). «Почему борьба психологов за еду имеет значение» . Сланец .
- ^ Ашванден С (19 августа 2015 г.). «Наука не сломана» . ПятьТридцатьВосемь . Проверено 30 января 2020 г.
- ^ Ашванден C (27 августа 2015 г.). «Психология начинает решать проблему репликации» . ПятьТридцатьВосемь . Проверено 30 января 2020 г.
- ^ Этчеллс П. (28 мая 2014 г.). «Психологический диск репликации: дело не в тебе» . Хранитель .
- ^ Вагенмейкерс Э.Дж., Ветцелс Р., Борсбум Д., ван дер Маас Х.Л., Киевит РА (ноябрь 2012 г.). «Программа чисто подтверждающих исследований». Перспективы психологической науки . 7 (6): 632–638. дои : 10.1177/1745691612463078 . ПМИД 26168122 . S2CID 5096417 .
- ^ Иоаннидис Дж. П. (ноябрь 2012 г.). «Почему наука не обязательно самокорректируется». Перспективы психологической науки . 7 (6): 645–654. дои : 10.1177/1745691612464056 . ПМИД 26168125 . S2CID 11798785 .
- ^ Пашлер Х., Харрис Ч.Р. (ноябрь 2012 г.). «Раздут ли кризис воспроизводимости? Рассмотрены три аргумента». Перспективы психологической науки . 7 (6): 531–536. дои : 10.1177/1745691612463401 . ПМИД 26168109 . S2CID 1342421 .
- ^ Jump up to: а б Мил П.Е. (1967). «Проверка теории в психологии и физике: методологический парадокс» . Философия науки . 34 (2): 103–115. дои : 10.1086/288135 . ISSN 0031-8248 . JSTOR 186099 . S2CID 96422880 .
- ^ Келли К., Проповедник К.Дж. (июнь 2012 г.). «О величине эффекта». Психологические методы . 17 (2): 137–152. дои : 10.1037/a0028086 . ПМИД 22545595 .
- ^ Симонсон У., Нельсон Л.Д., Симмонс Дж.П. (ноябрь 2014 г.). «Р-кривая и размер эффекта: коррекция систематической ошибки публикации с использованием только значимых результатов». Перспективы психологической науки . 9 (6): 666–681. дои : 10.1177/1745691614553988 . ПМИД 26186117 .
- ^ Симонсон У., Нельсон Л.Д., Симмонс Дж.П. (апрель 2014 г.). «П-кривая: ключ к ящику с файлами». Журнал экспериментальной психологии. Общий . 143 (2): 534–547. дои : 10.1037/a0033242 . ПМИД 23855496 .
- ^ Jump up to: а б с Ромеро Ф (ноябрь 2019 г.). «Философия науки и кризис воспроизводимости» . Философский компас . 14 (11). дои : 10.1111/phc3.12633 . ISSN 1747-9991 . S2CID 202261836 .
- ^ Барг Дж.А., Чен М., Берроуз Л. (август 1996 г.). «Автоматичность социального поведения: прямое влияние конструкции черт и активации стереотипов на действия». Журнал личности и социальной психологии . 71 (2): 230–244. дои : 10.1037/0022-3514.71.2.230 . ПМИД 8765481 . S2CID 6654763 .
- ^ Дойен С., Кляйн О., Пишон С.Л., Клиреманс А. (18 января 2012 г.). Лауверейнс Дж. (ред.). «Поведенческий прайминг: все дело в уме, но в чьем уме?» . ПЛОС ОДИН . 7 (1): e29081. Бибкод : 2012PLoSO...729081D . дои : 10.1371/journal.pone.0029081 . ПМЦ 3261136 . ПМИД 22279526 .
- ^ Ён Э (10 марта 2012 г.). «Неудачная репликация вызывает резкие личные нападки со стороны профессора психологии» . Нэшнл Географик . Архивировано из оригинала 25 февраля 2021 г. Проверено 4 июля 2023 г.
- ^ Пашлер Х., Коберн Н., Харрис Ч.Р. (29 августа 2012 г.). «Усиление социальной дистанции? Неспособность воспроизвести влияние на социальные и пищевые суждения» . ПЛОС ОДИН . 7 (8): е42510. Бибкод : 2012PLoSO...742510P . дои : 10.1371/journal.pone.0042510 . ПМЦ 3430642 . ПМИД 22952597 .
- ^ Харрис Ч.Р., Коберн Н., Рорер Д., Пашлер Х. (16 августа 2013 г.). «Две неудачи в воспроизведении эффектов прайминга для достижения высоких результатов» . ПЛОС ОДИН . 8 (8): е72467. Бибкод : 2013PLoSO...872467H . дои : 10.1371/journal.pone.0072467 . ПМЦ 3745413 . ПМИД 23977304 .
- ^ Шанкс Д.Р., Ньюэлл Б.Р., Ли Э.Х., Балакришнан Д., Экелунд Л., Сенак З. и др. (24 апреля 2013 г.). «Прайминг разумного поведения: неуловимый феномен» . ПЛОС ОДИН . 8 (4): е56515. Бибкод : 2013PLoSO...856515S . дои : 10.1371/journal.pone.0056515 . ПМЦ 3634790 . ПМИД 23637732 .
- ^ Кляйн Р.А., Рэтлифф К.А., Вианелло М., Адамс Р.Б., Бахник Ш., Бернштейн М.Дж. и др. (май 2014 г.). «Исследование изменений в воспроизводимости» . Социальная психология . 45 (3): 142–152. дои : 10.1027/1864-9335/a000178 . hdl : 2066/131506 . ISSN 1864-9335 .
- ^ Бем DJ (март 2011 г.). «Чувство будущего: экспериментальные доказательства аномального ретроактивного влияния на познание и аффект». Журнал личности и социальной психологии . 100 (3): 407–425. дои : 10.1037/a0021524 . ПМИД 21280961 . S2CID 1961013 .
- ^ Вагенмейкерс Э.Дж., Ветцелс Р., Борсбум Д., ван дер Маас Х.Л. (март 2011 г.). «Почему психологи должны изменить способ анализа своих данных: случай пси: комментарий Бема (2011)». Журнал личности и социальной психологии . 100 (3): 426–432. дои : 10.1037/a0022790 . ПМИД 21280965 .
- ^ Галак Дж., ЛеБёф Р.А., Нельсон Л.Д., Симмонс Дж.П. (декабрь 2012 г.). «Исправление прошлого: неудачи в воспроизведении ψ». Журнал личности и социальной психологии . 103 (6): 933–948. дои : 10.1037/a0029709 . ПМИД 22924750 .
- ^ Jump up to: а б Бегли К.Г., Эллис Л.М. (март 2012 г.). «Разработка лекарств: повысить стандарты доклинических исследований рака» . Природа (Комментарий к статье). 483 (7391): 531–533. Бибкод : 2012Natur.483..531B . дои : 10.1038/483531a . ПМИД 22460880 . S2CID 4326966 . (Ошибка: дои : 10.1038/485041e )
- ^ Иоаннидис Дж. П. (сентябрь 2008 г.). «Почему большинство обнаруженных истинных ассоциаций завышены» . Эпидемиология . 19 (5): 640–648. дои : 10.1097/EDE.0b013e31818131e7 . ПМИД 18633328 . S2CID 15440816 .
- ^ Jump up to: а б с д и ж Джон Л.К., Левенштейн Г. , Прелец Д. (май 2012 г.). «Измерение распространенности сомнительных исследовательских практик со стимулами для высказывания правды». Психологическая наука . 23 (5): 524–532. дои : 10.1177/0956797611430953 . ПМИД 22508865 . S2CID 8400625 .
- ^ Jump up to: а б с д и Симмонс Дж.П., Нельсон Л.Д., Симонсон Ю. (ноябрь 2011 г.). «Ложноположительная психология: нераскрытая гибкость в сборе и анализе данных позволяет представить все как значимое». Психологическая наука . 22 (11): 1359–1366. дои : 10.1177/0956797611417632 . ПМИД 22006061 . S2CID 13802986 .
- ^ Пашлер Х., Вагенмейкерс Э.Дж. (ноябрь 2012 г.). «Введение редактора в специальный раздел, посвященный воспроизводимости в психологической науке: кризис доверия?». Перспективы психологической науки . 7 (6): 528–530. дои : 10.1177/1745691612465253 . ПМИД 26168108 . S2CID 26361121 .
- ^ Альгрен А. (апрель 1969 г.). «Скромное предложение для поощрения тиражирования» . Американский психолог . 24 (4): 471. дои : 10.1037/h0037798 . ISSN 1935-990Х .
- ^ Смит, Северная Каролина (октябрь 1970 г.). «Исследования репликации: игнорируемый аспект психологических исследований» . Американский психолог . 25 (10): 970–975. дои : 10.1037/h0029774 . ISSN 1935-990Х .
- ^ Нойлип Дж.В., Крэндалл Р. (1993). «Предвзятость рецензента в отношении исследований по репликации» . Журнал социального поведения и личности . 8 (6): 21–29. ProQuest 1292304227 – через ProQuest.
- ^ Нойлип Дж.В., Крэндалл Р. (1990). «Редакционная предвзятость в отношении исследований по репликации» . Журнал социального поведения и личности . 5 (4): 85–90 – через ProQuest.
- ^ Льюис-Краус Дж. (30 сентября 2023 г.). «Они изучали нечестность. Была ли их работа ложью?» . Житель Нью-Йорка . ISSN 0028-792X . Проверено 1 октября 2023 г.
- ^ Суббараман Н. (24 сентября 2023 г.). «Группа разоблачителей, уничтожающая плохих учёных» . Уолл Стрит Джорнал . Архивировано из оригинала 24 сентября 2023 г. Проверено 8 октября 2023 г.
- ^ «АПА ПсихНет» . psycnet.apa.org . Проверено 8 октября 2023 г.
- ^ Jump up to: а б Спеллман BA (ноябрь 2015 г.). «Краткая (личная) будущая история революции 2.0» . Перспективы психологической науки . 10 (6): 886–899. дои : 10.1177/1745691615609918 . ПМИД 26581743 . S2CID 206778431 .
- ^ Jump up to: а б Гринвальд АГ, изд. (январь 1976 г.). «Редакционная статья» . Журнал личности и социальной психологии . 33 (1): 1–7. дои : 10.1037/h0078635 . ISSN 1939-1315 .
- ^ Стерлинг Т.Д. (1959). «Решения о публикации и их возможное влияние на выводы, сделанные на основе критериев значимости, или наоборот» . Журнал Американской статистической ассоциации . 54 (285): 30–34. дои : 10.2307/2282137 . ISSN 0162-1459 . JSTOR 2282137 .
- ^ Миллс Дж.Л. (октябрь 1993 г.). «Пытка данных». Медицинский журнал Новой Англии . 329 (16): 1196–1199. дои : 10.1056/NEJM199310143291613 . PMID 8166792 .
- ^ Jump up to: а б Розенталь Р. (май 1979 г.). «Проблема с файловым ящиком и допуск нулевых результатов» . Психологический вестник . 86 (3): 638–641. дои : 10.1037/0033-2909.86.3.638 . ISSN 1939-1455 . S2CID 36070395 .
- ^ Jump up to: а б Коэн Дж. (сентябрь 1962 г.). «Статистическая сила аномально-социальных психологических исследований: обзор». Журнал аномальной и социальной психологии . 65 : 145–153. дои : 10.1037/h0045186 . ПМИД 13880271 .
- ^ Седльмайер П., Гигеренцер Г. (март 1989 г.). «Влияют ли исследования статистической мощности на силу исследований?» . Психологический вестник . 105 (2): 309–316. дои : 10.1037/0033-2909.105.2.309 . hdl : 21.11116/0000-0000-B883-C . ISSN 1939-1455 .
- ^ Гельман А (21 сентября 2016 г.). «Здесь произошло то, что ветер изменился» . Статистическое моделирование, причинный вывод и социальные науки .
- ^ Ён Э (3 октября 2012 г.). «Нобелевский лауреат призывает психологов навести порядок в своих действиях» . Природа . дои : 10.1038/nature.2012.11535 . ISSN 1476-4687 .
- ^ Ванков И., Бауэрс Дж., Мунафо М.Р. (май 2014 г.). «О сохранении малой власти в психологической науке» . Ежеквартальный журнал экспериментальной психологии . 67 (5): 1037–1040. дои : 10.1080/17470218.2014.885986 . ПМЦ 4961230 . ПМИД 24528377 .
- ^ Jump up to: а б Смальдино П.Е., МакЭлрит Р. (сентябрь 2016 г.). «Естественный отбор плохой науки» . Королевское общество открытой науки . 3 (9): 160384. arXiv : 1605.09511 . Бибкод : 2016RSOS....360384S . дои : 10.1098/rsos.160384 . ПМК 5043322 . ПМИД 27703703 .
- ^ Ахенбах Дж. «Нет, проблема воспроизводимости науки не ограничивается психологией» . Вашингтон Пост . Проверено 10 сентября 2015 г.
- ^ Виггинс Б.Дж., Кристоферсон С. (2019). «Кризис репликации в психологии: Обзор теоретической и философской психологии» . Журнал теоретической и философской психологии . 39 (4): 202–217. дои : 10.1037/teo0000137 . ISSN 2151-3341 . S2CID 210567289 .
- ^ Хаггер М.С., Чацисарантис Н.Л., Альбертс Х., Ангоно К.О., Батайллер С., Бирт А.Р. и др. (июль 2016 г.). «Предварительно зарегистрированная в Multilab репликация эффекта истощения эго» . Перспективы психологической науки . 11 (4): 546–573. дои : 10.1177/1745691616652873 . hdl : 20.500.11937/16871 . ПМИД 27474142 .
- ^ Бартлетт Т. (30 января 2013 г.). «Сила внушения» . Хроника высшего образования .
- ^ Доминус С (18 октября 2017 г.). «Когда для Эми Кадди пришла революция» . Нью-Йорк Таймс . ISSN 0362-4331 . Проверено 19 октября 2017 г.
- ^ Дункан Л.Е., Келлер MC (октябрь 2011 г.). «Критический обзор первых 10 лет исследований взаимодействия генов и окружающей среды в психиатрии» . Американский журнал психиатрии . 168 (10): 1041–1049. дои : 10.1176/appi.ajp.2011.11020191 . ПМЦ 3222234 . ПМИД 21890791 .
- ^ Лейхсенринг Ф., Аббасс А. , Хилсенрот М.Дж., Левеке Ф., Луйтен П., Киф Дж.Р. и др. (апрель 2017 г.). «Предвзятость в исследованиях: факторы риска невоспроизводимости исследований в области психотерапии и фармакотерапии» . Психологическая медицина . 47 (6): 1000–1011. дои : 10.1017/S003329171600324X . ПМИД 27955715 . S2CID 1872762 .
- ^ Член парламента Хенгартнера (28 февраля 2018 г.). «Повышение осведомленности о кризисе репликации в клинической психологии путем сосредоточения внимания на противоречиях в исследованиях в области психотерапии: насколько мы можем полагаться на опубликованные результаты испытаний эффективности?» . Границы в психологии . 9 . Frontiers Media : 256. doi : 10.3389/fpsyg.2018.00256 . ПМЦ 5835722 . ПМИД 29541051 .
- ^ Фрэнк М.К. , Бергельсон Э., Бергманн С., Кристиа А., Флоксия С., Жервен Дж. и др. (9 марта 2017 г.). «Совместный подход к исследованиям младенцев: содействие воспроизводимости, передовой опыт и построение теории» . Младенчество . 22 (4): 421–435. дои : 10.1111/инфа.12182 . hdl : 10026.1/9942 . ПМК 6879177 . ПМИД 31772509 .
- ^ Харрис-младший (2009) [1998]. Предположение о воспитании: почему дети становятся такими, какими они есть (2-е изд.). Нью-Йорк: Свободная пресса . ISBN 978-1439101650 .
- ^ Харрис HR (2006). Нет двух одинаковых: человеческая природа и человеческая индивидуальность . Нью-Йорк: WW Norton & Company . ISBN 978-0393329711 .
- ^ Тайсон С (14 августа 2014 г.). «Неспособность воспроизвести» . Внутри высшего образования . Проверено 19 декабря 2018 г.
- ^ Макел М.К., Плукер Дж.А. (1 августа 2014 г.). «Факты важнее новизны: тиражирование в педагогических науках» . Исследователь образования . 43 (6): 304–316. дои : 10.3102/0013189X14545513 . S2CID 145571836 . Проверено 19 декабря 2018 г.
- ^ Киршнер П.А., Свеллер Дж. , Кларк Р.Э. (2006). «Почему минимальное руководство во время обучения не работает: анализ неудач конструктивистского, исследовательского, проблемного, экспериментального и исследовательского обучения» . Педагогический психолог . 41 (2). Рутледж : 75–86. дои : 10.1207/s15326985ep4102_1 . S2CID 17067829 .
- ^ Основы успеха: итоговый отчет Национальной консультативной группы по математике (PDF) (Отчет). Министерство образования США . 2008. стр. 45–46. Архивировано (PDF) из оригинала 18 января 2018 г. Проверено 3 ноября 2020 г.
- ^ Пашлер Х. , МакДэниел М. , Рорер Д., Бьорк Р. (декабрь 2008 г.). «Стили обучения: концепции и доказательства» . Психологическая наука в общественных интересах . 9 (3). Публикации SAGE : 105–119. дои : 10.1111/j.1539-6053.2009.01038.x . ПМИД 26162104 . S2CID 2112166 .
- ^ Носек Б.А., Кохун Дж., Кидвелл М.С., Спайс Дж.Р. (2018) [2015]. «Сводка показателей воспроизводимости и величины эффекта для оригинальных и повторных исследований в целом и по журналам/дисциплинам» . Оценка воспроизводимости психологической науки (таблица). Проект воспроизводимости: Психология . Проверено 16 октября 2019 г.
- ^ Jump up to: а б с Нельсон Л.Д., Симмонс Дж., Симонсон У. (январь 2018 г.). «Ренессанс психологии». Ежегодный обзор психологии . 69 (1): 511–534. doi : 10.1146/annurev-psych-122216-011836 . ПМИД 29068778 .
- ^ Роджер А. (27 августа 2018 г.). «Наука, лежащая в основе социальных наук, снова встряхивается» . Проводной . Проверено 28 августа 2018 г.
- ^ Камерер К.Ф. , Дребер А., Хольцмайстер Ф., Хо Т.Х., Хубер Дж., Йоханнессон М. и др. (сентябрь 2018 г.). «Оценка воспроизводимости социальных научных экспериментов в области природы и науки в период с 2010 по 2015 год» . Природа человеческого поведения . 2 (9): 637–644. дои : 10.1038/s41562-018-0399-z . ПМИД 31346273 . S2CID 52098703 .
- ^ Кляйн Р.А. (2018). «Множество лабораторий 2: исследование различий в воспроизводимости образцов и настроек» . Достижения в методах и практике психологической науки . 1 (4): 443–490. дои : 10.1177/2515245918810225 . hdl : 1854/LU-8637133 .
- ^ Jump up to: а б Витковский Т. (2019). «Стакан наполовину пуст или наполовину полон? Последние результаты кризиса репликации в психологии» (PDF) . Скептический исследователь . Том. 43, нет. 2. С. 5–6. Архивировано из оригинала (PDF) 30 января 2020 г.
- ^ Рихтель М. (16 марта 2022 г.). «Исследования изображений мозга затруднены из-за небольших наборов данных, результаты исследования» . Нью-Йорк Таймс .
- ^ Марек С., Терво-Клемменс Б., Калабро Ф.Дж., Монтес Д.Ф., Кей Б.П., Хатум А.С. и др. (март 2022 г.). «Для воспроизводимых исследований ассоциаций в масштабе всего мозга требуются тысячи людей» . Природа . 603 (7902): 654–660. Бибкод : 2022Natur.603..654M . дои : 10.1038/s41586-022-04492-9 . ПМК 8991999 . ПМИД 35296861 .
- ^ Иоаннидис Дж. П. (июль 2005 г.). «Противоречивые и изначально более сильные эффекты в широко цитируемых клинических исследованиях». ДЖАМА . 294 (2): 218–228. дои : 10.1001/jama.294.2.218 . ПМИД 16014596 . S2CID 16749356 .
- ^ Принц Ф., Шланге Т., Асадулла К. (август 2011 г.). «Хотите верьте, хотите нет: насколько мы можем полагаться на опубликованные данные о потенциальных мишенях для наркотиков?» . Обзоры природы. Открытие наркотиков . 10 (9): 712. дои : 10.1038/nrd3439-c1 . ПМИД 21892149 .
- ^ Уилинг К. (12 мая 2016 г.). «Большая фармацевтика обнаруживает кризис биомедицинской репликации» . Тихоокеанский стандарт . Проверено 30 января 2020 г. Обновлено 14 июня 2017 г.
- ^ Jump up to: а б Хаэлле Т (7 декабря 2021 г.). «Десятки крупных исследований рака невозможно повторить» . Новости науки . Проверено 19 января 2022 г.
- ^ Jump up to: а б «Проект воспроизводимости: биология рака» . www.cos.io. Центр открытой науки . Проверено 19 января 2022 г.
- ^ Мобли А., Линдер С.К., Бройер Р., Эллис Л.М., Цвеллинг Л. (2013). Аракава Х (ред.). «Опрос по воспроизводимости данных в исследованиях рака дает представление о наших ограниченных возможностях перенести результаты из лаборатории в клинику» . ПЛОС ОДИН . 8 (5): e63221. Бибкод : 2013PLoSO...863221M . дои : 10.1371/journal.pone.0063221 . ПМК 3655010 . ПМИД 23691000 .
- ^ Ван Ноорден Р. (июль 2023 г.). «Медицина страдает от ненадежных клинических испытаний. Сколько исследований фальсифицированы или ошибочны?» . Природа . 619 (7970): 454–458. Бибкод : 2023Natur.619..454V . дои : 10.1038/d41586-023-02299-w . ПМИД 37464079 .
- ^ Jump up to: а б с д Цуй А.С. (21 января 2022 г.). «От традиционных исследований к ответственным исследованиям: необходимость научной свободы и научной ответственности для лучшего общества» . Ежегодный обзор организационной психологии и организационного поведения . 9 (1): 1–32. doi : 10.1146/annurev-orgpsych-062021-021303 . ISSN 2327-0608 . S2CID 244238570 .
- ^ Камерер К.Ф., Дребер А., Форселл Э., Хо Т.Х., Хубер Дж., Йоханнессон М. и др. (март 2016 г.). «Оценка воспроизводимости лабораторных экспериментов в экономике» . Наука . 351 (6280): 1433–1436. Бибкод : 2016Sci...351.1433C . doi : 10.1126/science.aaf0918 . ПМИД 26940865 .
- ^ Боханнон Дж. (3 марта 2016 г.). «Около 40% экономических экспериментов проваливаются в ходе повторного исследования» . Наука . doi : 10.1126/science.aaf4141 . Проверено 25 октября 2017 г.
- ^ Гольдфарб РС (1 декабря 1997 г.). «Теперь вы это видите, а теперь нет: появление противоположных результатов в экономике». Журнал экономической методологии . 4 (2): 221–244. дои : 10.1080/13501789700000016 . ISSN 1350-178X .
- ^ Jump up to: а б Берг Д.Д., Шарп Б.М., Агинис Х., Ли М. (6 апреля 2017 г.). «Существует ли кризис доверия к исследованиям в области стратегического управления? Доказательства воспроизводимости результатов исследования» . Стратегическая организация . 15 (3): 423–436. дои : 10.1177/1476127017701076 . ISSN 1476-1270 . S2CID 44024633 .
- ^ Jump up to: а б Стэгге Дж.Х., Розенберг Д.Э., Абдалла А.М., Акбар Х., Атталла Н.А., Джеймс Р. (февраль 2019 г.). «Оценка доступности данных и воспроизводимости исследований в области гидрологии и водных ресурсов» . Научные данные . 6 : 190030. Бибкод : 2019NatSD...690030S . дои : 10.1038/sdata.2019.30 . ПМК 6390703 . ПМИД 30806638 .
- ^ Jump up to: а б Видео о природе (28 мая 2016 г.). «Существует ли кризис воспроизводимости в науке?» . Научный американец . Проверено 15 августа 2019 г.
- ^ Фанелли Д. (апрель 2010 г.). Скалас Э (ред.). « Положительные» результаты поднимаются вниз по Иерархии наук» . ПЛОС ОДИН . 5 (4): e10068. Бибкод : 2010PLoSO...510068F . дои : 10.1371/journal.pone.0010068 . ПМЦ 2850928 . ПМИД 20383332 .
- ^ Jump up to: а б Аллен С., Мелер Д.М. (май 2019 г.). «Проблемы, преимущества и советы открытой науки в начале карьеры и за ее пределами» . ПЛОС Биология . 17 (5). Публичная научная библиотека: e3000246. дои : 10.1371/journal.pbio.3000246 . ПМК 6513108 . ПМИД 31042704 .
- ^ «Новый кризис репликации: исследования, которые с меньшей вероятностью являются правдой, цитируются чаще» . Калифорнийский университет, Сан-Диего . 21 мая 2021 г. Архивировано из оригинала 13 апреля 2024 г.
- ^ Серра-Гарсия М., Гнизи У (май 2021 г.). «Нереплицируемые публикации цитируются чаще, чем тиражируемые» . Достижения науки . 7 (21). Бибкод : 2021SciA....7.1705S . дои : 10.1126/sciadv.abd1705 . ПМЦ 8139580 . ПМИД 34020944 .
- ^ Бегли К.Г., Иоаннидис Дж.П. (январь 2015 г.). «Воспроизводимость в науке: повышение стандарта фундаментальных и доклинических исследований» . Исследование кровообращения . 116 (1): 116–126. дои : 10.1161/CIRCRESAHA.114.303819 . ПМИД 25552691 . S2CID 3587510 .
- ^ Прайс-ди-джей (1963). Маленькая наука, большая наука . Издательство Колумбийского университета. п. 32. ISBN 9780231085625 .
- ^ Зиберт С., Мачески Л.М., Инсолл Р.Х. (сентябрь 2015 г.). «Переизбыток в науке и его последствия для доверия» . электронная жизнь . 4 : е10825. дои : 10.7554/eLife.10825 . ПМК 4563216 . ПМИД 26365552 .
- ^ Делла Бриотта Пароло П., Пан РК, Гош Р., Хуберман Б.А., Каски К., Фортунато С. (2015). «Распад внимания в науке». Журнал информаметрики . 9 (4): 734–745. arXiv : 1503.01881 . Бибкод : 2015arXiv150301881D . дои : 10.1016/j.joi.2015.07.006 . S2CID 10949754 .
- ^ Jump up to: а б Мировский П. (2011). Наука-Март . Издательство Гарвардского университета. стр. 2, 24. ISBN 978-0-674-06113-2 .
- ^ Мёллер Х.Г. (2006). Луман объяснил: от души к системам . Чикаго: Открытый суд. п. 25. ISBN 0-8126-9598-4 . ОСЛК 68694011 .
- ^ Луман Н (1995). Социальные системы . Стэнфорд, Калифорния: Издательство Стэнфордского университета. п. 288. ИСБН 978-0-8047-2625-2 . ОСЛК 31710315 .
- ^ Jump up to: а б Шойфеле ДА (сентябрь 2014 г.). «Научная коммуникация как политическая коммуникация» . Труды Национальной академии наук Соединенных Штатов Америки . 111 (Приложение 4): 13585–13592. Бибкод : 2014PNAS..111S3585S . дои : 10.1073/pnas.1317516111 . ПМЦ 4183176 . ПМИД 25225389 .
- ^ Пилке Р. (2007). Честный посредник: смысл науки в политике и политике . Кембридж: Издательство Кембриджского университета. дои : 10.1017/CBO9780511818110 . ISBN 978-0-511-81811-0 . OCLC 162145073 .
- ^ Мартин Г.Н., Кларк Р.М. (2017). «Являются ли психологические журналы антирепликацией? Снимок редакционной практики» . Границы в психологии . 8 : 523. дои : 10.3389/fpsyg.2017.00523 . ПМЦ 5387793 . ПМИД 28443044 .
- ^ Юнг А.В. (2017). «Принимают ли журналы по неврологии репликации? Обзор литературы» . Границы человеческой неврологии . 11 : 468. дои : 10.3389/fnhum.2017.00468 . ПМК 5611708 . ПМИД 28979201 .
- ^ Хаббард Р., Веттер Д.Е. (1 февраля 1996 г.). «Эмпирическое сравнение опубликованных повторных исследований в области бухгалтерского учета, экономики, финансов, менеджмента и маркетинга». Журнал бизнес-исследований . 35 (2): 153–164. дои : 10.1016/0148-2963(95)00084-4 . ISSN 0148-2963 .
- ^ «Предвзятость подтверждения» . Психологический словарь APA . Вашингтон, округ Колумбия: Американская психологическая ассоциация . нд . Проверено 2 февраля 2022 г.
- ^ Jump up to: а б с Фергюсон CJ, Хин М. (ноябрь 2012 г.). «Огромное кладбище теорий нежити: предвзятость публикаций и отвращение психологической науки к нулю». Перспективы психологической науки . 7 (6): 555–561. дои : 10.1177/1745691612459059 . ПМИД 26168112 .
- ^ Доминус С (18 октября 2017 г.). «Когда для Эми Кадди пришла революция» . Журнал Нью-Йорк Таймс .
- ^ Гарсиа-Берту Э., Алькарас С (май 2004 г.). «Несоответствие между статистикой испытаний и значениями P в медицинских статьях» . Методология медицинских исследований BMC . 4 (1): 13. дои : 10.1186/1471-2288-4-13 . ПМК 443510 . ПМИД 15169550 .
- ^ Ньювенхейс С., Форстманн Б.Ю., Вагенмейкерс Э.Дж. (август 2011 г.). «Ошибочный анализ взаимодействий в нейробиологии: проблема значимости». Природа Нейронауки . 14 (9): 1105–1107. дои : 10.1038/nn.2886 . ПМИД 21878926 .
- ^ Jump up to: а б Фанелли Д. (апрель 2010 г.). «Увеличивает ли давление с целью публикации предвзятость ученых? Эмпирическая поддержка со стороны данных США» . ПЛОС ОДИН . 5 (4): е10271. Бибкод : 2010PLoSO...510271F . дои : 10.1371/journal.pone.0010271 . ПМК 2858206 . ПМИД 20422014 .
- ^ Носек Б.А., Спайс-младший, Мотыль М. (ноябрь 2012 г.). «Научная утопия: II. Реструктуризация стимулов и практик для продвижения истины, а не публикации» . Перспективы психологической науки . 7 (6): 615–631. arXiv : 1205.4251 . дои : 10.1177/1745691612459058 . ПМЦ 10540222 . ПМИД 26168121 . S2CID 23602412 .
- ^ Эверетт Дж. А., Эрп Б. Д. (1 января 2015 г.). «Трагедия (академического) достояния: интерпретация кризиса репликации в психологии как социальной дилеммы для начинающих исследователей» . Границы в психологии . 6 : 1152. doi : 10.3389/fpsyg.2015.01152 . ПМК 4527093 . ПМИД 26300832 .
- ^ Jump up to: а б Клейсон П.Е., Карабин К.А., Болдуин С.А., Ларсон М.Дж. (ноябрь 2019 г.). «Методологическое отчетное поведение, размеры выборки и статистическая мощность в исследованиях потенциала, связанного с событиями: барьеры на пути воспроизводимости и воспроизводимости» . Психофизиология . 56 (11): e13437. дои : 10.1111/psyp.13437 . ПМИД 31322285 .
- ^ ЛеБел Е.П., Петерс К.Р. (декабрь 2011 г.). «Опасаясь будущего эмпирической психологии: свидетельства Бема (2011) о пси как примере недостатков в модальной исследовательской практике» . Обзор общей психологии . 15 (4): 371–379. дои : 10.1037/a0025172 . ISSN 1089-2680 .
- ^ Jump up to: а б с «Нарушение правил проведения исследований – серая зона сомнительных исследовательских практик» . www.vib.be. Флаамский институт биотехнологий . 30 сентября 2013 г. Архивировано из оригинала 31 октября 2014 г. Проверено 13 ноября 2015 г.
- ^ Jump up to: а б с д и ж г час Вихертс Дж.М. , Вельдкамп К.Л., Огюстейн Х.Э., Баккер М., ван Аэрт Р.К., ван Ассен М.А. (2016). «Степени свободы в планировании, проведении, анализе и составлении отчетов о психологических исследованиях: контрольный список, позволяющий избежать взлома » . Границы в психологии . 7 :1832.дои : 10.3389 / fpsyg.2016.01832 . ПМК 5122713 . ПМИД 27933012 .
- ^ Jump up to: а б с «Девять кругов научного ада» . Перспективы психологической науки (Мнение). 7 (6): 643–644. Ноябрь 2012 г. doi : 10.1177/1745691612459519 . ПМИД 26168124 . S2CID 45328962 .
- ^ «Извлечение данных» . Психологический словарь APA . Вашингтон, округ Колумбия: Американская психологическая ассоциация . нд . Проверено 9 января 2022 г.
Неуместная практика поиска в больших массивах информации в попытке подтвердить предвзятую гипотезу или убеждение без адекватного дизайна, исключающего возможные сбивающие с толку или альтернативные гипотезы. Извлечение данных может включать выбор частей большого набора данных, которые следует сохранить, чтобы получить конкретные желаемые результаты.
- ^ Бегли К.Г. (май 2013 г.). «Шесть красных флажков для подозрительной работы» . Природа (Комментарий к статье). 497 (7450): 433–434. Бибкод : 2013Natur.497..433B . дои : 10.1038/497433а . ПМИД 23698428 . S2CID 4312732 .
- ^ Ши С. (13 ноября 2011 г.). «Скандал о мошенничестве разжигает дебаты по поводу практики социальной психологии» . Хроника высшего образования .
- ^ О'Бойл Э.Х., Гетц М. (2022). «Сомнительные исследовательские практики». Честность исследований: лучшие практики социальных и поведенческих наук . Издательство Оксфордского университета. стр. 261–294. ISBN 978-0190938550 .
- ^ Глик Дж.Л. (1992). «Аудит научных данных — ключевой инструмент управления». Ответственность в исследованиях . 2 (3): 153–168. дои : 10.1080/08989629208573811 .
- ^ Фидлер К., Шварц Н. (19 октября 2015 г.). «Возвращение к сомнительной исследовательской практике». Социальная психология и наука о личности . 7 : 45–52. дои : 10.1177/1948550615612150 . ISSN 1948-5506 . S2CID 146717227 .
- ^ Фанелли Д. (май 2009 г.). «Сколько учёных фабрикуют и фальсифицируют исследования? Систематический обзор и метаанализ данных опросов» . ПЛОС ОДИН . 4 (5): е5738. Бибкод : 2009PLoSO...4.5738F . дои : 10.1371/journal.pone.0005738 . ПМК 2685008 . ПМИД 19478950 .
- ^ Баттон К.С., Иоаннидис Дж.П., Мокрыш С., Носек Б.А., Флинт Дж., Робинсон Э.С. и др. (май 2013 г.). «Сбой в электроснабжении: почему небольшой размер выборки подрывает надежность нейробиологии». Обзоры природы. Нейронаука . 14 (5): 365–376. дои : 10.1038/nrn3475 . ПМИД 23571845 .
- ^ Баттон К.С., Иоаннидис Дж.П., Мокрыш С., Носек Б.А., Флинт Дж., Робинсон Э.С. и др. (май 2013 г.). «Сбой в электроснабжении: почему небольшой размер выборки подрывает надежность нейробиологии» . Обзоры природы. Нейронаука . 14 (5): 365–376. дои : 10.1038/nrn3475 . ПМИД 23571845 . S2CID 455476 .
- ^ Иоаннидис Дж.П., Стэнли Т.Д., Дукульягос Х. (1 октября 2017 г.). «Сила предвзятости в экономических исследованиях» . Экономический журнал . 127 (605): Ф236–Ф265. дои : 10.1111/ecoj.12461 . ISSN 0013-0133 . S2CID 158829482 .
- ^ Флинт Дж., Мунафо М.Р. (февраль 2013 г.). «Гены-кандидаты и некандидаты в генетике поведения» . Современное мнение в нейробиологии . 23 (1): 57–61. дои : 10.1016/j.conb.2012.07.005 . ПМЦ 3752971 . ПМИД 22878161 .
- ^ Дюма-Малле Э., Баттон К.С., Боро Т., Гонон Ф., Мунафо М.Р. (февраль 2017 г.). «Низкая статистическая мощность в биомедицинской науке: обзор трех областей исследований на людях» . Королевское общество открытой науки . 4 (2): 160254. Цифровой код : 2017RSOS....460254D . дои : 10.1098/rsos.160254 . ПМК 5367316 . ПМИД 28386409 .
- ^ Фаррелл М.С., Верге Т., Склар П., Оуэн М.Дж., Офофф Р.А., О'Донован М.К. и др. (май 2015 г.). «Оценка исторических генов-кандидатов шизофрении» . Молекулярная психиатрия . 20 (5): 555–562. дои : 10.1038/mp.2015.16 . ПМЦ 4414705 . ПМИД 25754081 .
- ^ Процко Дж., Скулер Дж.В. (21 февраля 2017 г.), Лилиенфельд С.О., Уолдман И.Д. (ред.), «Эффекты спада: типы, механизмы и личные размышления» , «Психологическая наука под пристальным вниманием » (1-е изд.), Wiley, стр. 85– 107, номер домена : 10.1002/9781119095910.ch6 , ISBN 978-1-118-66107-9 , получено 26 июля 2024 г.
- ^ Jump up to: а б Локен Э., Гельман А (февраль 2017 г.). «Ошибка измерения и кризис репликации». Наука . 355 (6325): 584–585. Бибкод : 2017Sci...355..584L . дои : 10.1126/science.aal3618 . ПМИД 28183939 .
- ^ Гельман, Эндрю и Эрик Локен. « Сад разветвляющихся троп: почему множественные сравнения могут быть проблемой, даже если нет «рыболовной экспедиции» или «p-хакинга», а исследовательская гипотеза была выдвинута заранее » . Департамент статистики, Колумбийский университет 348.1-17 (2013): 3.
- ^ Jump up to: а б Руководитель ML, Холман Л., Ланфир Р., Кан А.Т., Дженнионс, доктор медицинских наук (март 2015 г.). «Масштабы и последствия p-хакинга в науке» . ПЛОС Биология . 13 (3): e1002106. дои : 10.1371/journal.pbio.1002106 . ПМК 4359000 . ПМИД 25768323 .
- ^ Айзенбергер Н.И., Либерман, доктор медицинских наук, Уильямс К.Д. (октябрь 2003 г.). «Больно ли отказ? Исследование FMRI социальной изоляции». Наука . 302 (5643): 290–292. Бибкод : 2003Sci...302..290E . дои : 10.1126/science.1089134 . ПМИД 14551436 .
- ^ Jump up to: а б Вул Э., Харрис С., Винкельман П., Пашлер Х. (май 2009 г.). «Загадочно высокие корреляции в фМРТ-исследованиях эмоций, личности и социального познания» . Перспективы психологической науки . 4 (3): 274–290. дои : 10.1111/j.1745-6924.2009.01125.x . ПМИД 26158964 .
- ^ Jump up to: а б Wagenmakers EJ (октябрь 2007 г.). «Практическое решение широко распространенных проблем значений p». Психономический бюллетень и обзор . 14 (5): 779–804. дои : 10.3758/BF03194105 . ПМИД 18087943 .
- ^ Вихертс Дж.М., Вельдкамп К.Л., Огюстейн Х.Э., Баккер М., ван Аэрт Р.К., ван Ассен М.А. (25 ноября 2016 г.). «Степени свободы в планировании, проведении, анализе и составлении отчетов о психологических исследованиях: контрольный список, позволяющий избежать взлома » . Границы в психологии . 7 :1832.дои : 10.3389 / fpsyg.2016.01832 . ПМК 5122713 . ПМИД 27933012 .
- ^ Хиггинс Дж. П., Томпсон С. Г. (июнь 2002 г.). «Количественная оценка гетерогенности в метаанализе». Статистика в медицине . 21 (11): 1539–1558. дои : 10.1002/сим.1186 . ПМИД 12111919 . S2CID 6319826 .
- ^ Муса ИА (2 октября 2019 г.). «Хрупкость результатов и предвзятость в эмпирических исследованиях: предварительное изложение». Журнал экономической методологии . 26 (4): 347–360. дои : 10.1080/1350178X.2018.1556798 . ISSN 1350-178X . S2CID 158504639 .
- ^ Грейнджер CW (1999). Эмпирическое моделирование в экономике: спецификация и оценка . Издательство Кембриджского университета. п. 5. дои : 10.1017/CBO9780511492327 . ISBN 978-0-521-77825-1 .
- ^ Мазиарз М (1 декабря 2021 г.). «Разрешение эмпирических противоречий с помощью механистических доказательств» . Синтезируйте . 199 (3): 9957–9978. дои : 10.1007/s11229-021-03232-2 . ISSN 1573-0964 . S2CID 236249427 .
- ^ Морган М.С., Магнус-младший (сентябрь 1997 г.). «Эксперимент в прикладной эконометрике» . Журнал прикладной эконометрики . 12 (5): 459–661. ISSN 1099-1255 .
- ^ Jump up to: а б Ван Бавел Дж. Дж., Менде-Сидлецкий П., Брейди В.Дж., Рейнеро Д.А. (июнь 2016 г.). «Контекстуальная чувствительность в научной воспроизводимости» . Труды Национальной академии наук Соединенных Штатов Америки . 113 (23): 6454–6459. Бибкод : 2016PNAS..113.6454V . дои : 10.1073/pnas.1521897113 . JSTOR 26470212 . ПМЦ 4988618 . ПМИД 27217556 .
- ^ Трафимов Д. (июль 2003 г.). «Проверка гипотез и оценка теории на границах: удивительные выводы из теоремы Байеса». Психологический обзор . 110 (3): 526–535. дои : 10.1037/0033-295X.110.3.526 . ПМИД 12885113 .
- ^ Wagenmakers EJ (октябрь 2007 г.). «Практическое решение широко распространенных проблем значений p». Психономический бюллетень и обзор . 14 (5): 779–804. дои : 10.3758/BF03194105 . ПМИД 18087943 .
- ^ Jump up to: а б Коэн Дж. (декабрь 1994 г.). «Земля круглая (p < 0,05)». Американский психолог . 49 (12): 997–1003. дои : 10.1037/0003-066X.49.12.997 . ISSN 1935-990Х .
- ^ Jump up to: а б Амрайн В., Корнер-Нивергельт Ф., Рот Т. (2017). «Земля плоская ( p > 0,05): пороги значимости и кризис невоспроизводимых исследований» . ПерДж . 5 : е3544. дои : 10.7717/peerj.3544 . ПМК 5502092 . ПМИД 28698825 .
- ^ Бранвен Дж. (30 апреля 2023 г.). «Все взаимосвязано» . gwern.net .
- ^ Коэн Дж (1992). «Вещи, которые я узнал (на данный момент)». . В Каздин А.Е. (ред.). Методологические проблемы и стратегии клинических исследований . Вашингтон: Американская психологическая ассоциация. стр. 315–333. дои : 10.1037/10109-028 . ISBN 978-1-55798-154-7 . Проверено 26 июля 2024 г.
- ^ Jump up to: а б Мил П.Е. (1992). «Теоретические риски и табличные звездочки: сэр Карл, сэр Рональд и медленный прогресс мягкой психологии». . В Миллер РБ (ред.). Восстановление диалога: Чтения по философии клинической психологии . Вашингтон: Американская психологическая ассоциация. стр. 523–555. дои : 10.1037/10112-043 . ISBN 978-1-55798-157-8 .
- ^ Jump up to: а б Пол Мил (1986). Чего не понимают социологи . В Д. В. Фиске и Р. А. Шведере (ред.), Метатеория в социальных науках: плюрализм и субъективность (стр. 315-338). Чикаго: Издательство Чикагского университета.
- ^ Джейнс Э.Т., Бретхорст Г.Л. (2003). «5. Странное использование теории вероятностей». Теория вероятностей: логика науки . Кембридж, Великобритания ; Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-59271-0 .
- ^ Jump up to: а б с Птица А (1 декабря 2021 г.). «Понимание кризиса репликации как ошибки базовой ставки» . Британский журнал философии науки . 72 (4): 965–993. дои : 10.1093/bjps/axy051 . ISSN 0007-0882 .
- ^ Ниссен С.Б., Магидсон Т., Гросс К., Бергстрем КТ (декабрь 2016 г.). «Предвзятость публикаций и канонизация ложных фактов» . электронная жизнь . 5 : е21451. arXiv : 1609.00494 . дои : 10.7554/eLife.21451 . ПМК 5173326 . ПМИД 27995896 .
- ^ Jump up to: а б Калифорнийский университет в Сан-Диего (май 2021 г.). «Новый кризис репликации: исследования, которые с меньшей вероятностью соответствуют действительности, цитируются чаще» . физ.орг . Проверено 14 июня 2021 г.
- ^ Jump up to: а б Серра-Гарсия М., Гнизи У (май 2021 г.). «Нереплицируемые публикации цитируются чаще, чем тиражируемые» . Достижения науки . 7 (21): eabd1705. Бибкод : 2021SciA....7.1705S . дои : 10.1126/sciadv.abd1705 . ПМЦ 8139580 . ПМИД 34020944 .
- ^ Бялек М. (январь 2018 г.). «Репликации могут вызвать искажение веры в научный прогресс». Поведенческие и мозговые науки . 41 : е122. дои : 10.1017/S0140525X18000584 . ПМИД 31064528 . S2CID 147705650 .
- ^ Jump up to: а б Меде Н.Г., Шефер М.С., Циглер Р., Вайскопф М. (январь 2021 г.). «Кризис репликации» в глазах общественности: осознание и восприятие немцами (не)воспроизводимости научных исследований» . Общественное понимание науки . 30 (1): 91–102. дои : 10.1177/0963662520954370 . ПМИД 32924865 . S2CID 221723269 .
- ^ Jump up to: а б с д Летцтер Р. (22 сентября 2016 г.). «Ученые в ярости после того, как известная психолог обвинила своих коллег в «методологическом терроризме» » . Бизнес-инсайдер . Проверено 30 января 2020 г.
- ^ «Проект колонки наблюдателей вызвал бурную реакцию в социальных сетях» . Обозреватель АПС . Ассоциация психологических наук. Сентябрь 2016 года . Проверено 4 октября 2017 г.
- ^ Фиске СТ (31 октября 2016 г.). «Призыв изменить научную культуру стыда» . Обозреватель АПС . 29 (9).
- ^ Сингал Дж. (12 октября 2016 г.). «В дебатах психологии о методологическом терроризме» . Нью-Йорк Маг . Проверено 4 октября 2017 г.
- ^ Jump up to: а б Вазире С. (июль 2018 г.). «Последствия революции доверия для производительности, творчества и прогресса» . Перспективы психологической науки . 13 (4): 411–417. дои : 10.1177/1745691617751884 . ПМИД 29961410 . S2CID 49647586 .
- ^ Корбмахер М., Азеведо Ф., Пеннингтон Ч.Р., Хартманн Х., Пауналл М., Шмидт К. и др. (25 июля 2023 г.). «Кризис репликации привел к позитивным структурным, процедурным и общественным изменениям» . Психология коммуникаций . 1 (1): 1–13. дои : 10.1038/s44271-023-00003-2 . hdl : 10852/106350 . ISSN 2731-9121 .
- ^ Стробе В., Страк Ф (январь 2014 г.). «Предполагаемый кризис и иллюзия точного повторения» . Перспективы психологической науки . 9 (1): 59–71. дои : 10.1177/1745691613514450 . ПМИД 26173241 . S2CID 31938129 .
- ^ Дженсен А (7 мая 2019 г.). «Репликация как успешная и неуспешная репликация» . Колледж свободных искусств, факультет философии . Университет Миннесоты . Проверено 25 мая 2022 г.
- ^ Мадхусуданан Дж. (май 2022 г.). «Незаметная переменная в исследованиях на животных: почему диета имеет значение» . Природа . 605 (7911): 778–779. Бибкод : 2022Natur.605..778M . дои : 10.1038/d41586-022-01393-9 . ПМИД 35606524 . S2CID 249015202 .
- ^ Иоаннидис Дж. П. (июнь 2016 г.). «Почему большинство клинических исследований бесполезны» . ПЛОС Медицина . 13 (6): e1002049. дои : 10.1371/journal.pmed.1002049 . ПМЦ 4915619 . ПМИД 27328301 .
- ^ Иоаннидис Дж.П., Фанелли Д., Данн Д.Д., Гудман С.Н. (октябрь 2015 г.). «Метаисследования: оценка и совершенствование методов и практик исследования» . ПЛОС Биология . 13 (10): e1002264. дои : 10.1371/journal.pbio.1002264 . ПМК 4592065 . ПМИД 26431313 .
- ^ Бах Б. (8 декабря 2015 г.). «О передаче науки и неопределенности: подкаст с Джоном Иоаннидисом» . Объем . Проверено 20 мая 2019 г.
- ^ Госселин Р.Д. (январь 2020 г.). «Статистический анализ должен улучшиться, чтобы справиться с кризисом воспроизводимости: призыв к действию по доступу к прозрачной статистике (ACTS)». Биоэссе . 42 (1): e1900189. doi : 10.1002/bies.201900189 . ПМИД 31755115 . S2CID 208228664 .
- ^ Пратт М.Г., Каплан С., Уиттингтон Р. (6 ноября 2019 г.). «Редакционное эссе: Суматоха по поводу прозрачности: отделение прозрачности от тиражирования в создании заслуживающих доверия качественных исследований» . Ежеквартальный журнал административной науки . 65 (1): 1–19. дои : 10.1177/0001839219887663 . ISSN 0001-8392 . S2CID 210537501 .
- ^ Ашванден C (6 декабря 2018 г.). «Кризис репликации психологии сделал эту область лучше» . ПятьТридцатьВосемь . Проверено 19 декабря 2018 г.
- ^ Чартье С., Клайн М., Маккарти Р., Нуйтен М., Данливи Д.Д., Леджервуд А. (декабрь 2018 г.), «Кооперативная революция делает психологическую науку лучше» , Observer , 31 (10) , получено 19 декабря 2018 г.
- ^ «Зарегистрированные отчеты о репликации» . Ассоциация психологических наук . Проверено 13 ноября 2015 г.
- ^ Чемберс С (20 мая 2014 г.). «Революция регистрации в психологии » . Хранитель . Проверено 13 ноября 2015 г.
- ^ Линдси Д.С. (декабрь 2015 г.). «Репликация в психологической науке» . Психологическая наука . 26 (12): 1827–1832. дои : 10.1177/0956797615616374 . ПМИД 26553013 .
- ^ Jump up to: а б Бенджамин Д.Д., Бергер Дж.О., Йоханнессон М., Носек Б.А., Вагенмейкерс Э.Дж., Берк Р. и др. (январь 2018 г.). «Переопределить статистическую значимость» . Природа человеческого поведения . 2 (1): 6–10. дои : 10.1038/s41562-017-0189-z . hdl : 10281/184094 . ПМИД 30980045 .
- ^ Лейкенс Д., Адольфи Ф.Г., Альберс К.Дж., Анвари Ф., Аппс М.А., Аргамон С.Е. и др. (март 2018 г.). «Оправдывай свою альфу» . Природа человеческого поведения . 2 (3): 168–171. дои : 10.1038/s41562-018-0311-x . hdl : 21.11116/0000-0004-9413-F . ISSN 2397-3374 . S2CID 3692182 .
- ^ Колкухун Д. (ноябрь 2014 г.). «Расследование частоты ложных открытий и неправильной интерпретации p-значений» . Королевское общество открытой науки . 1 (3): 140216. arXiv : 1407.5296 . Бибкод : 2014RSOS....140216C . дои : 10.1098/rsos.140216 . ПМЦ 4448847 . ПМИД 26064558 .
- ^ Jump up to: а б с д Колкухун Д. (декабрь 2017 г.). «Воспроизводимость исследований и неверная интерпретация p -значений» . Королевское общество открытой науки . 4 (12): 171085. дои : 10.1098/rsos.171085 . ПМК 5750014 . ПМИД 29308247 .
- ^ Колкухун Д. (11 октября 2016 г.). «Проблема с p-значениями» . Журнал Эон . Проверено 11 декабря 2016 г.
- ^ Лонгстафф С., Колкухун Д. «Калькулятор риска ложноположительных результатов (FPR)» . Университетский колледж Лондона. версия 1.7.
- ^ Мэтьюз Р.А. (2001). «Почему клиницистов должны интересовать байесовские методы?». Журнал статистического планирования и выводов . 94 : 43–58. дои : 10.1016/S0378-3758(00)00232-9 .
- ^ Максвелл С.Е., Лау М.Ю., Ховард Г.С. (сентябрь 2015 г.). «Страдает ли психология кризисом репликации? Что на самом деле означает «неспособность воспроизводить»?». Американский психолог . 70 (6): 487–498. дои : 10.1037/a0039400 . ПМИД 26348332 .
- ^ ИнтХаут Дж., Иоаннидис Дж.П., Борм Г.Ф., Гоеман Дж.Дж. (август 2015 г.). «Небольшие исследования более разнородны, чем крупные: мета-метаанализ» . Журнал клинической эпидемиологии . 68 (8): 860–869. дои : 10.1016/j.jclinepi.2015.03.017 . hdl : 2066/153978 . ПМИД 25959635 .
- ^ Баттон К.С., Иоаннидис Дж.П., Мокрыш С., Носек Б.А., Флинт Дж., Робинсон Э.С. и др. (май 2013 г.). «Сбой в электроснабжении: почему небольшой размер выборки подрывает надежность нейробиологии» . Обзоры природы. Нейронаука . 14 (5): 365–376. дои : 10.1038/nrn3475 . ПМИД 23571845 .
- ^ Гринвальд АГ (1975). «Последствия предубеждения против нулевой гипотезы» (PDF) . Психологический вестник . 82 (1): 1–20. дои : 10.1037/h0076157 .
- ^ Кригескорте Н., Симмонс В.К., Беллгоуэн П.С., Бейкер С.И. (май 2009 г.). «Циркулярный анализ в системной нейробиологии: опасность двойного погружения» . Природа Нейронауки . 12 (5): 535–540. дои : 10.1038/nn.2303 . ПМЦ 2841687 . ПМИД 19396166 .
- ^ Яркони Т., Вестфолл Дж. (ноябрь 2017 г.). «Предпочитать предсказание объяснению в психологии: уроки машинного обучения» . Перспективы психологической науки . 12 (6): 11.00–11.22. дои : 10.1177/1745691617693393 . ПМК 6603289 . ПМИД 28841086 .
- ^ «NWO предоставляет 3 миллиона долларов для пилотных исследований репликации» . Нидерландская организация научных исследований (пресс-релиз). Июль 2016 г. Архивировано из оригинала 22 июля 2016 г.
- ^ Jump up to: а б с Apple S (22 января 2017 г.). «Молодой миллиардер, стоящий за войной с плохой наукой» . Проводной .
- ^ Фрэнк MC, Сакс Р. (ноябрь 2012 г.). «Обучение репликации» . Перспективы психологической науки . 7 (6): 600–604. дои : 10.1177/1745691612460686 . ПМИД 26168118 . S2CID 33661604 .
- ^ Грахе Дж.Э., Рейфман А., Герман А.Д., Уокер М., Олесон К.С., Нарио-Редмонд М. и др. (ноябрь 2012 г.). «Использование неоткрытого ресурса студенческих исследовательских проектов» . Перспективы психологической науки . 7 (6): 605–607. дои : 10.1177/1745691612459057 . ПМИД 26168119 .
- ^ Марвик Б., Ван Л., Робинсон Р., Луазель Х. (22 октября 2019 г.). «Как использовать задания на репликацию для обучения целостности в эмпирической археологии» . Достижения археологической практики . 8 : 78–86. дои : 10.1017/aap.2019.38 .
- ^ Эверетт Дж. А., Эрп Б. Д. (1 января 2015 г.). «Трагедия (академического) достояния: интерпретация кризиса репликации в психологии как социальной дилеммы для начинающих исследователей» . Границы в психологии . 6 : 1152. doi : 10.3389/fpsyg.2015.01152 . ПМК 4527093 . ПМИД 26300832 .
- ^ Кинтана DS (сентябрь 2021 г.). «Репликация бакалаврских диссертаций для улучшения науки и образования». Природа человеческого поведения (статья World View). 5 (9): 1117–1118. дои : 10.1038/s41562-021-01192-8 . ПМИД 34493847 . S2CID 237439956 .
- ^ Кембриджский университет (апрель 2022 г.). « Робот-ученый Ева обнаружила, что менее трети научных результатов воспроизводимы» . Техэксплор . Проверено 15 мая 2022 г.
- ^ Ропер К., Абдель-Рехим А., Хаббард С., Карпентер М., Ржецкий А., Солдатова Л. и др. (апрель 2022 г.). «Проверка воспроизводимости и надежности литературы по биологии рака с помощью робота» . Журнал Королевского общества, Интерфейс . 19 (189): 20210821. doi : 10.1098/rsif.2021.0821 . ПМЦ 8984295 . ПМИД 35382578 .
- ^ Jump up to: а б Чемберс С (10 июня 2014 г.). «Физика завидует: есть ли в «точных» науках решение кризиса репликации в психологии?» . Хранитель .
- ^ Канеман Д. (2014). «Новый этикет репликации». Социальная психология (комментарий). Комментарии и ответы дальше. 45 (4): 310–311. дои : 10.1027/1864-9335/a000202 .
- ^ Макел MC, Плакер Дж. А., Хегарти Б. (ноябрь 2012 г.). «Репликации в психологических исследованиях: как часто они действительно происходят?» . Перспективы психологической науки . 7 (6): 537–542. дои : 10.1177/1745691612460688 . ПМИД 26168110 .
- ^ Ульманн Э.Л., Эберсол С.Р., Шартье С.Р., Эррингтон Т.М., Кидвелл М.С., Лай С.К. и др. (сентябрь 2019 г.). «Научная утопия III: Краудсорсинговая наука» . Перспективы психологической науки . 14 (5): 711–733. дои : 10.1177/1745691619850561 . ПМИД 31260639 .
- ^ Jump up to: а б Форшер П.С., Вагенмейкерс Э.Дж., Коулс Н.А., Силан М.А., Дутра Н., Баснайт-Браун Д. и др. (май 2023 г.). «Преимущества, препятствия и риски большой команды науки» . Перспективы психологической науки . 18 (3): 607–623. дои : 10.1177/17456916221082970 . ПМИД 36190899 . S2CID 236816530 .
- ^ Мунафо М.Р., Дэйви Смит Дж. (январь 2018 г.). «Надежное исследование требует множества доказательств» . Природа . 553 (7689): 399–401. Бибкод : 2018Natur.553..399M . дои : 10.1038/d41586-018-01023-3 . ПМИД 29368721 .
- ^ Jump up to: а б с д и ж Уоллот С., Келти-Стивен Д.Г. (1 июня 2018 г.). «Причинно-доминантная взаимосвязь в сознании и мозге и ее значение для вопросов обобщения и репликации» . Разум и машины . 28 (2): 353–374. дои : 10.1007/s11023-017-9455-0 . hdl : 21.11116/0000-0001-AC9C-E . ISSN 1572-8641 .
- ^ Тирни В., Харди Дж.Х., Эберсол С.Р., Ливитт К., Виганола Д., Клементе Э.Г. и др. (1 ноября 2020 г.). «Созидательное разрушение в науке» . Организационное поведение и процессы принятия человеческих решений . 161 : 291–309. дои : 10.1016/j.obhdp.2020.07.002 . hdl : 2066/228242 . ISSN 0749-5978 . S2CID 224979451 .
- ^ Тирни В., Харди Дж., Эберсол С.Р., Виганола Д., Клементе Э.Г., Гордон М. и др. (1 марта 2021 г.). «Подход творческого разрушения к репликации: неявная работа и сексуальная мораль в разных культурах» . Журнал экспериментальной социальной психологии . 93 : 104060. doi : 10.1016/j.jesp.2020.104060 . hdl : 10037/24275 . ISSN 0022-1031 . S2CID 229028797 .
- ^ Делиос А., Клементе Э.Г., Ву Т., Тан Х., Ван Ю., Гордон М. и др. (июль 2022 г.). «Исследование обобщаемости результатов исследования по архивным данным» . Труды Национальной академии наук Соединенных Штатов Америки . 119 (30): e2120377119. Бибкод : 2022PNAS..11920377D . дои : 10.1073/pnas.2120377119 . ПМЦ 9335312 . PMID 35858443 .
- ^ Инс, округ Колумбия, Хаттон Л., Грэм-Камминг Дж. (февраль 2012 г.). «Дело в пользу открытых компьютерных программ» . Природа . 482 (7386): 485–488. Бибкод : 2012Natur.482..485I . дои : 10.1038/nature10836 . ПМИД 22358837 .
- ^ Выонг QH (январь 2018 г.). «(Ир)рациональное рассмотрение стоимости науки в странах с переходной экономикой» . Природа человеческого поведения . 2 (1): 5. дои : 10.1038/s41562-017-0281-4 . ПМИД 30980055 . S2CID 46878093 .
- ^ Джанк ТР, Лион Л (21 декабря 2020 г.). «Воспроизводимость и тиражирование результатов экспериментальной физики элементарных частиц». Гарвардский обзор науки о данных . 2 (4). arXiv : 2009.06864 . дои : 10.1162/99608f92.250f995b . S2CID 221703733 .
- ^ Jump up to: а б Иоаннидис Дж. П. (февраль 2016 г.). «Предвидение последствий обмена необработанными данными и кодом и награждения значками за обмен». Журнал клинической эпидемиологии (комментарий). 70 : 258–260. дои : 10.1016/j.jclinepi.2015.04.015 . ПМИД 26163123 .
Дальнейшее чтение
[ редактировать ]- Бастиан Х (5 декабря 2016 г.). «Хронология кризиса воспроизводимости: вехи в обеспечении надежности исследований» . Абсолютно возможно . Проверено 5 июня 2019 г.
- Бонетт, генеральный директор (2021). Планирование и анализ повторных исследований. Методы организационных исследований, 24, 513–529. https://doi.org/10.1177/1094428120911088
- Денворт Л. (октябрь 2019 г.). «Значительная проблема: стандартные научные методы подвергаются критике. Изменится ли что-нибудь?» (PDF) . Научный американец . Том. 321, нет. 4. С. 62–67. п. :
Использование p значений в течение почти столетия [с 1925 года] для определения статистической значимости экспериментальных 63 результатов способствовало возникновению иллюзии уверенности и [к] кризисам воспроизводимости во многих научных областях . Растет решимость реформировать статистический анализ... Некоторые [исследователи] предлагают изменить статистические методы, тогда как другие готовы отказаться от порога для определения «значимых» результатов.
- Харрис Р. (2017). Трупное окоченение: как небрежная наука создает бесполезные лекарства, разрушает надежду и тратит миллиарды . Нью-Йорк: Основные книги. ISBN 9780465097906 .
- Кафкафи Н., Агасси Дж., Чеслер Э.Дж., Краббе Дж.К. , Крузио В.Е. , Эйлам Д. и др. (апрель 2018 г.). «Воспроизводимость и воспроизводимость фенотипирования грызунов в доклинических исследованиях» . Неврологические и биоповеденческие обзоры . 87 : 218–232. doi : 10.1016/j.neubiorev.2018.01.003 . ПМК 6071910 . ПМИД 29357292 .
- Ричи С. (июль 2020 г.). Научная фантастика: как мошенничество, предвзятость, халатность и обман подрывают поиск истины . Нью-Йорк: Метрополитен Букс. ISBN 9781250222695 . Рецензия на книгу (ноябрь 2020 г., The American Conservative )
- Уитфилд Дж. (октябрь 2021 г.). «Кризис репликации» . Лондонское обозрение книг . 43 (19): 39–40. обзор Ричи С. (июль 2020 г.). Научная фантастика: разоблачение мошенничества, халатности и обмана в науке . Лондон: Бодли Хед. ISBN 978-1-84792-565-7 .