Статистическая значимость

При проверке статистических гипотез ^[1]^[2] результат имеет статистическую значимость , если результат, по крайней мере, как «экстремальный», был бы очень редким, если бы нулевая гипотеза была верной. ^[3] исследования Точнее, определенный уровень значимости , обозначаемый $\alpha$ , — вероятность того, что исследование отвергнет нулевую гипотезу при условии, что нулевая гипотеза верна; ^[4] и p -значение результата, $p$ , — вероятность получения хотя бы столь же экстремального результата при условии, что нулевая гипотеза верна. ^[5] Результат является статистически значимым по стандартам исследования, когда $p\leq \alpha$ . ^[6]^[7]^[8]^[9]^[10]^[11]^[12] Уровень значимости для исследования выбирается до сбора данных и обычно устанавливается на уровне 5%. ^[13] или намного ниже — в зависимости от области исследования. ^[14]

В любом эксперименте или наблюдении , предполагающем взятие выборки из популяции , всегда существует вероятность того, что наблюдаемый эффект возник бы только из-за ошибки выборки . ^[15]^[16] Но если значение p наблюдаемого эффекта меньше (или равно) уровню значимости, исследователь может заключить, что эффект отражает характеристики всей популяции. ^[1] тем самым отвергая нулевую гипотезу. ^[17]

Этот метод проверки статистической значимости результатов был разработан в начале 20 века. Термин «значимость» здесь не подразумевает важности, а термин «статистическая значимость» — это не то же самое, что исследовательская значимость, теоретическая значимость или практическая значимость. ^[1]^[2]^[18]^[19] Например, термин «клиническая значимость» относится к практической важности эффекта лечения. ^[20]

История [ править ]

Статистическая значимость восходит к 18 веку, в работе Джона Арбутнота и Пьера-Симона Лапласа , которые вычислили p значение для соотношения полов человека при рождении, приняв нулевую гипотезу о равной вероятности рождения мальчиков и девочек; см. в разделе p -value § История . подробности ^[21]^[22]^[23]^[24]^[25]^[26]^[27]

В 1925 году Рональд Фишер выдвинул идею проверки статистических гипотез, которую он назвал «тестами значимости», в своей публикации « Статистические методы для научных работников» . ^[28]^[29]^[30] Фишер предложил вероятность один из двадцати (0,05) в качестве удобного порогового уровня для отклонения нулевой гипотезы. ^[31] В статье 1933 года Ежи Нейман и Эгон Пирсон назвали этот порог уровнем значимости , который они назвали $\alpha$ . Они рекомендовали, чтобы $\alpha$ быть установлены заранее, до начала любого сбора данных. ^[31]^[32]

Несмотря на первоначальное предложение 0,05 в качестве уровня значимости, Фишер не собирался фиксировать это пороговое значение. В своей публикации 1956 года «Статистические методы и научные выводы» он рекомендовал устанавливать уровни значимости в соответствии с конкретными обстоятельствами. ^[31]

Связанные понятия [ править ]

Уровень значимости $\alpha$ является порогом для $p$ ниже которого нулевая гипотеза отвергается, хотя по предположению она верна, и происходит что-то еще. Это означает, что $\alpha$ также вероятность ошибочного отклонения нулевой гипотезы, если нулевая гипотеза верна. ^[4] Это также называется ложным срабатыванием и ошибкой I типа .

Иногда вместо этого исследователи говорят об уровне достоверности $γ = (1 - α)$ . Это вероятность не отвергнуть нулевую гипотезу при условии, что она верна. ^[33]^[34] Доверительные уровни и доверительные интервалы были введены Нейманом в 1937 году. ^[35]

в проверке статистических Роль гипотез

В двустороннем тесте область отклонения для уровня значимости $α = 0,05$ разделена на оба конца выборочного распределения и составляет 5% площади под кривой (белые области).

Статистическая значимость играет ключевую роль в проверке статистических гипотез. Он используется для определения того, нулевую гипотезу следует ли отклонить или сохранить . Нулевая гипотеза – это гипотеза о том, что в изучаемом явлении не существует никакого эффекта. ^[36] Чтобы нулевая гипотеза была отклонена, наблюдаемый результат должен быть статистически значимым, т. е. наблюдаемое значение p меньше заранее заданного уровня значимости. $\alpha$ .

Чтобы определить, является ли результат статистически значимым, исследователь рассчитывает значение p , которое представляет собой вероятность наблюдения эффекта той же величины или более экстремального при условии, что нулевая гипотеза верна. ^[5]^[12] Нулевая гипотеза отклоняется, если значение p меньше (или равно) заранее определенного уровня, $\alpha$ . $\alpha$ также называется уровнем значимости и представляет собой вероятность отклонения нулевой гипотезы при условии, что она верна ( ошибка I рода ). Обычно он устанавливается на уровне 5% или ниже.

Например, когда $\alpha$ установлена равной 5%, условная вероятность , ошибки I рода при условии, что нулевая гипотеза верна , равна 5%, ^[37] и статистически значимым результатом является тот, в котором наблюдаемое значение p меньше (или равно) 5%. ^[38] При извлечении данных из выборки это означает, что область отклонения составляет 5% распределения выборки . ^[39] Эти 5% могут быть распределены по одной стороне выборочного распределения, как в одностороннем тесте , или разделены на обе стороны распределения, как в двустороннем тесте , при этом каждый хвост (или область отклонения) содержит 2,5%. распределения.

Использование одностороннего теста зависит от того, указывает ли исследовательский вопрос или альтернативная гипотеза ли группа объектов направление, например, тяжелее успевают учащиеся при оценке или лучше . ^[3] Двусторонний тест по-прежнему можно использовать, но он будет менее эффективным , чем односторонний тест, поскольку область отклонения для одностороннего теста сосредоточена на одном конце нулевого распределения и в два раза больше (5% против 0,2,5%) каждой области отклонения для двустороннего теста. В результате нулевая гипотеза может быть отклонена с менее экстремальным результатом, если использовался односторонний критерий. ^[40] Односторонний критерий более эффективен, чем двусторонний тест, только если указанное направление альтернативной гипотезы верно. Однако если оно неверно, то односторонний тест не имеет силы.

Пороги значимости в конкретных областях [ править ]

В конкретных областях, таких как физика элементарных частиц и производство , статистическая значимость часто выражается в виде кратных стандартному отклонению или сигме ( σ ) нормального распределения , при этом пороговые значения значимости устанавливаются на гораздо более строгом уровне (например, 5 σ ). ^[41]^[42] Например, уверенность в существовании частицы бозона Хиггса была основана на критерии 5 σ , который соответствует значению p примерно 1 на 3,5 миллиона. ^[42]^[43]

В других областях научных исследований, таких как полногеномные исследования ассоциаций , уровни значимости составляют всего 5 × 10. ⁻⁸ не редкость ^[44]^[45]— так как количество проводимых тестов чрезвычайно велико.

Ограничения [ править ]

Исследователи, сосредоточенные исключительно на том, являются ли их результаты статистически значимыми, могут сообщать о результатах, которые не являются существенными. ^[46] и не воспроизводимы. ^[47]^[48] Существует также разница между статистической значимостью и практической значимостью. Исследование, которое признано статистически значимым, не обязательно может быть практически значимым. ^[49]^[19]

Размер эффекта [ править ]

Размер эффекта является мерой практической значимости исследования. ^[49] Статистически значимый результат может иметь слабый эффект. Чтобы оценить исследовательскую значимость своего результата, исследователям рекомендуется всегда сообщать о величине эффекта вместе с p -значениями. Мера размера эффекта количественно определяет силу эффекта, например, расстояние между двумя средними значениями в единицах стандартного отклонения (см. d Коэна ), коэффициент корреляции между двумя переменными или его квадрат и другие меры. ^[50]

Воспроизводимость [ править ]

Статистически значимый результат может быть нелегко воспроизвести. ^[48] В частности, некоторые статистически значимые результаты на самом деле будут ложноположительными. Каждая неудачная попытка воспроизвести результат увеличивает вероятность того, что результат окажется ложноположительным. ^[51]

Проблемы [ править ]

в некоторых использование Чрезмерное журналах

Начиная с 2010-х годов некоторые журналы начали задаваться вопросом, не слишком ли сильно полагаются на тестирование значимости, особенно на использование порога $α$ = 5%, как на основной критерий достоверности гипотезы. ^[52] Некоторые журналы призывали авторов проводить более подробный анализ, чем просто тест статистической значимости. В области социальной психологии журнал « Базовая и прикладная социальная психология» вообще запретил использование тестирования значимости в опубликованных им статьях. ^[53] требование от авторов использовать другие меры для оценки гипотез и воздействия. ^[54]^[55]

Другие редакторы, комментируя этот запрет, отметили: «Запрет на сообщение о p -значениях, как это недавно сделала «Базовая и прикладная социальная психология», не решит проблему, потому что он просто лечит симптом проблемы. В этом нет ничего плохого. с проверкой гипотез и p -значениями как таковыми, если авторы, рецензенты и редакторы действий используют их правильно». ^[56] Некоторые статистики предпочитают использовать альтернативные меры доказательства, такие как отношения правдоподобия или факторы Байеса . ^[57] Использование байесовской статистики позволяет избежать уровней достоверности, но также требует принятия дополнительных предположений. ^[57] и не обязательно может улучшить практику статистического тестирования. ^[58]

Широко распространенное злоупотребление статистической значимостью представляет собой важную тему исследований в области метанауки . ^[59]

Переосмысление значения [ править ]

В 2016 году Американская статистическая ассоциация (ASA) опубликовала заявление о значениях p , в котором говорилось, что «широко распространенное использование «статистической значимости» (обычно интерпретируемой как « p ≤ 0,05») в качестве лицензии на утверждение научных результатов (или подразумеваемая истина) приводит к значительному искажению научного процесса». ^[57] В 2017 году группа из 72 авторов предложила повысить воспроизводимость, изменив p с 0,05 на 0,005. порог статистической значимости значения ^[60] Другие исследователи ответили, что введение более строгого порога значимости усугубит такие проблемы, как сбор данных ; Таким образом, альтернативные предложения заключаются в выборе и обосновании гибких пороговых значений p -значения перед сбором данных, ^[61] или интерпретировать значения p как непрерывные индексы, тем самым игнорируя пороговые значения и статистическую значимость. ^[62] Кроме того, изменение значения на 0,005 увеличит вероятность ложноотрицательных результатов, в результате чего изучаемый эффект является реальным, но тест не может его показать. ^[63]

В 2019 году более 800 статистиков и ученых подписали обращение с призывом отказаться от термина «статистическая значимость» в науке. ^[64] и ASA опубликовало еще одно официальное заявление ^[65] заявляя (стр. 2):

На основе нашего обзора статей в этом специальном выпуске и более широкой литературы мы пришли к выводу, что пришло время полностью прекратить использование термина «статистически значимый». Также не следует использовать такие варианты, как «значительно отличаются», « $p\leq 0.05$ «,» и «несущественный» сохраняются, независимо от того, выражены ли они словами, звездочками в таблице или каким-либо другим способом.

См. также [ править ]

A/B тестирование , ABX тест
Статистика оценки
Метод Фишера для объединения независимых критериев значимости
Эффект поиска в другом месте
Проблема множественных сравнений
Размер выборки
Ошибка техасского снайпера (приводятся примеры тестов, в которых уровень значимости был установлен слишком высоко)

Ссылки [ править ]

↑ Перейти обратно: Перейти обратно: ^а ^б ^с Сиркин, Р. Марк (2005). «Двухвыборочные t-тесты». Статистика для социальных наук (3-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications, Inc., стр. 271–316. ISBN 978-1-4129-0546-6 .
↑ Перейти обратно: Перейти обратно: ^а ^б Боррор, Конни М. (2009). «Принятие статистических решений». Справочник сертифицированного инженера по качеству (3-е изд.). Милуоки, Висконсин: ASQ Quality Press. стр. 418–472. ISBN 978-0-87389-745-7 .
↑ Перейти обратно: Перейти обратно: ^а ^б Майерс, Джером Л.; Ну, Арнольд Д.; Лорх, Роберт Ф. младший (2010). «Разработка основ проверки гипотез с использованием биномиального распределения». План исследования и статистический анализ (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 65–90. ISBN 978-0-8058-6431-1 .
↑ Перейти обратно: Перейти обратно: ^а ^б Далгаард, Питер (2008). «Мощность и расчет размера выборки». Вводная статистика с R . Статистика и вычисления. Нью-Йорк: Спрингер. стр. 155–56. дои : 10.1007/978-0-387-79054-1_9 . ISBN 978-0-387-79053-4 .
↑ Перейти обратно: Перейти обратно: ^а ^б «Статистическая проверка гипотез» . www.dartmouth.edu . Архивировано из оригинала 2 августа 2020 г. Проверено 11 ноября 2019 г.
^ Джонсон, Вален Э. (9 октября 2013 г.). «Пересмотренные стандарты статистических данных» . Труды Национальной академии наук . 110 (48): 19313–19317. Бибкод : 2013PNAS..11019313J . дои : 10.1073/pnas.1313476110 . ПМЦ 3845140 . ПМИД 24218581 .
^ Редмонд, Кэрол; Колтон, Теодор (2001). «Клиническая значимость против статистической значимости». Биостатистика в клинических исследованиях . Справочная серия Wiley по биостатистике (3-е изд.). Западный Суссекс, Соединенное Королевство: John Wiley & Sons Ltd., стр. 35–36. ISBN 978-0-471-82211-0 .
^ Камминг, Джефф (2012). Понимание новой статистики: размеры эффекта, доверительные интервалы и метаанализ . Нью-Йорк, США: Рутледж. стр. 27–28.
^ Кшивинский, Мартин; Альтман, Наоми (30 октября 2013 г.). «Точки значимости: значимость, значения P и t-критерии» . Природные методы . 10 (11): 1041–1042. дои : 10.1038/nmeth.2698 . ПМИД 24344377 .
^ Шам, Пак К.; Перселл, Шон М. (17 апреля 2014 г.). «Тестирование статистической мощности и значимости в крупномасштабных генетических исследованиях». Обзоры природы Генетика . 15 (5): 335–346. дои : 10.1038/nrg3706 . ПМИД 24739678 . S2CID 10961123 .
^ Альтман, Дуглас Г. (1999). Практическая статистика медицинских исследований . Нью-Йорк, США: Chapman & Hall/CRC. стр. 167 . ISBN 978-0-412-27630-9 .
↑ Перейти обратно: Перейти обратно: ^а ^б Девор, Джей Л. (2011). Вероятность и статистика для техники и наук (8-е изд.). Бостон, Массачусетс: Cengage Learning. стр. 300–344. ISBN 978-0-538-73352-6 .
^ Крапаро, Роберт М. (2007). «Уровень значимости». В Салкинде, Нил Дж. (ред.). Энциклопедия измерений и статистики . Том. 3. Таузенд-Оукс, Калифорния: Публикации SAGE. стр. 889–891. ISBN 978-1-4129-1611-0 .
^ Спроролл, Натали Л. (2002). «Проверка гипотез» . Справочник по методам исследования: Руководство для практиков и студентов социальных наук (2-е изд.). Лэнхэм, Мэриленд: Scarecrow Press, Inc., стр. 49–64 . ISBN 978-0-8108-4486-5 .
^ Бэбби, Эрл Р. (2013). «Логика выборки». Практика социальных исследований (13-е изд.). Бельмонт, Калифорния: Cengage Learning. стр. 185–226. ISBN 978-1-133-04979-1 .
^ Фаэрти, Винсент (2008). «Вероятность и статистическая значимость». Сострадательная статистика: прикладной количественный анализ для социальных служб (с упражнениями и инструкциями в SPSS) (1-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications, Inc., стр. 127–138. ISBN 978-1-4129-3982-9 .
^ МакКиллуп, Стив (2006). «Вероятность помогает вам принять решение о ваших результатах» . Объясненная статистика: Вводное руководство для ученых-биологов (1-е изд.). Кембридж, Соединенное Королевство: Издательство Кембриджского университета. стр. 44–56 . ISBN 978-0-521-54316-3 .
^ Майерс, Джером Л.; Ну, Арнольд Д.; Лорх, Роберт Ф. младший (2010). «Т-дистрибутив и его приложения». План исследования и статистический анализ (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 124–153. ISBN 978-0-8058-6431-1 .
↑ Перейти обратно: Перейти обратно: ^а ^б Хупер, Питер. «Что такое P-значение?» (PDF) . Университет Альберты, факультет математических и статистических наук . Архивировано из оригинала (PDF) 31 марта 2020 г. Проверено 10 ноября 2019 г.
^ Люнг, В.-К. (01.03.2001). «Баланс статистической и клинической значимости в оценке эффектов лечения» . Последипломный медицинский журнал . 77 (905): 201–204. дои : 10.1136/pmj.77.905.201 . ISSN 0032-5473 . ПМК 1741942 . ПМИД 11222834 .
^ Брайан, Эрик; Джейссон, Мари (2007). «Физико-теология и математика (1710–1794)». Изменение соотношения полов человека при рождении . Springer Science & Business Media. стр. 1–25. ISBN 978-1-4020-6036-6 .
^ Джон Арбутнот (1710). «Аргумент в пользу Божественного Провидения, основанный на постоянной регулярности рождаемости у представителей обоих полов» (PDF) . Философские труды Лондонского королевского общества . 27 (325–336): 186–190. дои : 10.1098/rstl.1710.0011 .
^ Коновер, WJ (1999), «Глава 3.4: Знаковый тест», Практическая непараметрическая статистика (Третье изд.), Wiley, стр. 157–176, ISBN 978-0-471-16068-7
^ Срент, П. (1989), Прикладные непараметрические статистические методы (второе изд.), Chapman & Hall, ISBN 978-0-412-44980-2
^ Стиглер, Стивен М. (1986). История статистики: измерение неопределенности до 1900 года . Издательство Гарвардского университета. стр. 225–226 . ISBN 978-0-674-40341-3 .
^ Беллхаус, Дэвид (2001), «Джон Арбутнот», в книге «Статистики столетий» К. К. Хейда и Э. Сенеты , Спрингер, стр. 39–42, ISBN 978-0-387-95329-8
^ Хальд, Андерс (1998), «Глава 4. Случайность или замысел: критерии значимости», История математической статистики с 1750 по 1930 год , Wiley, стр. 65
^ Камминг, Джефф (2011). «От значимости нулевой гипотезы к величине эффекта тестирования». Понимание новой статистики: размеры эффекта, доверительные интервалы и метаанализ . Серия многомерных приложений. Восточный Суссекс, Великобритания: Рутледж. стр. 21–52. ISBN 978-0-415-87968-2 .
^ Фишер, Рональд А. (1925). Статистические методы для научных работников . Эдинбург, Великобритания: Оливер и Бойд. стр. 43 . ISBN 978-0-05-002170-5 .
^ Полетик, Фенна Х. (2001). «Формальные теории тестирования». Поведение при проверке гипотез . Очерки когнитивной психологии (1-е изд.). Восточный Суссекс, Соединенное Королевство: Psychology Press. стр. 29–48. ISBN 978-1-84169-159-6 .
↑ Перейти обратно: Перейти обратно: ^а ^б ^с Куинн, Джеффри Р.; Кио, Майкл Дж. (2002). Экспериментальный дизайн и анализ данных для биологов (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 46–69 . ISBN 978-0-521-00976-8 .
^ Нейман, Дж.; Пирсон, ES (1933). «Проверка статистических гипотез в отношении априорных вероятностей». Математические труды Кембриджского философского общества . 29 (4): 492–510. Бибкод : 1933PCPS...29..492N . дои : 10.1017/S030500410001152X . S2CID 119855116 .
^ "Выводы о статистической значимости возможны с помощью доверительного интервала. Если доверительный интервал не включает в себя значение нулевого эффекта, можно предположить, что имеется статистически значимый результат." Прель, Жан-Баптист ты; Хоммель, Герхард; Рериг, Бернд; Блеттнер, Мария (2009). «Доверительный интервал или P-значение?» . Немецкий медицинский журнал онлайн . 106 (19): 335–9. дои : 10.3238/arztebl.2009.0335 . ПМЦ 2689604 . ПМИД 19547734 .
^ StatNews № 73: Перекрывающиеся доверительные интервалы и статистическая значимость
^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей». Философские труды Королевского общества А. 236 (767): 333–380. Бибкод : 1937RSPTA.236..333N . дои : 10.1098/rsta.1937.0005 . JSTOR 91337 . S2CID 19584450 .
^ Мейер, Кеннет Дж.; Брудни, Джеффри Л.; Боте, Джон (2011). Прикладная статистика для государственного и некоммерческого управления (3-е изд.). Бостон, Массачусетс: Cengage Learning. стр. 189–209. ISBN 978-1-111-34280-7 .
^ Хили, Джозеф Ф. (2009). Основы статистики: инструмент социальных исследований (2-е изд.). Бельмонт, Калифорния: Cengage Learning. стр. 177–205. ISBN 978-0-495-60143-2 .
^ МакКиллуп, Стив (2006). Объясненная статистика: Вводное руководство для ученых-биологов (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 32–38 . ISBN 978-0-521-54316-3 .
^ Здоровье, Дэвид (1995). Введение в экспериментальный дизайн и статистику для биологии (1-е изд.). Бостон, Массачусетс: CRC Press. стр. 123–154. ISBN 978-1-85728-132-3 .
^ Хинтон, Перри Р. (2010). «Значение, ошибка и сила». Объяснение статистики (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 79–90. ISBN 978-1-84872-312-2 .
^ Воган, Саймон (2013). Научный вывод: обучение на основе данных (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 146–152. ISBN 978-1-107-02482-3 .
↑ Перейти обратно: Перейти обратно: ^а ^б Бракен, Майкл Б. (2013). Риск, шанс и причинно-следственная связь: исследование происхождения и лечение заболеваний (1-е изд.). Нью-Хейвен, Коннектикут: Издательство Йельского университета. стр. 260–276 . ISBN 978-0-300-18884-4 .
^ Франклин, Аллан (2013). «Пролог: Возникновение сигм». Изменение стандартов: эксперименты по физике элементарных частиц в двадцатом веке (1-е изд.). Питтсбург, Пенсильвания: Издательство Питтсбургского университета. стр. Ii–III. ISBN 978-0-8229-4430-0 .
^ Кларк, генеральный директор; Андерсон, Калифорния; Петтерссон, Ф.Х.; Кардон, ЛР; Моррис, AP; Зондерван, КТ (6 февраля 2011 г.). «Базовый статистический анализ в генетических исследованиях случай-контроль» . Протоколы природы . 6 (2): 121–33. дои : 10.1038/nprot.2010.182 . ПМК 3154648 . ПМИД 21293453 .
^ Барш, Г.С.; Копенхейвер, врач общей практики; Гибсон, Дж; Уильямс, С.М. (5 июля 2012 г.). «Руководство по полногеномным исследованиям ассоциаций» . ПЛОС Генетика . 8 (7): e1002812. дои : 10.1371/journal.pgen.1002812 . ПМК 3390399 . ПМИД 22792080 .
^ Карвер, Рональд П. (1978). «Дело против проверки статистической значимости». Гарвардский обзор образования . 48 (3): 378–399. дои : 10.17763/haer.48.3.t490261645281841 . S2CID 16355113 .
^ Иоаннидис, Джон П.А. (2005). «Почему большинство опубликованных результатов исследований являются ложными» . ПЛОС Медицина . 2 (8): е124. дои : 10.1371/journal.pmed.0020124 . ПМЦ 1182327 . ПМИД 16060722 .
↑ Перейти обратно: Перейти обратно: ^а ^б Амрайн, Валентин; Корнер-Нивергельт, Фрэнци; Рот, Тобиас (2017). «Земля плоская (p > 0,05): пороги значимости и кризис невоспроизводимых исследований» . ПерДж . 5 : е3544. дои : 10.7717/peerj.3544 . ПМК 5502092 . ПМИД 28698825 .
↑ Перейти обратно: Перейти обратно: ^а ^б Ходжат, Мохаммадреза; Сюй, Банда (2004). «Руководство для посетителей по размерам эффектов». Достижения в области медицинских наук. Образование . 9 (3): 241–9. doi : 10.1023/B:AHSE.0000038173.00909.f6 . ПМИД 15316274 . S2CID 8045624 .
^ Педазур, Элазар Дж.; Шмелькин, Лиора П. (1991). Измерение, проектирование и анализ: интегрированный подход (под ред. Студента). Нью-Йорк, штат Нью-Йорк: Psychology Press. стр. 180–210. ISBN 978-0-8058-1063-9 .
^ Стахель, Вернер (2016). «Статистическая проблема воспроизводимости». Принципы, проблемы, практика и перспективы Воспроизводимость: принципы, проблемы, практика и перспективы : 87–114. дои : 10.1002/9781118865064.ch5 . ISBN 978-1-118-86497-5 .
^ «Серия семинаров CSSME: спор о p -значениях и парадигма проверки значимости нулевой гипотезы (NHST)» . www.education.leeds.ac.uk . Школа образования Университета Лидса . Проверено 1 декабря 2016 г.
^ Новелла, Стивен (25 февраля 2015 г.). «Психологический журнал запрещает тестирование значимости» . Научная медицина.
^ Вулстон, Крис (05 марта 2015 г.). «Журнал по психологии запрещает значения P» . Природа . 519 (7541): 9. Бибкод : 2015Natur.519....9W . дои : 10.1038/519009f .
^ Зигфрид, Том (17 марта 2015 г.). «Запрет P-значения: маленький шаг для журнала, гигантский скачок для науки» . Новости науки . Проверено 1 декабря 2016 г.
^ Антонакис, Джон (февраль 2017 г.). «Как улучшить науку: от восторга открытия до политических последствий» (PDF) . Ежеквартальный журнал «Лидерство» . 28 (1): 5–21. дои : 10.1016/j.leaqua.2017.01.006 .
↑ Перейти обратно: Перейти обратно: ^а ^б ^с Вассерштейн, Рональд Л.; Лазар, Николь А. (2 апреля 2016 г.). «Заявление ASA о p-значениях: контекст, процесс и цель» . Американский статистик . 70 (2): 129–133. дои : 10.1080/00031305.2016.1154108 .
^ Гарсиа-Перес, Мигель А. (05 октября 2016 г.). «Не лжесвидетельствуй против проверки значимости нулевой гипотезы» . Образовательные и психологические измерения . 77 (4): 631–662. дои : 10.1177/0013164416668232 . ISSN 0013-1644 . ПМЦ 5991793 . ПМИД 30034024 .
^ Иоаннидис, Джон П.А.; Уэр, Дженнифер Дж.; Вагенмейкерс, Эрик-Ян; Симонсон, Ури; Чемберс, Кристофер Д.; Баттон, Кэтрин С.; Бишоп, Дороти В.М.; Носек, Брайан А.; Мунафо, Маркус Р. (январь 2017 г.). «Манифест воспроизводимой науки» . Природа человеческого поведения . 1 (1): 0021. doi : 10.1038/s41562-016-0021 . ПМЦ 7610724 . ПМИД 33954258 .
^ Бенджамин, Дэниел; и др. (2018). «Переопределить статистическую значимость» . Природа человеческого поведения . 1 (1): 6–10. дои : 10.1038/s41562-017-0189-z . hdl : 10281/184094 . ПМИД 30980045 .
^ Чавла, Далмит (2017). « Единый порог для значений P в условиях пожара» . Природа . дои : 10.1038/nature.2017.22625 .
^ Амрайн, Валентин; Гренландия, Сандер (2017). «Удалить, а не переопределить статистическую значимость». Природа человеческого поведения . 2 (1): 0224. doi : 10.1038/s41562-017-0224-0 . ПМИД 30980046 . S2CID 46814177 .
^ Вайс, Стюарт (ноябрь 2017 г.). «Перемещение статистических целей науки» . csicop.org . CSI . Проверено 10 июля 2018 г.
^ МакШейн, Блейк; Гренландия, Сандер; Амрайн, Валентин (март 2019 г.). «Ученые восстают против статистической значимости» . Природа . 567 (7748): 305–307. Бибкод : 2019Natur.567..305A . дои : 10.1038/d41586-019-00857-9 . ПМИД 30894741 .
^ Вассерштейн, Рональд Л.; Ширм, Аллен Л.; Лазар, Николь А. (20 марта 2019 г.). «Переход в мир за пределами «p <0,05» » . Американский статистик . 73 (доп1): 1–19. дои : 10.1080/00031305.2019.1583913 .

Дальнейшее чтение [ править ]

Лидия Денворт, «Значительная проблема: стандартные научные методы подвергаются критике. Изменится ли что-нибудь?», Scientific American , vol. 321, нет. 4 (октябрь 2019 г.), стр. 62–67. «Использование p значений в течение почти столетия [с 1925 года] для определения статистической значимости экспериментальных результатов способствовало возникновению иллюзии уверенности и [к] кризисам воспроизводимости во многих научных областях . Растет решимость реформировать статистический анализ... Некоторые [исследователи] предлагают изменить статистические методы, тогда как другие готовы отказаться от порога для определения «значимых» результатов». (стр. 63.)
Зилиак, Стивен и Дейдра Макклоски (2008), Культ статистической значимости: как стандартная ошибка обходится нам в рабочие места, правосудие и жизни. Архивировано 8 июня 2010 г. в Wayback Machine . Анн-Арбор, издательство Мичиганского университета , 2009. ISBN 978-0-472-07007-7 . Отзывы и прием: (составлено Зилиаком)
Томпсон, Брюс (2004). «Кризис «значения» в психологии и образовании». Журнал социально-экономики . 33 (5): 607–613. дои : 10.1016/j.socec.2004.09.034 .
Чоу, Сиу Л. (1996). Статистическая значимость: обоснование, достоверность и полезность. Архивировано 3 декабря 2013 г. в Wayback Machine , том 1 серии « Введение в статистические методы», Sage Publications Ltd. ISBN 978-0-7619-5205-3 - утверждает, что статистическая значимость полезна при определенных обстоятельствах.
Клайн, Рекс (2004). Помимо тестирования значимости: реформирование методов анализа данных в поведенческих исследованиях Вашингтон, округ Колумбия: Американская психологическая ассоциация.
Нуццо, Регина (2014). Научный метод: Статистические ошибки . Природа Том. 506, с. 150-152 (открытый доступ). Выявляет распространенные заблуждения относительно значения p.
Коэн, Джозеф (1994). [1] Архивировано 13 июля 2017 г. в Wayback Machine . Земля круглая (p<0,05). Американский психолог. Том 49, с. 997-1003. Рассматривает проблемы статистического тестирования нулевой гипотезы.
Амрайн, Валентин; Гренландия, Сандер; МакШейн, Блейк (20 марта 2019 г.). «Ученые восстают против статистической значимости» . Природа . 567 (7748): 305–307. Бибкод : 2019Natur.567..305A . дои : 10.1038/d41586-019-00857-9 . ПМИД 30894741 .

Внешние ссылки [ править ]

Статья « Самые ранние известные варианты использования некоторых математических слов (S) » содержит статью «Значение», в которой содержится некоторая историческая информация.
« Концепция тестирования статистической значимости. Архивировано 7 сентября 2022 г. в Wayback Machine » (февраль 1994 г.): статья Брюса Томпона, размещенная Информационным центром ERIC по оценке и оценке, Вашингтон, округ Колумбия.
« Что значит, чтобы результат был «статистически значимым»? » (без даты): статья Службы статистической оценки Университета Джорджа Мейсона, Вашингтон, округ Колумбия.

[Sirkin-1] Перейти обратно: Перейти обратно: ^а ^б ^с Сиркин, Р. Марк (2005). «Двухвыборочные t-тесты». Статистика для социальных наук (3-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications, Inc., стр. 271–316. ISBN 978-1-4129-0546-6 .

[Borror-2] Перейти обратно: Перейти обратно: ^а ^б Боррор, Конни М. (2009). «Принятие статистических решений». Справочник сертифицированного инженера по качеству (3-е изд.). Милуоки, Висконсин: ASQ Quality Press. стр. 418–472. ISBN 978-0-87389-745-7 .

[Myers_et_al-p65-3] Перейти обратно: Перейти обратно: ^а ^б Майерс, Джером Л.; Ну, Арнольд Д.; Лорх, Роберт Ф. младший (2010). «Разработка основ проверки гипотез с использованием биномиального распределения». План исследования и статистический анализ (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 65–90. ISBN 978-0-8058-6431-1 .

[Dalgaard-4] Перейти обратно: Перейти обратно: ^а ^б Далгаард, Питер (2008). «Мощность и расчет размера выборки». Вводная статистика с R . Статистика и вычисления. Нью-Йорк: Спрингер. стр. 155–56. дои : 10.1007/978-0-387-79054-1_9 . ISBN 978-0-387-79053-4 .

[:0-5] Перейти обратно: Перейти обратно: ^а ^б «Статистическая проверка гипотез» . www.dartmouth.edu . Архивировано из оригинала 2 августа 2020 г. Проверено 11 ноября 2019 г.

[Johnson-6] Джонсон, Вален Э. (9 октября 2013 г.). «Пересмотренные стандарты статистических данных» . Труды Национальной академии наук . 110 (48): 19313–19317. Бибкод : 2013PNAS..11019313J . дои : 10.1073/pnas.1313476110 . ПМЦ 3845140 . ПМИД 24218581 .

[Redmond_and_Colton-7] Редмонд, Кэрол; Колтон, Теодор (2001). «Клиническая значимость против статистической значимости». Биостатистика в клинических исследованиях . Справочная серия Wiley по биостатистике (3-е изд.). Западный Суссекс, Соединенное Королевство: John Wiley & Sons Ltd., стр. 35–36. ISBN 978-0-471-82211-0 .

[Cumming-p27-8] Камминг, Джефф (2012). Понимание новой статистики: размеры эффекта, доверительные интервалы и метаанализ . Нью-Йорк, США: Рутледж. стр. 27–28.

[Krzywinski_and_Altman-9] Кшивинский, Мартин; Альтман, Наоми (30 октября 2013 г.). «Точки значимости: значимость, значения P и t-критерии» . Природные методы . 10 (11): 1041–1042. дои : 10.1038/nmeth.2698 . ПМИД 24344377 .

[Sham_and_Purcell-10] Шам, Пак К.; Перселл, Шон М. (17 апреля 2014 г.). «Тестирование статистической мощности и значимости в крупномасштабных генетических исследованиях». Обзоры природы Генетика . 15 (5): 335–346. дои : 10.1038/nrg3706 . ПМИД 24739678 . S2CID 10961123 .

[Altman-11] Альтман, Дуглас Г. (1999). Практическая статистика медицинских исследований . Нью-Йорк, США: Chapman & Hall/CRC. стр. 167 . ISBN 978-0-412-27630-9 .

[Devore-12] Перейти обратно: Перейти обратно: ^а ^б Девор, Джей Л. (2011). Вероятность и статистика для техники и наук (8-е изд.). Бостон, Массачусетс: Cengage Learning. стр. 300–344. ISBN 978-0-538-73352-6 .

[Salkind-13] Крапаро, Роберт М. (2007). «Уровень значимости». В Салкинде, Нил Дж. (ред.). Энциклопедия измерений и статистики . Том. 3. Таузенд-Оукс, Калифорния: Публикации SAGE. стр. 889–891. ISBN 978-1-4129-1611-0 .

[Sproull-14] Спроролл, Натали Л. (2002). «Проверка гипотез» . Справочник по методам исследования: Руководство для практиков и студентов социальных наук (2-е изд.). Лэнхэм, Мэриленд: Scarecrow Press, Inc., стр. 49–64 . ISBN 978-0-8108-4486-5 .

[Babbie2-15] Бэбби, Эрл Р. (2013). «Логика выборки». Практика социальных исследований (13-е изд.). Бельмонт, Калифорния: Cengage Learning. стр. 185–226. ISBN 978-1-133-04979-1 .

[Faherty-16] Фаэрти, Винсент (2008). «Вероятность и статистическая значимость». Сострадательная статистика: прикладной количественный анализ для социальных служб (с упражнениями и инструкциями в SPSS) (1-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications, Inc., стр. 127–138. ISBN 978-1-4129-3982-9 .

[McKillup-17] МакКиллуп, Стив (2006). «Вероятность помогает вам принять решение о ваших результатах» . Объясненная статистика: Вводное руководство для ученых-биологов (1-е изд.). Кембридж, Соединенное Королевство: Издательство Кембриджского университета. стр. 44–56 . ISBN 978-0-521-54316-3 .

[Myers_et_al-p124-18] Майерс, Джером Л.; Ну, Арнольд Д.; Лорх, Роберт Ф. младший (2010). «Т-дистрибутив и его приложения». План исследования и статистический анализ (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 124–153. ISBN 978-0-8058-6431-1 .

[:1-19] Перейти обратно: Перейти обратно: ^а ^б Хупер, Питер. «Что такое P-значение?» (PDF) . Университет Альберты, факультет математических и статистических наук . Архивировано из оригинала (PDF) 31 марта 2020 г. Проверено 10 ноября 2019 г.

[20] Люнг, В.-К. (01.03.2001). «Баланс статистической и клинической значимости в оценке эффектов лечения» . Последипломный медицинский журнал . 77 (905): 201–204. дои : 10.1136/pmj.77.905.201 . ISSN 0032-5473 . ПМК 1741942 . ПМИД 11222834 .

[21] Брайан, Эрик; Джейссон, Мари (2007). «Физико-теология и математика (1710–1794)». Изменение соотношения полов человека при рождении . Springer Science & Business Media. стр. 1–25. ISBN 978-1-4020-6036-6 .

[22] Джон Арбутнот (1710). «Аргумент в пользу Божественного Провидения, основанный на постоянной регулярности рождаемости у представителей обоих полов» (PDF) . Философские труды Лондонского королевского общества . 27 (325–336): 186–190. дои : 10.1098/rstl.1710.0011 .

[Conover1999-23] Коновер, WJ (1999), «Глава 3.4: Знаковый тест», Практическая непараметрическая статистика (Третье изд.), Wiley, стр. 157–176, ISBN 978-0-471-16068-7

[Sprent1989-24] Срент, П. (1989), Прикладные непараметрические статистические методы (второе изд.), Chapman & Hall, ISBN 978-0-412-44980-2

[25] Стиглер, Стивен М. (1986). История статистики: измерение неопределенности до 1900 года . Издательство Гарвардского университета. стр. 225–226 . ISBN 978-0-674-40341-3 .

[Bellhouse2001-26] Беллхаус, Дэвид (2001), «Джон Арбутнот», в книге «Статистики столетий» К. К. Хейда и Э. Сенеты , Спрингер, стр. 39–42, ISBN 978-0-387-95329-8

[Hald1998-27] Хальд, Андерс (1998), «Глава 4. Случайность или замысел: критерии значимости», История математической статистики с 1750 по 1930 год , Wiley, стр. 65

[Cumming-28] Камминг, Джефф (2011). «От значимости нулевой гипотезы к величине эффекта тестирования». Понимание новой статистики: размеры эффекта, доверительные интервалы и метаанализ . Серия многомерных приложений. Восточный Суссекс, Великобритания: Рутледж. стр. 21–52. ISBN 978-0-415-87968-2 .

[Fisher1925-29] Фишер, Рональд А. (1925). Статистические методы для научных работников . Эдинбург, Великобритания: Оливер и Бойд. стр. 43 . ISBN 978-0-05-002170-5 .

[Poletiek-30] Полетик, Фенна Х. (2001). «Формальные теории тестирования». Поведение при проверке гипотез . Очерки когнитивной психологии (1-е изд.). Восточный Суссекс, Соединенное Королевство: Psychology Press. стр. 29–48. ISBN 978-1-84169-159-6 .

[Quinn-31] Перейти обратно: Перейти обратно: ^а ^б ^с Куинн, Джеффри Р.; Кио, Майкл Дж. (2002). Экспериментальный дизайн и анализ данных для биологов (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 46–69 . ISBN 978-0-521-00976-8 .

[Neyman-32] Нейман, Дж.; Пирсон, ES (1933). «Проверка статистических гипотез в отношении априорных вероятностей». Математические труды Кембриджского философского общества . 29 (4): 492–510. Бибкод : 1933PCPS...29..492N . дои : 10.1017/S030500410001152X . S2CID 119855116 .

[33] "Выводы о статистической значимости возможны с помощью доверительного интервала. Если доверительный интервал не включает в себя значение нулевого эффекта, можно предположить, что имеется статистически значимый результат." Прель, Жан-Баптист ты; Хоммель, Герхард; Рериг, Бернд; Блеттнер, Мария (2009). «Доверительный интервал или P-значение?» . Немецкий медицинский журнал онлайн . 106 (19): 335–9. дои : 10.3238/arztebl.2009.0335 . ПМЦ 2689604 . ПМИД 19547734 .

[34] StatNews № 73: Перекрывающиеся доверительные интервалы и статистическая значимость

[Neyman1937-35] Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей». Философские труды Королевского общества А. 236 (767): 333–380. Бибкод : 1937RSPTA.236..333N . дои : 10.1098/rsta.1937.0005 . JSTOR 91337 . S2CID 19584450 .

[Meier-36] Мейер, Кеннет Дж.; Брудни, Джеффри Л.; Боте, Джон (2011). Прикладная статистика для государственного и некоммерческого управления (3-е изд.). Бостон, Массачусетс: Cengage Learning. стр. 189–209. ISBN 978-1-111-34280-7 .

[Healy2009-37] Хили, Джозеф Ф. (2009). Основы статистики: инструмент социальных исследований (2-е изд.). Бельмонт, Калифорния: Cengage Learning. стр. 177–205. ISBN 978-0-495-60143-2 .

[Healy2006-38] МакКиллуп, Стив (2006). Объясненная статистика: Вводное руководство для ученых-биологов (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 32–38 . ISBN 978-0-521-54316-3 .

[Heath-39] Здоровье, Дэвид (1995). Введение в экспериментальный дизайн и статистику для биологии (1-е изд.). Бостон, Массачусетс: CRC Press. стр. 123–154. ISBN 978-1-85728-132-3 .

[Hinton_2014-40] Хинтон, Перри Р. (2010). «Значение, ошибка и сила». Объяснение статистики (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 79–90. ISBN 978-1-84872-312-2 .

[Vaughan-41] Воган, Саймон (2013). Научный вывод: обучение на основе данных (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 146–152. ISBN 978-1-107-02482-3 .

[Bracken-42] Перейти обратно: Перейти обратно: ^а ^б Бракен, Майкл Б. (2013). Риск, шанс и причинно-следственная связь: исследование происхождения и лечение заболеваний (1-е изд.). Нью-Хейвен, Коннектикут: Издательство Йельского университета. стр. 260–276 . ISBN 978-0-300-18884-4 .

[franklin-43] Франклин, Аллан (2013). «Пролог: Возникновение сигм». Изменение стандартов: эксперименты по физике элементарных частиц в двадцатом веке (1-е изд.). Питтсбург, Пенсильвания: Издательство Питтсбургского университета. стр. Ii–III. ISBN 978-0-8229-4430-0 .

[Clarke_et_al-44] Кларк, генеральный директор; Андерсон, Калифорния; Петтерссон, Ф.Х.; Кардон, ЛР; Моррис, AP; Зондерван, КТ (6 февраля 2011 г.). «Базовый статистический анализ в генетических исследованиях случай-контроль» . Протоколы природы . 6 (2): 121–33. дои : 10.1038/nprot.2010.182 . ПМК 3154648 . ПМИД 21293453 .

[Barsh_et_al-45] Барш, Г.С.; Копенхейвер, врач общей практики; Гибсон, Дж; Уильямс, С.М. (5 июля 2012 г.). «Руководство по полногеномным исследованиям ассоциаций» . ПЛОС Генетика . 8 (7): e1002812. дои : 10.1371/journal.pgen.1002812 . ПМК 3390399 . ПМИД 22792080 .

[Carver-46] Карвер, Рональд П. (1978). «Дело против проверки статистической значимости». Гарвардский обзор образования . 48 (3): 378–399. дои : 10.17763/haer.48.3.t490261645281841 . S2CID 16355113 .

[Ioannidis-47] Иоаннидис, Джон П.А. (2005). «Почему большинство опубликованных результатов исследований являются ложными» . ПЛОС Медицина . 2 (8): е124. дои : 10.1371/journal.pmed.0020124 . ПМЦ 1182327 . ПМИД 16060722 .

[peerj.com-48] Перейти обратно: Перейти обратно: ^а ^б Амрайн, Валентин; Корнер-Нивергельт, Фрэнци; Рот, Тобиас (2017). «Земля плоская (p > 0,05): пороги значимости и кризис невоспроизводимых исследований» . ПерДж . 5 : е3544. дои : 10.7717/peerj.3544 . ПМК 5502092 . ПМИД 28698825 .

[A_Visitor’s_Guide_to_Effect_Sizes-49] Перейти обратно: Перейти обратно: ^а ^б Ходжат, Мохаммадреза; Сюй, Банда (2004). «Руководство для посетителей по размерам эффектов». Достижения в области медицинских наук. Образование . 9 (3): 241–9. doi : 10.1023/B:AHSE.0000038173.00909.f6 . ПМИД 15316274 . S2CID 8045624 .

[Pedhazur-50] Педазур, Элазар Дж.; Шмелькин, Лиора П. (1991). Измерение, проектирование и анализ: интегрированный подход (под ред. Студента). Нью-Йорк, штат Нью-Йорк: Psychology Press. стр. 180–210. ISBN 978-0-8058-1063-9 .

[51] Стахель, Вернер (2016). «Статистическая проблема воспроизводимости». Принципы, проблемы, практика и перспективы Воспроизводимость: принципы, проблемы, практика и перспективы : 87–114. дои : 10.1002/9781118865064.ch5 . ISBN 978-1-118-86497-5 .

[52] «Серия семинаров CSSME: спор о p -значениях и парадигма проверки значимости нулевой гипотезы (NHST)» . www.education.leeds.ac.uk . Школа образования Университета Лидса . Проверено 1 декабря 2016 г.

[53] Новелла, Стивен (25 февраля 2015 г.). «Психологический журнал запрещает тестирование значимости» . Научная медицина.

[54] Вулстон, Крис (05 марта 2015 г.). «Журнал по психологии запрещает значения P» . Природа . 519 (7541): 9. Бибкод : 2015Natur.519....9W . дои : 10.1038/519009f .

[55] Зигфрид, Том (17 марта 2015 г.). «Запрет P-значения: маленький шаг для журнала, гигантский скачок для науки» . Новости науки . Проверено 1 декабря 2016 г.

[56] Антонакис, Джон (февраль 2017 г.). «Как улучшить науку: от восторга открытия до политических последствий» (PDF) . Ежеквартальный журнал «Лидерство» . 28 (1): 5–21. дои : 10.1016/j.leaqua.2017.01.006 .

[Wasserstein_129–133-57] Перейти обратно: Перейти обратно: ^а ^б ^с Вассерштейн, Рональд Л.; Лазар, Николь А. (2 апреля 2016 г.). «Заявление ASA о p-значениях: контекст, процесс и цель» . Американский статистик . 70 (2): 129–133. дои : 10.1080/00031305.2016.1154108 .

[58] Гарсиа-Перес, Мигель А. (05 октября 2016 г.). «Не лжесвидетельствуй против проверки значимости нулевой гипотезы» . Образовательные и психологические измерения . 77 (4): 631–662. дои : 10.1177/0013164416668232 . ISSN 0013-1644 . ПМЦ 5991793 . ПМИД 30034024 .

[59] Иоаннидис, Джон П.А.; Уэр, Дженнифер Дж.; Вагенмейкерс, Эрик-Ян; Симонсон, Ури; Чемберс, Кристофер Д.; Баттон, Кэтрин С.; Бишоп, Дороти В.М.; Носек, Брайан А.; Мунафо, Маркус Р. (январь 2017 г.). «Манифест воспроизводимой науки» . Природа человеческого поведения . 1 (1): 0021. doi : 10.1038/s41562-016-0021 . ПМЦ 7610724 . ПМИД 33954258 .

[60] Бенджамин, Дэниел; и др. (2018). «Переопределить статистическую значимость» . Природа человеческого поведения . 1 (1): 6–10. дои : 10.1038/s41562-017-0189-z . hdl : 10281/184094 . ПМИД 30980045 .

[61] Чавла, Далмит (2017). « Единый порог для значений P в условиях пожара» . Природа . дои : 10.1038/nature.2017.22625 .

[62] Амрайн, Валентин; Гренландия, Сандер (2017). «Удалить, а не переопределить статистическую значимость». Природа человеческого поведения . 2 (1): 0224. doi : 10.1038/s41562-017-0224-0 . ПМИД 30980046 . S2CID 46814177 .

[63] Вайс, Стюарт (ноябрь 2017 г.). «Перемещение статистических целей науки» . csicop.org . CSI . Проверено 10 июля 2018 г.

[64] МакШейн, Блейк; Гренландия, Сандер; Амрайн, Валентин (март 2019 г.). «Ученые восстают против статистической значимости» . Природа . 567 (7748): 305–307. Бибкод : 2019Natur.567..305A . дои : 10.1038/d41586-019-00857-9 . ПМИД 30894741 .

[Wasserstein2_129–133-65] Вассерштейн, Рональд Л.; Ширм, Аллен Л.; Лазар, Николь А. (20 марта 2019 г.). «Переход в мир за пределами «p <0,05» » . Американский статистик . 73 (доп1): 1–19. дои : 10.1080/00031305.2019.1583913 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]