Jump to content

Статистическая значимость

При проверке статистических гипотез [1] [2] результат имеет статистическую значимость , если результат, по крайней мере, как «экстремальный», был бы очень редким, если бы нулевая гипотеза была верной. [3] исследования Точнее, определенный уровень значимости , обозначаемый , — вероятность того, что исследование отвергнет нулевую гипотезу при условии, что нулевая гипотеза верна; [4] и p -значение результата, , — вероятность получения хотя бы столь же экстремального результата при условии, что нулевая гипотеза верна. [5] Результат является статистически значимым по стандартам исследования, когда . [6] [7] [8] [9] [10] [11] [12] Уровень значимости для исследования выбирается до сбора данных и обычно устанавливается на уровне 5%. [13] или намного ниже — в зависимости от области исследования. [14]

В любом эксперименте или наблюдении , предполагающем взятие выборки из популяции , всегда существует вероятность того, что наблюдаемый эффект возник бы только из-за ошибки выборки . [15] [16] Но если значение p наблюдаемого эффекта меньше (или равно) уровню значимости, исследователь может заключить, что эффект отражает характеристики всей популяции. [1] тем самым отвергая нулевую гипотезу. [17]

Этот метод проверки статистической значимости результатов был разработан в начале 20 века. Термин «значимость» здесь не подразумевает важность, а термин «статистическая значимость» — это не то же самое, что исследовательская значимость, теоретическая значимость или практическая значимость. [1] [2] [18] [19] Например, термин «клиническая значимость» относится к практической значимости эффекта лечения. [20]

Статистическая значимость восходит к 18 веку, в работе Джона Арбетнота и Пьера-Симона Лапласа , которые вычислили p значение для соотношения полов человека при рождении, приняв нулевую гипотезу о равной вероятности рождения мальчиков и девочек; см. в разделе p -value § История . подробности [21] [22] [23] [24] [25] [26] [27]

В 1925 году Рональд Фишер выдвинул идею проверки статистических гипотез, которую он назвал «тестами значимости», в своей публикации « Статистические методы для научных работников» . [28] [29] [30] Фишер предложил вероятность один из двадцати (0,05) в качестве удобного порогового уровня для отклонения нулевой гипотезы. [31] В статье 1933 года Ежи Нейман и Эгон Пирсон назвали этот порог уровнем значимости , который они назвали . Они рекомендовали, чтобы быть установлены заранее, до начала любого сбора данных. [31] [32]

Несмотря на первоначальное предложение 0,05 в качестве уровня значимости, Фишер не собирался фиксировать это пороговое значение. В своей публикации 1956 года «Статистические методы и научные выводы» он рекомендовал устанавливать уровни значимости в соответствии с конкретными обстоятельствами. [31]

[ редактировать ]

Уровень значимости является порогом для ниже которого нулевая гипотеза отвергается, хотя по предположению она верна, и происходит что-то еще. Это означает, что также вероятность ошибочного отклонения нулевой гипотезы, если нулевая гипотеза верна. [4] Это также называется ложным срабатыванием и ошибкой I типа .

Иногда вместо этого исследователи говорят об уровне достоверности γ = (1 − α ) . Это вероятность не отвергнуть нулевую гипотезу при условии, что она верна. [33] [34] Доверительные уровни и доверительные интервалы были введены Нейманом в 1937 году. [35]

Роль в проверке статистических гипотез

[ редактировать ]
В двустороннем тесте область отклонения для уровня значимости α = 0,05 разделена на оба конца выборочного распределения и составляет 5% площади под кривой (белые области).

Статистическая значимость играет ключевую роль в проверке статистических гипотез. Он используется для определения того, нулевую гипотезу следует ли отклонить или сохранить . Нулевая гипотеза – это гипотеза о том, что в изучаемом явлении не существует никакого эффекта. [36] Чтобы нулевая гипотеза была отклонена, наблюдаемый результат должен быть статистически значимым, т. е. наблюдаемое значение p меньше заранее заданного уровня значимости. .

Чтобы определить, является ли результат статистически значимым, исследователь рассчитывает значение p , которое представляет собой вероятность наблюдения эффекта той же величины или более экстремального при условии, что нулевая гипотеза верна. [5] [12] Нулевая гипотеза отклоняется, если значение p меньше (или равно) заранее определенного уровня, . также называется уровнем значимости и представляет собой вероятность отклонения нулевой гипотезы при условии, что она верна ( ошибка I рода ). Обычно он устанавливается на уровне 5% или ниже.

Например, когда установлена ​​равной 5%, условная вероятность , ошибки I рода при условии, что нулевая гипотеза верна , равна 5%, [37] и статистически значимым результатом является тот, в котором наблюдаемое значение p меньше (или равно) 5%. [38] При извлечении данных из выборки это означает, что область отклонения составляет 5% распределения выборки . [39] Эти 5% могут быть распределены по одной стороне выборочного распределения, как в одностороннем тесте , или разделены на обе стороны распределения, как в двустороннем тесте , при этом каждый хвост (или область отклонения) содержит 2,5% распределения.

Использование одностороннего теста зависит от того, указывает ли исследовательский вопрос или альтернативная гипотеза ли группа объектов направление, например, тяжелее успевают учащиеся при оценке или лучше . [3] Двусторонний тест по-прежнему можно использовать, но он будет менее эффективным , чем односторонний тест, поскольку область отклонения для одностороннего теста сосредоточена на одном конце нулевого распределения и в два раза больше (5% против 0,2,5%) каждой области отклонения для двустороннего теста. В результате нулевая гипотеза может быть отклонена с менее экстремальным результатом, если использовался односторонний критерий. [40] Односторонний критерий более эффективен, чем двусторонний тест, только если указанное направление альтернативной гипотезы верно. Однако если оно неверно, то односторонний тест не имеет силы.

Пороги значимости в конкретных областях

[ редактировать ]

В конкретных областях, таких как физика элементарных частиц и производство , статистическая значимость часто выражается в виде кратных стандартному отклонению или сигме ( σ ) нормального распределения , при этом пороговые значения значимости устанавливаются на гораздо более строгом уровне (например, 5 σ ). [41] [42] Например, уверенность в существовании частицы бозона Хиггса была основана на критерии 5 σ , который соответствует значению p примерно 1 на 3,5 миллиона. [42] [43]

В других областях научных исследований, таких как полногеномные исследования ассоциаций , уровни значимости составляют всего 5 × 10. −8 не редкость [44] [45] — так как количество проводимых тестов чрезвычайно велико.

Ограничения

[ редактировать ]

Исследователи, сосредоточенные исключительно на том, являются ли их результаты статистически значимыми, могут сообщать о результатах, которые не являются существенными. [46] и не воспроизводимы. [47] [48] Существует также разница между статистической значимостью и практической значимостью. Исследование, которое признано статистически значимым, не обязательно может быть практически значимым. [49] [19]

Размер эффекта

[ редактировать ]

Размер эффекта является мерой практической значимости исследования. [49] Статистически значимый результат может иметь слабый эффект. Чтобы оценить исследовательскую значимость своего результата, исследователям рекомендуется всегда сообщать о величине эффекта вместе с p -значениями. Мера размера эффекта количественно определяет силу эффекта, например, расстояние между двумя средними значениями в единицах стандартного отклонения (см. d Коэна ), коэффициент корреляции между двумя переменными или его квадрат и другие меры. [50]

Воспроизводимость

[ редактировать ]

Статистически значимый результат может быть нелегко воспроизвести. [48] В частности, некоторые статистически значимые результаты на самом деле будут ложноположительными. Каждая неудачная попытка воспроизвести результат увеличивает вероятность того, что результат окажется ложноположительным. [51]

Проблемы

[ редактировать ]

Чрезмерное использование в некоторых журналах

[ редактировать ]

Начиная с 2010-х годов некоторые журналы начали задаваться вопросом, не слишком ли сильно полагаются на тестирование значимости, особенно на использование порога α = 5%, как на основной критерий достоверности гипотезы. [52] Некоторые журналы призывали авторов проводить более подробный анализ, чем просто тест статистической значимости. В области социальной психологии журнал « Базовая и прикладная социальная психология» вообще запретил использование тестирования значимости в опубликованных им статьях. [53] требование от авторов использовать другие меры для оценки гипотез и воздействия. [54] [55]

Другие редакторы, комментируя этот запрет, отметили: «Запрет сообщения о p -значениях, как это недавно сделала «Базовая и прикладная социальная психология», не решит проблему, поскольку он просто лечит симптом проблемы. В этом нет ничего плохого. с проверкой гипотез и p -значениями как таковыми, если авторы, рецензенты и редакторы действий используют их правильно». [56] Некоторые статистики предпочитают использовать альтернативные меры доказательства, такие как отношения правдоподобия или факторы Байеса . [57] Использование байесовской статистики позволяет избежать уровней достоверности, но также требует принятия дополнительных предположений. [57] и не обязательно может улучшить практику статистического тестирования. [58]

Широко распространенное злоупотребление статистической значимостью представляет собой важную тему исследований в области метанауки . [59]

Переосмысление значения

[ редактировать ]

В 2016 году Американская статистическая ассоциация (ASA) опубликовала заявление о значениях p , в котором говорилось, что «широко распространенное использование «статистической значимости» (обычно интерпретируемой как « p ≤ 0,05») в качестве лицензии на утверждение научных результатов (или подразумеваемая истина) приводит к значительному искажению научного процесса». [57] В 2017 году группа из 72 авторов предложила повысить воспроизводимость, изменив p с 0,05 на 0,005. порог статистической значимости значения [60] Другие исследователи ответили, что введение более строгого порога значимости усугубит такие проблемы, как сбор данных ; Таким образом, альтернативные предложения заключаются в выборе и обосновании гибких пороговых значений p -значения перед сбором данных, [61] или интерпретировать значения p как непрерывные индексы, тем самым игнорируя пороговые значения и статистическую значимость. [62] Кроме того, изменение значения на 0,005 увеличит вероятность ложноотрицательных результатов, в результате чего изучаемый эффект реален, но тест не может его показать. [63]

В 2019 году более 800 статистиков и ученых подписали обращение с призывом отказаться от термина «статистическая значимость» в науке. [64] и ASA опубликовало еще одно официальное заявление [65] заявляя (стр. 2):

На основе нашего обзора статей в этом специальном выпуске и более широкой литературы мы пришли к выводу, что пришло время полностью прекратить использование термина «статистически значимый». Также не следует использовать такие варианты, как «значительно отличаются», «,» и «незначимый» сохраняются, независимо от того, выражены ли они словами, звездочками в таблице или каким-либо другим способом.

См. также

[ редактировать ]
  1. ^ Jump up to: а б с Сиркин, Р. Марк (2005). «Двухвыборочные t-тесты». Статистика для социальных наук (3-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications, Inc., стр. 271–316. ISBN  978-1-4129-0546-6 .
  2. ^ Jump up to: а б Боррор, Конни М. (2009). «Принятие статистических решений». Справочник сертифицированного инженера по качеству (3-е изд.). Милуоки, Висконсин: ASQ Quality Press. стр. 418–472. ISBN  978-0-87389-745-7 .
  3. ^ Jump up to: а б Майерс, Джером Л.; Ну, Арнольд Д.; Лорч, Роберт Ф. младший (2010). «Разработка основ проверки гипотез с использованием биномиального распределения». Дизайн исследования и статистический анализ (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 65–90. ISBN  978-0-8058-6431-1 .
  4. ^ Jump up to: а б Далгаард, Питер (2008). «Мощность и расчет размера выборки». Вводная статистика с R . Статистика и вычисления. Нью-Йорк: Спрингер. стр. 155–56. дои : 10.1007/978-0-387-79054-1_9 . ISBN  978-0-387-79053-4 .
  5. ^ Jump up to: а б «Статистическая проверка гипотез» . www.dartmouth.edu . Архивировано из оригинала 2 августа 2020 г. Проверено 11 ноября 2019 г.
  6. ^ Джонсон, Вален Э. (9 октября 2013 г.). «Пересмотренные стандарты статистических данных» . Труды Национальной академии наук . 110 (48): 19313–19317. Бибкод : 2013PNAS..11019313J . дои : 10.1073/pnas.1313476110 . ПМЦ   3845140 . ПМИД   24218581 .
  7. ^ Редмонд, Кэрол; Колтон, Теодор (2001). «Клиническая значимость против статистической значимости». Биостатистика в клинических исследованиях . Справочная серия Wiley по биостатистике (3-е изд.). Западный Суссекс, Соединенное Королевство: John Wiley & Sons Ltd., стр. 35–36. ISBN  978-0-471-82211-0 .
  8. ^ Камминг, Джефф (2012). Понимание новой статистики: размеры эффекта, доверительные интервалы и метаанализ . Нью-Йорк, США: Рутледж. стр. 27–28.
  9. ^ Кшивинский, Мартин; Альтман, Наоми (30 октября 2013 г.). «Точки значимости: значимость, значения P и t-критерии» . Природные методы . 10 (11): 1041–1042. дои : 10.1038/nmeth.2698 . ПМИД   24344377 .
  10. ^ Шам, Пак К.; Перселл, Шон М. (17 апреля 2014 г.). «Тестирование статистической мощности и значимости в крупномасштабных генетических исследованиях». Обзоры природы Генетика . 15 (5): 335–346. дои : 10.1038/nrg3706 . ПМИД   24739678 . S2CID   10961123 .
  11. ^ Альтман, Дуглас Г. (1999). Практическая статистика медицинских исследований . Нью-Йорк, США: Chapman & Hall/CRC. стр. 167 . ISBN  978-0-412-27630-9 .
  12. ^ Jump up to: а б Девор, Джей Л. (2011). Вероятность и статистика для техники и наук (8-е изд.). Бостон, Массачусетс: Cengage Learning. стр. 300–344. ISBN  978-0-538-73352-6 .
  13. ^ Крапаро, Роберт М. (2007). «Уровень значимости». В Салкинде, Нил Дж. (ред.). Энциклопедия измерений и статистики . Том. 3. Таузенд-Оукс, Калифорния: Публикации SAGE. стр. 889–891. ISBN  978-1-4129-1611-0 .
  14. ^ Спроролл, Натали Л. (2002). «Проверка гипотез» . Справочник по методам исследования: Руководство для практиков и студентов социальных наук (2-е изд.). Лэнхэм, Мэриленд: Scarecrow Press, Inc., стр. 49–64 . ISBN  978-0-8108-4486-5 .
  15. ^ Бэбби, Эрл Р. (2013). «Логика выборки». Практика социальных исследований (13-е изд.). Бельмонт, Калифорния: Cengage Learning. стр. 185–226. ISBN  978-1-133-04979-1 .
  16. ^ Фаэрти, Винсент (2008). «Вероятность и статистическая значимость». Сострадательная статистика: прикладной количественный анализ для социальных служб (с упражнениями и инструкциями в SPSS) (1-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications, Inc., стр. 127–138. ISBN  978-1-4129-3982-9 .
  17. ^ МакКиллуп, Стив (2006). «Вероятность помогает вам принять решение о ваших результатах» . Объясненная статистика: Вводное руководство для ученых-биологов (1-е изд.). Кембридж, Соединенное Королевство: Издательство Кембриджского университета. стр. 44–56 . ISBN  978-0-521-54316-3 .
  18. ^ Майерс, Джером Л.; Ну, Арнольд Д.; Лорч, Роберт Ф. младший (2010). «Т-дистрибутив и его приложения». План исследования и статистический анализ (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 124–153. ISBN  978-0-8058-6431-1 .
  19. ^ Jump up to: а б Хупер, Питер. «Что такое P-значение?» (PDF) . Университет Альберты, факультет математических и статистических наук . Архивировано из оригинала (PDF) 31 марта 2020 г. Проверено 10 ноября 2019 г.
  20. ^ Люнг, В.-К. (01.03.2001). «Баланс статистической и клинической значимости в оценке эффектов лечения» . Последипломный медицинский журнал . 77 (905): 201–204. дои : 10.1136/pmj.77.905.201 . ISSN   0032-5473 . ПМК   1741942 . ПМИД   11222834 .
  21. ^ Брайан, Эрик; Джейссон, Мари (2007). «Физико-теология и математика (1710–1794)». Изменение соотношения полов при рождении . Springer Science & Business Media. стр. 1–25. ISBN  978-1-4020-6036-6 .
  22. ^ Джон Арбутнот (1710). «Аргумент в пользу Божественного Провидения, основанный на постоянной регулярности рождаемости у представителей обоих полов» (PDF) . Философские труды Лондонского королевского общества . 27 (325–336): 186–190. дои : 10.1098/rstl.1710.0011 .
  23. ^ Коновер, WJ (1999), «Глава 3.4: Знаковый тест», Практическая непараметрическая статистика (Третье изд.), Wiley, стр. 157–176, ISBN  978-0-471-16068-7
  24. ^ Срент, П. (1989), Прикладные непараметрические статистические методы (второе изд.), Chapman & Hall, ISBN  978-0-412-44980-2
  25. ^ Стиглер, Стивен М. (1986). История статистики: измерение неопределенности до 1900 года . Издательство Гарвардского университета. стр. 225–226 . ISBN  978-0-674-40341-3 .
  26. ^ Беллхаус, Дэвид (2001), «Джон Арбутнот», в CC Heyde ; Э. Сенета (ред.), в «Статистиках веков» , Springer, стр. 39–42, ISBN.  978-0-387-95329-8
  27. ^ Хальд, Андерс (1998), «Глава 4. Случайность или замысел: критерии значимости», История математической статистики с 1750 по 1930 год , Wiley, стр. 65
  28. ^ Камминг, Джефф (2011). «От значимости нулевой гипотезы к величине эффекта тестирования». Понимание новой статистики: размеры эффекта, доверительные интервалы и метаанализ . Серия многомерных приложений. Восточный Суссекс, Великобритания: Рутледж. стр. 21–52. ISBN  978-0-415-87968-2 .
  29. ^ Фишер, Рональд А. (1925). Статистические методы для научных работников . Эдинбург, Великобритания: Оливер и Бойд. стр. 43 . ISBN  978-0-05-002170-5 .
  30. ^ Полетик, Фенна Х. (2001). «Формальные теории тестирования». Поведение при проверке гипотез . Очерки когнитивной психологии (1-е изд.). Восточный Суссекс, Соединенное Королевство: Psychology Press. стр. 29–48. ISBN  978-1-84169-159-6 .
  31. ^ Jump up to: а б с Куинн, Джеффри Р.; Кио, Майкл Дж. (2002). Экспериментальный дизайн и анализ данных для биологов (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 46–69 . ISBN  978-0-521-00976-8 .
  32. ^ Нейман, Дж.; Пирсон, ES (1933). «Проверка статистических гипотез в отношении априорных вероятностей». Математические труды Кембриджского философского общества . 29 (4): 492–510. Бибкод : 1933PCPS...29..492N . дои : 10.1017/S030500410001152X . S2CID   119855116 .
  33. ^ "Выводы о статистической значимости возможны с помощью доверительного интервала. Если доверительный интервал не включает в себя значение нулевого эффекта, можно предположить, что имеется статистически значимый результат." Прель, Жан-Баптист ты; Хоммель, Герхард; Рериг, Бернд; Блеттнер, Мария (2009). «Доверительный интервал или P-значение?» . Немецкий медицинский журнал онлайн . 106 (19): 335–9. дои : 10.3238/arztebl.2009.0335 . ПМК   2689604 . ПМИД   19547734 .
  34. ^ StatNews № 73: Перекрывающиеся доверительные интервалы и статистическая значимость
  35. ^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей». Философские труды Королевского общества А. 236 (767): 333–380. Бибкод : 1937RSPTA.236..333N . дои : 10.1098/rsta.1937.0005 . JSTOR   91337 . S2CID   19584450 .
  36. ^ Мейер, Кеннет Дж.; Брудни, Джеффри Л.; Боте, Джон (2011). Прикладная статистика для государственного и некоммерческого управления (3-е изд.). Бостон, Массачусетс: Cengage Learning. стр. 189–209. ISBN  978-1-111-34280-7 .
  37. ^ Хили, Джозеф Ф. (2009). Основы статистики: инструмент социальных исследований (2-е изд.). Бельмонт, Калифорния: Cengage Learning. стр. 177–205. ISBN  978-0-495-60143-2 .
  38. ^ МакКиллуп, Стив (2006). Объясненная статистика: Вводное руководство для ученых-биологов (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 32–38 . ISBN  978-0-521-54316-3 .
  39. ^ Здоровье, Дэвид (1995). Введение в экспериментальный дизайн и статистику для биологии (1-е изд.). Бостон, Массачусетс: CRC Press. стр. 123–154. ISBN  978-1-85728-132-3 .
  40. ^ Хинтон, Перри Р. (2010). «Значение, ошибка и сила». Объяснение статистики (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 79–90. ISBN  978-1-84872-312-2 .
  41. ^ Воган, Саймон (2013). Научный вывод: обучение на основе данных (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 146–152. ISBN  978-1-107-02482-3 .
  42. ^ Jump up to: а б Бракен, Майкл Б. (2013). Риск, шанс и причинно-следственная связь: исследование происхождения и лечение заболеваний (1-е изд.). Нью-Хейвен, Коннектикут: Издательство Йельского университета. стр. 260–276 . ISBN  978-0-300-18884-4 .
  43. ^ Франклин, Аллан (2013). «Пролог: Возникновение сигм». Изменение стандартов: эксперименты по физике элементарных частиц в двадцатом веке (1-е изд.). Питтсбург, Пенсильвания: Издательство Питтсбургского университета. стр. Ii–III. ISBN  978-0-8229-4430-0 .
  44. ^ Кларк, генеральный директор; Андерсон, Калифорния; Петтерссон, Ф.Х.; Кардон, ЛР; Моррис, AP; Зондерван, КТ (6 февраля 2011 г.). «Базовый статистический анализ в генетических исследованиях случай-контроль» . Протоколы природы . 6 (2): 121–33. дои : 10.1038/nprot.2010.182 . ПМК   3154648 . ПМИД   21293453 .
  45. ^ Барш, Г.С.; Копенхейвер, врач общей практики; Гибсон, Дж; Уильямс, С.М. (5 июля 2012 г.). «Руководство по полногеномным исследованиям ассоциаций» . ПЛОС Генетика . 8 (7): e1002812. дои : 10.1371/journal.pgen.1002812 . ПМК   3390399 . ПМИД   22792080 .
  46. ^ Карвер, Рональд П. (1978). «Дело против проверки статистической значимости». Гарвардский обзор образования . 48 (3): 378–399. дои : 10.17763/haer.48.3.t490261645281841 . S2CID   16355113 .
  47. ^ Иоаннидис, Джон П.А. (2005). «Почему большинство опубликованных результатов исследований являются ложными» . ПЛОС Медицина . 2 (8): е124. дои : 10.1371/journal.pmed.0020124 . ПМЦ   1182327 . ПМИД   16060722 .
  48. ^ Jump up to: а б Амрайн, Валентин; Корнер-Нивергельт, Фрэнци; Рот, Тобиас (2017). «Земля плоская (p > 0,05): пороги значимости и кризис невоспроизводимых исследований» . ПерДж . 5 : е3544. дои : 10.7717/peerj.3544 . ПМК   5502092 . ПМИД   28698825 .
  49. ^ Jump up to: а б Ходжат, Мохаммадреза; Сюй, Банда (2004). «Руководство для посетителей по размерам эффектов». Достижения в области медицинских наук. Образование . 9 (3): 241–9. doi : 10.1023/B:AHSE.0000038173.00909.f6 . ПМИД   15316274 . S2CID   8045624 .
  50. ^ Педазур, Элазар Дж.; Шмелькин, Лиора П. (1991). Измерение, проектирование и анализ: интегрированный подход (под ред. Студента). Нью-Йорк, штат Нью-Йорк: Psychology Press. стр. 180–210. ISBN  978-0-8058-1063-9 .
  51. ^ Стахель, Вернер (2016). «Статистическая проблема воспроизводимости». Принципы, проблемы, практика и перспективы Воспроизводимость: принципы, проблемы, практика и перспективы : 87–114. дои : 10.1002/9781118865064.ch5 . ISBN  978-1-118-86497-5 .
  52. ^ «Серия семинаров CSSME: спор о p -значениях и парадигма проверки значимости нулевой гипотезы (NHST)» . www.education.leeds.ac.uk . Школа образования Университета Лидса . Проверено 1 декабря 2016 г.
  53. ^ Новелла, Стивен (25 февраля 2015 г.). «Психологический журнал запрещает тестирование значимости» . Научная медицина.
  54. ^ Вулстон, Крис (05 марта 2015 г.). «Журнал по психологии запрещает значения P» . Природа . 519 (7541): 9. Бибкод : 2015Natur.519....9W . дои : 10.1038/519009f .
  55. ^ Зигфрид, Том (17 марта 2015 г.). «Запрет P-значения: маленький шаг для журнала, гигантский скачок для науки» . Новости науки . Проверено 1 декабря 2016 г.
  56. ^ Антонакис, Джон (февраль 2017 г.). «Как улучшить науку: от восторга открытия до политических последствий» (PDF) . Ежеквартальный журнал «Лидерство» . 28 (1): 5–21. дои : 10.1016/j.leaqua.2017.01.006 .
  57. ^ Jump up to: а б с Вассерштейн, Рональд Л.; Лазар, Николь А. (2 апреля 2016 г.). «Заявление ASA о p-значениях: контекст, процесс и цель» . Американский статистик . 70 (2): 129–133. дои : 10.1080/00031305.2016.1154108 .
  58. ^ Гарсиа-Перес, Мигель А. (05 октября 2016 г.). «Не лжесвидетельствуй против проверки значимости нулевой гипотезы» . Образовательные и психологические измерения . 77 (4): 631–662. дои : 10.1177/0013164416668232 . ISSN   0013-1644 . ПМЦ   5991793 . ПМИД   30034024 .
  59. ^ Иоаннидис, Джон П.А.; Уэр, Дженнифер Дж.; Вагенмейкерс, Эрик-Ян; Симонсон, Ури; Чемберс, Кристофер Д.; Баттон, Кэтрин С.; Бишоп, Дороти В.М.; Носек, Брайан А.; Мунафо, Маркус Р. (январь 2017 г.). «Манифест воспроизводимой науки» . Природа человеческого поведения . 1 (1): 0021. doi : 10.1038/s41562-016-0021 . ПМЦ   7610724 . ПМИД   33954258 .
  60. ^ Бенджамин, Дэниел; и др. (2018). «Переопределить статистическую значимость» . Природа человеческого поведения . 1 (1): 6–10. дои : 10.1038/s41562-017-0189-z . hdl : 10281/184094 . ПМИД   30980045 .
  61. ^ Чавла, Далмит (2017). « Единый порог для значений P в условиях пожара» . Природа . дои : 10.1038/nature.2017.22625 .
  62. ^ Амрайн, Валентин; Гренландия, Сандер (2017). «Удалить, а не переопределить статистическую значимость». Природа человеческого поведения . 2 (1): 0224. doi : 10.1038/s41562-017-0224-0 . ПМИД   30980046 . S2CID   46814177 .
  63. ^ Вайс, Стюарт (ноябрь 2017 г.). «Перемещение статистических целей науки» . csicop.org . CSI . Проверено 10 июля 2018 г.
  64. ^ МакШейн, Блейк; Гренландия, Сандер; Амрайн, Валентин (март 2019 г.). «Ученые восстают против статистической значимости» . Природа . 567 (7748): 305–307. Бибкод : 2019Natur.567..305A . дои : 10.1038/d41586-019-00857-9 . ПМИД   30894741 .
  65. ^ Вассерштейн, Рональд Л.; Ширм, Аллен Л.; Лазар, Николь А. (20 марта 2019 г.). «Переход в мир за пределами «p <0,05» » . Американский статистик . 73 (доп1): 1–19. дои : 10.1080/00031305.2019.1583913 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a2342252c2711aa29670f9588e96310b__1719443940
URL1:https://arc.ask3.ru/arc/aa/a2/0b/a2342252c2711aa29670f9588e96310b.html
Заголовок, (Title) документа по адресу, URL1:
Statistical significance - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)