~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ C92D8255FBF62D0294227D059F374C0C__1717008000 ✰
Заголовок документа оригинал.:
✰ Statistical significance - Wikipedia ✰
Заголовок документа перевод.:
✰ Статистическая значимость - Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Statistical_significance ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/c9/0c/c92d8255fbf62d0294227d059f374c0c.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/c9/0c/c92d8255fbf62d0294227d059f374c0c__translat.html ✰
Дата и время сохранения документа:
✰ 16.06.2024 03:43:01 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 29 May 2024, at 21:40 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Статистическая значимость - Википедия Jump to content

Статистическая значимость

Из Википедии, бесплатной энциклопедии

При гипотез проверке статистических [1] [2] результат имеет статистическую значимость, если результат, по крайней мере, как «экстремальный», был бы очень редким, если бы нулевая гипотеза была верной. [3] исследования Точнее, определенный уровень значимости , обозначаемый , — вероятность того, что исследование отвергнет нулевую гипотезу при условии, что нулевая гипотеза верна; [4] и p -значение результата, , — вероятность получения хотя бы столь же экстремального результата при условии, что нулевая гипотеза верна. [5] Результат является статистически значимым по стандартам исследования, когда . [6] [7] [8] [9] [10] [11] [12] Уровень значимости для исследования выбирается до сбора данных и обычно устанавливается на уровне 5%. [13] или намного ниже — в зависимости от области исследования. [14]

В любом эксперименте или наблюдении , предполагающем взятие выборки из популяции , всегда существует вероятность того, что наблюдаемый эффект возник бы только из-за ошибки выборки . [15] [16] Но если значение p наблюдаемого эффекта меньше уровня значимости (или равно ему), исследователь может заключить, что эффект отражает характеристики всей популяции. [1] тем самым отвергая нулевую гипотезу. [17]

Этот метод проверки статистической значимости результатов был разработан в начале 20 века. Термин «значимость» здесь не подразумевает важность, а термин «статистическая значимость» — это не то же самое, что исследовательская значимость, теоретическая значимость или практическая значимость. [1] [2] [18] [19] Например, термин «клиническая значимость» относится к практической важности эффекта лечения. [20]

История [ править ]

Статистическая значимость восходит к 18 веку, в работах Джона Арбутнота и Пьера-Симона Лапласа , которые вычислили p значение для соотношения полов человека при рождении, приняв нулевую гипотезу о равной вероятности рождения мальчиков и девочек; см . в разделе p -value § История . подробности [21] [22] [23] [24] [25] [26] [27]

В 1925 году Рональд Фишер выдвинул идею проверки статистических гипотез, которую он назвал «тестами значимости», в своей публикации « Статистические методы для научных работников» . [28] [29] [30] Фишер предложил вероятность один из двадцати (0,05) в качестве удобного порогового уровня для отклонения нулевой гипотезы. [31] В статье 1933 года Ежи Нейман и Эгон Пирсон назвали этот порог уровнем значимости , который они назвали . Они рекомендовали, чтобы быть установлены заранее, до начала любого сбора данных. [31] [32]

Несмотря на первоначальное предложение 0,05 в качестве уровня значимости, Фишер не собирался фиксировать это пороговое значение. В своей публикации 1956 года «Статистические методы и научные выводы» он рекомендовал устанавливать уровни значимости в соответствии с конкретными обстоятельствами. [31]

Связанные понятия [ править ]

Уровень значимости является порогом для ниже которого нулевая гипотеза отвергается, хотя по предположению она верна, и происходит что-то еще. Это значит, что также вероятность ошибочного отклонения нулевой гипотезы, если нулевая гипотеза верна. [4] Это также называется ложным срабатыванием и ошибкой I типа .

Иногда вместо этого исследователи говорят об уровне достоверности γ = (1 − α ) . Это вероятность не отвергнуть нулевую гипотезу при условии, что она верна. [33] [34] Доверительные уровни и доверительные интервалы были введены Нейманом в 1937 году. [35]

гипотез проверке статистических Роль в

В двустороннем тесте область отклонения для уровня значимости α = 0,05 разделена на оба конца выборочного распределения и составляет 5% площади под кривой (белые области).

Статистическая значимость играет ключевую роль в проверке статистических гипотез. Он используется для определения того, нулевую гипотезу следует ли отклонить или сохранить . Нулевая гипотеза – это гипотеза о том, что в изучаемом явлении не существует никакого эффекта. [36] Чтобы нулевая гипотеза была отклонена, наблюдаемый результат должен быть статистически значимым, т. е. наблюдаемое значение p меньше заранее заданного уровня значимости. .

Чтобы определить, является ли результат статистически значимым, исследователь рассчитывает значение p , которое представляет собой вероятность наблюдения эффекта той же величины или более экстремального при условии, что нулевая гипотеза верна. [5] [12] Нулевая гипотеза отклоняется, если значение p меньше (или равно) заранее определенного уровня, . также называется уровнем значимости и представляет собой вероятность отклонения нулевой гипотезы при условии, что она верна ( ошибка I рода ). Обычно он устанавливается на уровне 5% или ниже.

Например, когда установлена ​​равной 5%, условная вероятность , ошибки I рода при условии, что нулевая гипотеза верна , равна 5%, [37] и статистически значимым результатом является тот, в котором наблюдаемое значение p меньше (или равно) 5%. [38] При извлечении данных из выборки это означает, что область отклонения составляет 5% распределения выборки . [39] Эти 5% могут быть распределены по одной стороне выборочного распределения, как в одностороннем тесте , или разделены на обе стороны распределения, как в двустороннем тесте , при этом каждый хвост (или область отклонения) содержит 2,5% распределения.

Использование одностороннего теста зависит от того, указывает ли исследовательский вопрос или альтернативная гипотеза направление, например, тяжелее успевают учащиеся при оценке ли группа объектов или лучше . [3] Двусторонний тест по-прежнему можно использовать, но он будет менее эффективным, чем односторонний тест, поскольку область отклонения для одностороннего теста сосредоточена на одном конце нулевого распределения и в два раза больше (5% против 0,2,5%) каждой области отклонения для двустороннего теста. В результате нулевая гипотеза может быть отклонена с менее экстремальным результатом, если использовался односторонний критерий. [40] Односторонний критерий более эффективен, чем двусторонний тест, только если указанное направление альтернативной гипотезы верно. Однако если оно неверно, то односторонний тест не имеет силы.

Пороги значимости в конкретных областях [ править ]

В конкретных областях, таких как физика элементарных частиц и производство , статистическая значимость часто выражается в кратных стандартном отклонении или сигме ( σ ) нормального распределения , при этом пороговые значения значимости устанавливаются на гораздо более строгом уровне (например, 5 σ ). [41] [42] Например, уверенность в существовании частицы бозона Хиггса была основана на критерии 5 σ , который соответствует значению p примерно 1 на 3,5 миллиона. [42] [43]

В других областях научных исследований, таких как полногеномные исследования ассоциаций , уровни значимости составляют всего 5 × 10. −8 не редкость [44] [45] — так как количество проводимых тестов чрезвычайно велико.

Ограничения [ править ]

Исследователи, сосредоточенные исключительно на том, являются ли их результаты статистически значимыми, могут сообщать о результатах, которые не являются существенными. [46] и не воспроизводимы. [47] [48] Существует также разница между статистической значимостью и практической значимостью. Исследование, которое признано статистически значимым, не обязательно может быть практически значимым. [49] [19]

Размер эффекта [ править ]

Размер эффекта является мерой практической значимости исследования. [49] Статистически значимый результат может иметь слабый эффект. Чтобы оценить исследовательскую значимость своего результата, исследователям рекомендуется всегда сообщать о величине эффекта вместе с p -значениями. Мера размера эффекта количественно определяет силу эффекта, например, расстояние между двумя средними значениями в единицах стандартного отклонения (см. d Коэна ), коэффициент корреляции между двумя переменными или его квадрат и другие меры. [50]

Воспроизводимость [ править ]

Статистически значимый результат может быть нелегко воспроизвести. [48] В частности, некоторые статистически значимые результаты на самом деле будут ложноположительными. Каждая неудачная попытка воспроизвести результат увеличивает вероятность того, что результат окажется ложноположительным. [51]

Проблемы [ править ]

в некоторых Чрезмерное использование журналах

на тестирование значимости, особенно на использование порога α = 5%, как на основной критерий достоверности гипотезы. Начиная с 2010-х годов некоторые журналы начали задаваться вопросом , не слишком ли сильно полагаются [52] Некоторые журналы призывали авторов проводить более подробный анализ, чем просто тест статистической значимости. В области социальной психологии журнал « Базовая и прикладная социальная психология» вообще запретил использование тестирования значимости в опубликованных им статьях. [53] требование от авторов использовать другие меры для оценки гипотез и воздействия. [54] [55]

Другие редакторы, комментируя этот запрет, отметили: «Запрет на сообщение о p -значениях, как это недавно сделала «Базовая и прикладная социальная психология», не решит проблему, поскольку он просто лечит симптом проблемы. В этом нет ничего плохого. с проверкой гипотез и p -значениями как таковыми, если авторы, рецензенты и редакторы действий используют их правильно». [56] Некоторые статистики предпочитают использовать альтернативные меры доказательства, такие как отношения правдоподобия или факторы Байеса . [57] Использование байесовской статистики позволяет избежать уровней достоверности, но также требует принятия дополнительных предположений. [57] и не обязательно может улучшить практику статистического тестирования. [58]

Широко распространенное злоупотребление статистической значимостью представляет собой важную тему исследований в области метанауки . [59]

Переосмысление значения [ править ]

В 2016 году Американская статистическая ассоциация (ASA) опубликовала заявление о значениях p , в котором говорится, что «широко распространенное использование «статистической значимости» (обычно интерпретируемой как « p ≤ 0,05») в качестве лицензии на утверждение научных результатов (или подразумеваемая истина) приводит к значительному искажению научного процесса». [57] В 2017 году группа из 72 авторов предложила улучшить воспроизводимость, изменив p с 0,05 на 0,005. порог статистической значимости значения [60] Другие исследователи ответили, что введение более строгого порога значимости усугубит такие проблемы, как сбор данных ; Таким образом, альтернативные предложения заключаются в выборе и обосновании гибких пороговых значений p -значения перед сбором данных, [61] или интерпретировать значения p как непрерывные индексы, тем самым игнорируя пороговые значения и статистическую значимость. [62] Кроме того, изменение значения на 0,005 увеличит вероятность ложноотрицательных результатов, в результате чего изучаемый эффект является реальным, но тест не может его показать. [63]

В 2019 году более 800 статистиков и ученых подписали обращение с призывом отказаться от термина «статистическая значимость» в науке. [64] и ASA опубликовало еще одно официальное заявление [65] заявляя (стр. 2):

На основании нашего обзора статей в этом специальном выпуске и более широкой литературы мы пришли к выводу, что пришло время полностью прекратить использование термина «статистически значимый». Также не следует использовать такие варианты, как «значительно отличаются», « «,» и «несущественный» сохраняются, независимо от того, выражены ли они словами, звездочками в таблице или каким-либо другим способом.

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б с Сиркин, Р. Марк (2005). «Двухвыборочные t-тесты». Статистика для социальных наук (3-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications, Inc., стр. 271–316. ISBN  978-1-4129-0546-6 .
  2. ^ Перейти обратно: а б Боррор, Конни М. (2009). «Принятие статистических решений». Справочник сертифицированного инженера по качеству (3-е изд.). Милуоки, Висконсин: ASQ Quality Press. стр. 418–472. ISBN  978-0-87389-745-7 .
  3. ^ Перейти обратно: а б Майерс, Джером Л.; Ну, Арнольд Д.; Лорх, Роберт Ф. младший (2010). «Разработка основ проверки гипотез с использованием биномиального распределения». План исследования и статистический анализ (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 65–90. ISBN  978-0-8058-6431-1 .
  4. ^ Перейти обратно: а б Далгаард, Питер (2008). «Мощность и расчет размера выборки». Вводная статистика с R . Статистика и вычисления. Нью-Йорк: Спрингер. стр. 155–56. дои : 10.1007/978-0-387-79054-1_9 . ISBN  978-0-387-79053-4 .
  5. ^ Перейти обратно: а б «Статистическая проверка гипотез» . www.dartmouth.edu . Архивировано из оригинала 2 августа 2020 г. Проверено 11 ноября 2019 г.
  6. ^ Джонсон, Вален Э. (9 октября 2013 г.). «Пересмотренные стандарты статистических данных» . Труды Национальной академии наук . 110 (48): 19313–19317. Бибкод : 2013PNAS..11019313J . дои : 10.1073/pnas.1313476110 . ПМЦ   3845140 . ПМИД   24218581 .
  7. ^ Редмонд, Кэрол; Колтон, Теодор (2001). «Клиническая значимость против статистической значимости». Биостатистика в клинических исследованиях . Справочная серия Wiley по биостатистике (3-е изд.). Западный Суссекс, Соединенное Королевство: John Wiley & Sons Ltd., стр. 35–36. ISBN  978-0-471-82211-0 .
  8. ^ Камминг, Джефф (2012). Понимание новой статистики: размеры эффекта, доверительные интервалы и метаанализ . Нью-Йорк, США: Рутледж. стр. 27–28.
  9. ^ Кшивинский, Мартин; Альтман, Наоми (30 октября 2013 г.). «Точки значимости: значимость, значения P и t-критерии» . Природные методы . 10 (11): 1041–1042. дои : 10.1038/nmeth.2698 . ПМИД   24344377 .
  10. ^ Шам, Пак К.; Перселл, Шон М. (17 апреля 2014 г.). «Тестирование статистической мощности и значимости в крупномасштабных генетических исследованиях». Обзоры природы Генетика . 15 (5): 335–346. дои : 10.1038/nrg3706 . ПМИД   24739678 . S2CID   10961123 .
  11. ^ Альтман, Дуглас Г. (1999). Практическая статистика для медицинских исследований . Нью-Йорк, США: Chapman & Hall/CRC. стр. 167 . ISBN  978-0-412-27630-9 .
  12. ^ Перейти обратно: а б Девор, Джей Л. (2011). Вероятность и статистика для техники и наук (8-е изд.). Бостон, Массачусетс: Cengage Learning. стр. 300–344. ISBN  978-0-538-73352-6 .
  13. ^ Крапаро, Роберт М. (2007). "Уровень значимости". В Салкинде, Нил Дж. (ред.). Энциклопедия измерений и статистики . Том. 3. Таузенд-Оукс, Калифорния: Публикации SAGE. стр. 889–891. ISBN  978-1-4129-1611-0 .
  14. ^ Спроролл, Натали Л. (2002). "Проверка гипотезы" . Справочник по методам исследования: Руководство для практиков и студентов социальных наук (2-е изд.). Лэнхэм, Мэриленд: Scarecrow Press, Inc., стр. 49–64 . ISBN  978-0-8108-4486-5 .
  15. ^ Бэбби, Эрл Р. (2013). «Логика выборки». Практика социальных исследований (13-е изд.). Бельмонт, Калифорния: Cengage Learning. стр. 185–226. ISBN  978-1-133-04979-1 .
  16. ^ Фаэрти, Винсент (2008). «Вероятность и статистическая значимость». Сострадательная статистика: прикладной количественный анализ для социальных служб (с упражнениями и инструкциями в SPSS) (1-е изд.). Таузенд-Оукс, Калифорния: SAGE Publications, Inc., стр. 127–138. ISBN  978-1-4129-3982-9 .
  17. ^ МакКиллуп, Стив (2006). «Вероятность помогает вам принять решение о ваших результатах» . Объясненная статистика: Вводное руководство для ученых-биологов (1-е изд.). Кембридж, Соединенное Королевство: Издательство Кембриджского университета. стр. 44–56 . ISBN  978-0-521-54316-3 .
  18. ^ Майерс, Джером Л.; Ну, Арнольд Д.; Лорх, Роберт Ф. младший (2010). «Т-дистрибутив и его приложения». План исследования и статистический анализ (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 124–153. ISBN  978-0-8058-6431-1 .
  19. ^ Перейти обратно: а б Хупер, Питер. «Что такое P-значение?» (PDF) . Университет Альберты, факультет математических и статистических наук . Архивировано из оригинала (PDF) 31 марта 2020 г. Проверено 10 ноября 2019 г.
  20. ^ Люнг, В.-К. (01.03.2001). «Баланс статистической и клинической значимости в оценке эффектов лечения» . Последипломный медицинский журнал . 77 (905): 201–204. дои : 10.1136/pmj.77.905.201 . ISSN   0032-5473 . ПМК   1741942 . ПМИД   11222834 .
  21. ^ Брайан, Эрик; Джейссон, Мари (2007). «Физико-теология и математика (1710–1794)». Изменение соотношения полов при рождении . Springer Science & Business Media. стр. 1–25. ISBN  978-1-4020-6036-6 .
  22. ^ Джон Арбутнот (1710). «Аргумент в пользу Божественного Провидения, основанный на постоянной регулярности рождаемости у представителей обоих полов» (PDF) . Философские труды Лондонского королевского общества . 27 (325–336): 186–190. дои : 10.1098/rstl.1710.0011 .
  23. ^ Коновер, WJ (1999), «Глава 3.4: Знаковый тест», Практическая непараметрическая статистика (Третье изд.), Wiley, стр. 157–176, ISBN  978-0-471-16068-7
  24. ^ Срент, П. (1989), Прикладные непараметрические статистические методы (второе изд.), Chapman & Hall, ISBN  978-0-412-44980-2
  25. ^ Стиглер, Стивен М. (1986). История статистики: измерение неопределенности до 1900 года . Издательство Гарвардского университета. стр. 225–226 . ISBN  978-0-674-40341-3 .
  26. ^ Беллхаус, Дэвид (2001), «Джон Арбутнот», в книге «Статистики столетий» К. К. Хейда и Э. Сенеты , Спрингер, стр. 39–42, ISBN  978-0-387-95329-8
  27. ^ Хальд, Андерс (1998), «Глава 4. Случайность или замысел: критерии значимости», История математической статистики с 1750 по 1930 год , Wiley, стр. 65
  28. ^ Камминг, Джефф (2011). «От значимости нулевой гипотезы к величине эффекта тестирования». Понимание новой статистики: размеры эффекта, доверительные интервалы и метаанализ . Серия многомерных приложений. Восточный Суссекс, Великобритания: Рутледж. стр. 21–52. ISBN  978-0-415-87968-2 .
  29. ^ Фишер, Рональд А. (1925). Статистические методы для научных работников . Эдинбург, Великобритания: Оливер и Бойд. стр. 43 . ISBN  978-0-05-002170-5 .
  30. ^ Полетик, Фенна Х. (2001). «Формальные теории тестирования». Поведение при проверке гипотез . Очерки когнитивной психологии (1-е изд.). Восточный Суссекс, Соединенное Королевство: Psychology Press. стр. 29–48. ISBN  978-1-84169-159-6 .
  31. ^ Перейти обратно: а б с Куинн, Джеффри Р.; Кио, Майкл Дж. (2002). Экспериментальный дизайн и анализ данных для биологов (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 46–69 . ISBN  978-0-521-00976-8 .
  32. ^ Нейман, Дж.; Пирсон, ES (1933). «Проверка статистических гипотез в отношении априорных вероятностей». Математические труды Кембриджского философского общества . 29 (4): 492–510. Бибкод : 1933PCPS...29..492N . дои : 10.1017/S030500410001152X . S2CID   119855116 .
  33. ^ "Выводы о статистической значимости возможны с помощью доверительного интервала. Если доверительный интервал не включает в себя значение нулевого эффекта, можно предположить, что имеется статистически значимый результат." Прель, Жан-Баптист ты; Хоммель, Герхард; Рериг, Бернд; Блеттнер, Мария (2009). «Доверительный интервал или P-значение?» . Немецкий медицинский журнал онлайн . 106 (19): 335–9. дои : 10.3238/arztebl.2009.0335 . ПМК   2689604 . ПМИД   19547734 .
  34. ^ StatNews № 73: Перекрывающиеся доверительные интервалы и статистическая значимость
  35. ^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей». Философские труды Королевского общества А. 236 (767): 333–380. Бибкод : 1937RSPTA.236..333N . дои : 10.1098/rsta.1937.0005 . JSTOR   91337 . S2CID   19584450 .
  36. ^ Мейер, Кеннет Дж.; Брудни, Джеффри Л.; Боте, Джон (2011). Прикладная статистика для государственного и некоммерческого управления (3-е изд.). Бостон, Массачусетс: Cengage Learning. стр. 189–209. ISBN  978-1-111-34280-7 .
  37. ^ Хили, Джозеф Ф. (2009). Основы статистики: инструмент социальных исследований (2-е изд.). Бельмонт, Калифорния: Cengage Learning. стр. 177–205. ISBN  978-0-495-60143-2 .
  38. ^ МакКиллуп, Стив (2006). Объясненная статистика: Вводное руководство для ученых-биологов (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 32–38 . ISBN  978-0-521-54316-3 .
  39. ^ Здоровье, Дэвид (1995). Введение в экспериментальный дизайн и статистику для биологии (1-е изд.). Бостон, Массачусетс: CRC Press. стр. 123–154. ISBN  978-1-85728-132-3 .
  40. ^ Хинтон, Перри Р. (2010). «Значение, ошибка и сила». Объяснение статистики (3-е изд.). Нью-Йорк, штат Нью-Йорк: Рутледж. стр. 79–90. ISBN  978-1-84872-312-2 .
  41. ^ Воган, Саймон (2013). Научный вывод: обучение на основе данных (1-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр. 146–152. ISBN  978-1-107-02482-3 .
  42. ^ Перейти обратно: а б Бракен, Майкл Б. (2013). Риск, шанс и причинно-следственная связь: исследование происхождения и лечение заболеваний (1-е изд.). Нью-Хейвен, Коннектикут: Издательство Йельского университета. стр. 260–276 . ISBN  978-0-300-18884-4 .
  43. ^ Франклин, Аллан (2013). «Пролог: Возникновение сигм». Изменение стандартов: эксперименты по физике элементарных частиц в двадцатом веке (1-е изд.). Питтсбург, Пенсильвания: Издательство Питтсбургского университета. стр. Ii–III. ISBN  978-0-8229-4430-0 .
  44. ^ Кларк, генеральный директор; Андерсон, Калифорния; Петтерссон, Ф.Х.; Кардон, ЛР; Моррис, AP; Зондерван, КТ (6 февраля 2011 г.). «Базовый статистический анализ в генетических исследованиях случай-контроль» . Протоколы природы . 6 (2): 121–33. дои : 10.1038/nprot.2010.182 . ПМК   3154648 . ПМИД   21293453 .
  45. ^ Барш, Г.С.; Копенхейвер, врач общей практики; Гибсон, Дж; Уильямс, С.М. (5 июля 2012 г.). «Руководство по полногеномным исследованиям ассоциаций» . ПЛОС Генетика . 8 (7): e1002812. дои : 10.1371/journal.pgen.1002812 . ПМК   3390399 . ПМИД   22792080 .
  46. ^ Карвер, Рональд П. (1978). «Дело против проверки статистической значимости». Гарвардский обзор образования . 48 (3): 378–399. дои : 10.17763/haer.48.3.t490261645281841 . S2CID   16355113 .
  47. ^ Иоаннидис, Джон П.А. (2005). «Почему большинство опубликованных результатов исследований являются ложными» . ПЛОС Медицина . 2 (8): е124. doi : 10.1371/journal.pmed.0020124 . ПМЦ   1182327 . ПМИД   16060722 .
  48. ^ Перейти обратно: а б Амрайн, Валентин; Корнер-Нивергельт, Фрэнци; Рот, Тобиас (2017). «Земля плоская (p > 0,05): пороги значимости и кризис невоспроизводимых исследований» . ПерДж . 5 : е3544. дои : 10.7717/peerj.3544 . ПМК   5502092 . ПМИД   28698825 .
  49. ^ Перейти обратно: а б Ходжат, Мохаммадреза; Сюй, Банда (2004). «Руководство для посетителей по размерам эффектов». Достижения в области медицинских наук . Образование. 9 (3): 241–9. doi : 10.1023/B:AHSE.0000038173.00909.f6 . ПМИД   15316274 . S2CID   8045624 .
  50. ^ Педазур, Элазар Дж.; Шмелькин, Лиора П. (1991). Измерение, проектирование и анализ: интегрированный подход (под ред. Студента). Нью-Йорк, штат Нью-Йорк: Psychology Press. стр. 180–210. ISBN  978-0-8058-1063-9 .
  51. ^ Стахель, Вернер (2016). «Статистическая проблема воспроизводимости». Принципы, проблемы, практика и перспективы Воспроизводимость: принципы, проблемы, практика и перспективы : 87–114. дои : 10.1002/9781118865064.ch5 . ISBN  978-1-118-86497-5 .
  52. ^ «Серия семинаров CSSME: спор о p -значениях и парадигма проверки значимости нулевой гипотезы (NHST)» . www.education.leeds.ac.uk . Школа образования Университета Лидса . Проверено 1 декабря 2016 г.
  53. ^ Новелла, Стивен (25 февраля 2015 г.). «Психологический журнал запрещает тестирование значимости» . Научная медицина.
  54. ^ Вулстон, Крис (05 марта 2015 г.). «Журнал по психологии запрещает значения P» . Природа . 519 (7541): 9. Бибкод : 2015Natur.519....9W . дои : 10.1038/519009f .
  55. ^ Зигфрид, Том (17 марта 2015 г.). «Запрет P-значения: маленький шаг для журнала, гигантский скачок для науки» . Новости науки . Проверено 1 декабря 2016 г.
  56. ^ Антонакис, Джон (февраль 2017 г.). «Как улучшить науку: от восторга открытия до политических последствий» (PDF) . Ежеквартальный журнал «Лидерство» . 28 (1): 5–21. дои : 10.1016/j.leaqua.2017.01.006 .
  57. ^ Перейти обратно: а б с Вассерштейн, Рональд Л.; Лазар, Николь А. (2 апреля 2016 г.). «Заявление ASA о p-значениях: контекст, процесс и цель» . Американский статистик . 70 (2): 129–133. дои : 10.1080/00031305.2016.1154108 .
  58. ^ Гарсиа-Перес, Мигель А. (05 октября 2016 г.). «Не лжесвидетельствуй против проверки значимости нулевой гипотезы» . Образовательные и психологические измерения . 77 (4): 631–662. дои : 10.1177/0013164416668232 . ISSN   0013-1644 . ПМК   5991793 . ПМИД   30034024 .
  59. ^ Иоаннидис, Джон П.А.; Уэр, Дженнифер Дж.; Вагенмейкерс, Эрик-Ян; Симонсон, Ури; Чемберс, Кристофер Д.; Баттон, Кэтрин С.; Бишоп, Дороти В.М.; Носек, Брайан А.; Мунафо, Маркус Р. (январь 2017 г.). «Манифест воспроизводимой науки» . Природа человеческого поведения . 1 (1): 0021. doi : 10.1038/s41562-016-0021 . ПМК   7610724 . ПМИД   33954258 .
  60. ^ Бенджамин, Дэниел; и другие. (2018). «Переопределить статистическую значимость» . Природа человеческого поведения . 1 (1): 6–10. дои : 10.1038/s41562-017-0189-z . hdl : 10281/184094 . ПМИД   30980045 .
  61. ^ Чавла, Далмит (2017). « Единый порог для значений P в условиях пожара» . Природа . дои : 10.1038/nature.2017.22625 .
  62. ^ Амрайн, Валентин; Гренландия, Сандер (2017). «Удалить, а не переопределить статистическую значимость». Природа человеческого поведения . 2 (1): 0224. doi : 10.1038/s41562-017-0224-0 . ПМИД   30980046 . S2CID   46814177 .
  63. ^ Вайс, Стюарт (ноябрь 2017 г.). «Перемещение статистических целей науки» . csicop.org . CSI . Проверено 10 июля 2018 г.
  64. ^ МакШейн, Блейк; Гренландия, Сандер; Амрайн, Валентин (март 2019 г.). «Ученые восстают против статистической значимости» . Природа . 567 (7748): 305–307. Бибкод : 2019Natur.567..305A . дои : 10.1038/d41586-019-00857-9 . ПМИД   30894741 .
  65. ^ Вассерштейн, Рональд Л.; Ширм, Аллен Л.; Лазар, Николь А. (20 марта 2019 г.). «Переход в мир за пределами «p <0,05» » . Американский статистик . 73 (доп1): 1–19. дои : 10.1080/00031305.2019.1583913 .

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: C92D8255FBF62D0294227D059F374C0C__1717008000
URL1:https://en.wikipedia.org/wiki/Statistical_significance
Заголовок, (Title) документа по адресу, URL1:
Statistical significance - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)