Поправка Бонферрони
В статистике является поправка Бонферрони методом решения проблемы множественных сравнений .
Фон
[ редактировать ]Метод назван в честь использования неравенств Бонферрони . [1] Применение метода к доверительным интервалам было описано Олив Джин Данн . [2]
Статистическая проверка гипотез основана на отклонении нулевой гипотезы , когда вероятность наблюдаемых данных была бы низкой, если бы нулевая гипотеза была верной. Если проверяется несколько гипотез, вероятность наблюдения редкого события увеличивается, и, следовательно, увеличивается вероятность неправильного отклонения нулевой гипотезы (т. е. совершения ошибки I рода ). [3]
Поправка Бонферрони компенсирует это увеличение, проверяя каждую отдельную гипотезу на уровне значимости , где желаемый общий альфа-уровень и это количество гипотез. [4] Например, если пробная версия представляет собой тестирование гипотезы с желаемым общим , то поправка Бонферрони проверит каждую отдельную гипотезу при .
Поправку Бонферрони также можно применять в качестве корректировки значения p: при использовании этого подхода вместо корректировки альфа-уровня каждое значение p умножается на количество тестов (при этом скорректированные значения p, превышающие 1, затем уменьшаются до 1). ), а уровень альфа остается неизменным. Решения о значимости с использованием этого подхода будут такими же, как и при использовании подхода корректировки альфа-уровня.
Определение
[ редактировать ]Позволять быть семейством нулевых гипотез и пусть быть их соответствующими p-значениями . Позволять — общее число нулевых гипотез, и пусть — количество истинных нулевых гипотез (которое предположительно неизвестно исследователю). Коэффициент семейных ошибок (FWER) — это вероятность отклонения хотя бы одного истинного то есть совершить хотя бы одну ошибку I рода . Поправка Бонферрони отвергает нулевую гипотезу для каждого , тем самым контролируя FWER на . Доказательство этого управления следует из неравенства Буля следующим образом:
Этот контроль не требует каких-либо предположений о зависимости между значениями p или о том, сколько нулевых гипотез верны. [5]
Расширения
[ редактировать ]Обобщение
[ редактировать ]Вместо того, чтобы проверять каждую гипотезу уровне гипотезы могут быть проверены на любой другой комбинации уровней, которая в сумме составляет , при условии, что уровень каждого теста определяется до просмотра данных. [6] Например, для двух тестов гипотез общее Значение 0,05 можно поддерживать, проведя один тест при 0,04, а другой при 0,01.
Доверительные интервалы
[ редактировать ]Процедура, предложенная Данном [2] может использоваться для настройки доверительных интервалов . Если установить доверительные интервалы и желает иметь общий уровень достоверности , каждый отдельный доверительный интервал может быть скорректирован до уровня . [2]
Постоянные проблемы
[ редактировать ]При поиске сигнала в непрерывном пространстве параметров также может возникнуть проблема множественных сравнений или эффекта поиска в другом месте. Например, физик может стремиться обнаружить частицу неизвестной массы, рассматривая широкий диапазон масс; так было во время открытия бозона Хиггса, получившего Нобелевскую премию . В таких случаях можно применить непрерывное обобщение поправки Бонферрони, используя байесовскую логику для связи эффективного количества испытаний: , к соотношению объемов перед и задним отделом. [7]
Альтернативы
[ редактировать ]Существуют альтернативные способы контроля частоты семейных ошибок . Например, метод Холма-Бонферрони и коррекция Шидака в целом являются более мощными процедурами, чем коррекция Бонферрони, а это означает, что они всегда не менее эффективны. Но в отличие от процедуры Бонферрони эти методы не контролируют ожидаемое количество ошибок типа I на семейство (коэффициент ошибок типа I на одно семейство). [8]
Критика
[ редактировать ]Что касается контроля FWER , поправка Бонферрони может быть консервативной, если имеется большое количество тестов и/или статистика тестов положительно коррелирует. [9]
Коррекции при множественном тестировании, включая процедуру Бонферрони, увеличивают вероятность ошибок типа II, когда нулевые гипотезы ложны, т. е. они уменьшают статистическую мощность . [10] [9]
Ссылки
[ редактировать ]- ^ Бонферрони, CE, Статистическая теория классов и расчет вероятностей, Публикации R Istituto Superiore di Scienze Economice e Commerciali di Firenze, 1936 г.
- ^ Jump up to: а б с Данн, Олив Джин (1961). «Множественные сравнения средних» (PDF) . Журнал Американской статистической ассоциации . 56 (293): 52–64. CiteSeerX 10.1.1.309.1277 . дои : 10.1080/01621459.1961.10482090 .
- ^ Миттельхаммер, Рон С .; Судья Джордж Г .; Миллер, Дуглас Дж. (2000). Эконометрические основы . Издательство Кембриджского университета. стр. 73–74. ISBN 978-0-521-62394-0 .
- ^ Миллер, Руперт Г. (1966). Одновременный статистический вывод . Спрингер. ISBN 9781461381228 .
- ^ Гоман, Джелле Дж.; Солари, Альдо (2014). «Множественная проверка гипотез в геномике». Статистика в медицине . 33 (11): 1946–1978. дои : 10.1002/сим.6082 . ПМИД 24399688 . S2CID 22086583 .
- ^ Нойвальд, AF; Грин, П. (1994). «Обнаружение закономерностей в белковых последовательностях». Дж. Мол. Биол . 239 (5): 698–712. дои : 10.1006/jmbi.1994.1407 . ПМИД 8014990 .
- ^ Байер, Адриан Э.; Селяк, Урош (2020). «Эффект поиска в другом месте с единой байесовской и частотной точек зрения» . Журнал космологии и физики астрочастиц . 2020 (10): 009. arXiv : 2007.13821 . дои : 10.1088/1475-7516/2020/10/009 . S2CID 220830693 .
- ^ Фране, Эндрю (2015). «Имеет ли значение уровень ошибок типа I в расчете на семью в социальных и поведенческих науках?» . Журнал современных прикладных статистических методов . 14 (1): 12–23. дои : 10.22237/jmasm/1430453040 .
- ^ Jump up to: а б Моран, Мэтью (2003). «Аргументы в пользу отказа от последовательного Бонферрони в экологических исследованиях». Ойкос . 100 (2): 403–405. дои : 10.1034/j.1600-0706.2003.12010.x .
- ^ Накагава, Шиничи (2004). «Прощание с Бонферрони: проблемы низкой статистической мощности и предвзятости публикаций» . Поведенческая экология . 15 (6): 1044–1045. дои : 10.1093/beheco/arh107 .