Среднее гармоническое p значение
Гармоническое среднее p значение [1] [2] [3] (HMP) — это статистический метод решения проблемы множественных сравнений , который контролирует частоту серьезных семейных ошибок. [2] (данное утверждение было оспорено [4] ). Он повышает эффективность коррекции за Бонферрони счет выполнения комбинированных тестов, т.е. путем проверки того, являются ли группы - p значений статистически значимыми, как метод Фишера . [5] он позволяет избежать ограничительного предположения о p -значений . независимости Однако в отличие от метода Фишера [2] [3] Следовательно, он контролирует уровень ложноположительных результатов , когда тесты зависимы, за счет меньшей мощности (т.е. более высокого уровня ложноотрицательных результатов ), когда тесты независимы. [2] Помимо предоставления альтернативы таким подходам, как коррекция Бонферрони , которая контролирует строгую частоту семейных ошибок , она также обеспечивает альтернативу широко используемой процедуре Бенджамини-Хохберга (BH) для контроля менее строгой частоты ложных открытий . [6] Это связано с тем, что способность HMP обнаруживать значимые группы гипотез больше, чем способность BH обнаруживать значимые отдельные гипотезы. [2]
Существует две версии метода: (i) прямая интерпретация HMP как приближенного p -значения и (ii) процедура преобразования HMP в асимптотически точное p -значение . Этот подход обеспечивает многоуровневую процедуру тестирования наименьшие группы p , в которой можно отыскивать -значений, которые являются статистически значимыми.
Прямая интерпретация среднего гармонического p значения
[ редактировать ]Средневзвешенное гармоническое значение значений p - определяется как где являются весами, сумма которых должна равняться единице, т.е. . Могут быть выбраны равные веса, в этом случае .
В целом, интерпретация HMP непосредственно как значения p является антиконсервативной, а это означает, что уровень ложноположительных результатов выше, чем ожидалось. Однако по мере того, как HMP становится меньше, при определенных допущениях расхождение уменьшается, так что прямая интерпретация значимости достигает уровня ложноположительных результатов, близкого к тому, который подразумевается для достаточно малых значений (например, ). [2]
HMP никогда не бывает антиконсервативной более чем на несколько раз. для маленьких , или для больших . [3] Однако эти границы представляют собой наихудшие сценарии при произвольной зависимости, которые на практике могут оказаться консервативными. Вместо применения этих границ асимптотически точные значения p можно получить путем преобразования HMP.
Асимптотически точная гармоническая среднего p -значения процедура
[ редактировать ]Обобщенная центральная предельная теорема показывает, что асимптотически точное p значение , можно вычислить из HMP, , используя формулу [2] С учетом предположений обобщенной центральной предельной теоремы это преобразованное значение p становится точным, как количество тестов, , становится большим. В расчетах используется распределение Ландау , функцию плотности которого можно записать Тест реализуется p.hmp
командование harmonicmeanp
пакет Р ; учебник . доступен в Интернете
Эквивалентно можно сравнить HMP с таблицей критических значений (табл. 1). Таблица показывает, что чем меньше уровень ложноположительных результатов и чем меньше количество тестов, тем ближе критическое значение к уровню ложноположительных результатов.
10 | 0.040 | 0.0094 | 0.00099 |
100 | 0.036 | 0.0092 | 0.00099 |
1,000 | 0.034 | 0.0090 | 0.00099 |
10,000 | 0.031 | 0.0088 | 0.00098 |
100,000 | 0.029 | 0.0086 | 0.00098 |
1,000,000 | 0.027 | 0.0084 | 0.00098 |
10,000,000 | 0.026 | 0.0083 | 0.00098 |
100,000,000 | 0.024 | 0.0081 | 0.00098 |
1,000,000,000 | 0.023 | 0.0080 | 0.00097 |
Многократное тестирование с помощью процедуры многоуровневого тестирования
[ редактировать ]Если HMP значителен на каком-то уровне для группы из p -значений, можно искать все подмножества p -значения для наименьшей значимой группы, сохраняя при этом серьезную частоту семейных ошибок. [2] Формально это процедура закрытого тестирования . [7]
Когда мал (например, ), следующий многоуровневый тест, основанный на прямой интерпретации HMP, контролирует частоту серьезных семейных ошибок на уровне примерно
- Определите HMP любого подмножества принадлежащий p - значения, которые будут
- Отклоните нулевую гипотезу о том, что ни одно из p -значений в подмножестве значимы, если , где . (Напомним, что по определению .)
Асимптотически точная версия вышеизложенного заменяет на шаге 2 с где дает количество p -значений, а не только тех, которые находятся в подмножестве . [8]
Поскольку прямая интерпретация HMP выполняется быстрее, можно использовать двухпроходную процедуру для идентификации подмножеств p- значений, которые могут оказаться значимыми с помощью прямой интерпретации, при условии подтверждения с использованием асимптотически точной формулы.
Свойства ГМП
[ редактировать ]HMP обладает рядом свойств, вытекающих из обобщенной центральной предельной теоремы. [2] Это:
- Устойчивая к положительной зависимости между значениями p .
- Нечувствителен к точному количеству тестов, L .
- Устойчив к распределению весов, w .
- Наибольшее влияние оказывают наименьшие значения p .
Когда HMP не является значимым, не имеет значения и какое-либо подмножество составляющих тестов. И наоборот, когда многоуровневый тест считает подмножество значений p значимым, HMP для всех объединенных значений p , вероятно, будет значимым; это несомненно, когда HMP интерпретируется напрямую. Когда цель состоит в том, чтобы оценить значимость отдельных значений p , так что комбинированные тесты, касающиеся групп значений p , не представляют интереса, HMP эквивалентен процедуре Бонферрони , но с учетом более строгого порога значимости. (Таблица 1).
HMP предполагает, что отдельные значения p имеют (не обязательно независимые) стандартные равномерные распределения, когда их нулевые гипотезы верны. Таким образом, большое количество тестов с недостаточной мощностью может нанести вред мощности HMP.
Хотя выбор весов неважен для достоверности HMP при нулевой гипотезе, веса влияют на мощность процедуры. Дополнительные методы §5C [2] и онлайн- руководство рассматривают этот вопрос более подробно.
Байесовские интерпретации HMP
[ редактировать ]HMP был задуман по аналогии с усреднением байесовской модели и может интерпретироваться как обратно пропорциональный усредненному по модели фактору Байеса при объединении p -значений из тестов отношения правдоподобия . [1] [2]
Эмпирическое правило среднего гармонического значения
[ редактировать ]И. Дж. Гуд сообщил об эмпирической взаимосвязи между фактором Байеса и значением p , полученным с помощью теста отношения правдоподобия. [1] Для нулевой гипотезы вложенный в более общую альтернативную гипотезу он часто это замечал, где обозначает фактор Байеса в пользу против Экстраполируя, он предложил эмпирическое правило, согласно которому HMP считается обратно пропорциональным усредненному по модели байесовскому фактору для набора тесты с общей нулевой гипотезой: По мнению Гуда, его эмпирическое правило поддерживало взаимозаменяемость байесовского и классического подходов к проверке гипотез. [9] [10] [11] [12] [13]
Байесовская калибровка p -значений
[ редактировать ]Если распределения значений p при альтернативных гипотезах соответствуют бета-распределениям с параметрами , форма, рассмотренная Селлке, Баярри и Бергером, [14] тогда обратную пропорциональность между усредненным по модели байесовским фактором и HMP можно формализовать как [2] [15] где
- - априорная вероятность альтернативной гипотезы такой, что
- ожидаемое значение согласно альтернативной гипотезе
- - вес, приписываемый p -значению
- включает вероятности и степени предыдущей модели в веса, и
- нормализует вес.
Приближение лучше всего работает для мощных тестов ( ).
Гармоническое среднее значение p как ограничение байесовского фактора
[ редактировать ]Для тестов отношения правдоподобия ровно с двумя степенями свободы теорема Уилкса подразумевает, что , где это максимальное отношение правдоподобия в пользу альтернативной гипотезы и поэтому , где - средневзвешенное максимальное отношение правдоподобия с использованием весов С является верхней границей фактора Байеса, , затем является верхней границей усредненного по модели фактора Байеса: Хотя эквивалентность справедлива только для двух степеней свободы, соотношение между и и поэтому аналогично ведет себя и для других степеней свободы. [2]
В предположении, что распределения значений p при альтернативных гипотезах соответствуют бета-распределениям с параметрами и что веса HMP обеспечивает более точную верхнюю границу усредненного по модели фактора Байеса: результат, который снова воспроизводит обратную пропорциональность эмпирических отношений Гуда. [16]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Хорошо, Эй Джей (1958). «Испытания значимости параллельно и последовательно». Журнал Американской статистической ассоциации . 53 (284): 799–813. дои : 10.1080/01621459.1958.10501480 . JSTOR 2281953 .
- ^ Перейти обратно: а б с д и ж г час я дж к л м н Уилсон, диджей (2019). «Гармоническое среднее значение p для объединения зависимых тестов» . Труды Национальной академии наук США . 116 (4): 1195–1200. дои : 10.1073/pnas.1814092116 . ПМК 6347718 . ПМИД 30610179 .
- ^ Перейти обратно: а б с Вовк Владимир ; Ван, Руоду (25 апреля 2019 г.). «Объединение значений p посредством усреднения» (PDF) . Алгоритмическое обучение в случайном мире .
- ^ Гоман, Джелле Дж.; Розенблатт, Джонатан Д.; Николс, Томас Э. (19 ноября 2019 г.). «Гармоническое среднее значение p: сильный или слабый контроль и предположение о независимости» . Труды Национальной академии наук . 116 (47): 23382–23383. дои : 10.1073/pnas.1909339116 . ISSN 0027-8424 . ПМК 6876242 . ПМИД 31662466 .
- ^ Фишер, Р.А. (1934). Статистические методы для научных работников (5-е изд.). Эдинбург, Великобритания: Оливер и Бойд.
- ^ Бенджамини Ю., Хохберг Ю. (1995). «Контроль количества ложных обнаружений: практичный и мощный подход к множественному тестированию». Журнал Королевского статистического общества. Серия Б (Методическая) . 57 (1): 289–300. дои : 10.1111/j.2517-6161.1995.tb02031.x . JSTOR 2346101 .
- ^ Маркус Р., Эрик П., Габриэль КР (1976). «О процедурах закрытого тестирования с особым упором на упорядоченный дисперсионный анализ». Биометрика . 63 (3): 655–660. дои : 10.1093/biomet/63.3.655 . JSTOR 2335748 .
- ^ Уилсон, Дэниел Дж. (17 августа 2019 г.). «Обновленная поправка к «Среднему гармоническому значению p для объединения независимых тестов» » (PDF) .
- ^ Хорошо, Эй Джей (1984). «C192. Один хвост против двух хвостов и эмпирическое правило среднего гармонического». Журнал статистических вычислений и моделирования . 19 (2): 174–176. дои : 10.1080/00949658408810727 .
- ^ Хорошо, Эй Джей (1984). «C193. Парные и непарные сравнения и эмпирическое правило среднего гармонического». Журнал статистических вычислений и моделирования . 19 (2): 176–177. дои : 10.1080/00949658408810728 .
- ^ Хорошо, Эй Джей (1984). «C213. Уточнение эмпирического правила гармонического среднего для объединения тестов «параллельно» ». Журнал статистических вычислений и моделирования . 20 (2): 173–176. дои : 10.1080/00949658408810770 .
- ^ Хорошо, Эй Джей (1984). «C214. Эмпирическое правило среднего гармонического: некоторые классы приложений». Журнал статистических вычислений и моделирования . 20 (2): 176–179. дои : 10.1080/00949658408810771 .
- ^ Хорошо, Ирвинг Джон. (2009). Хорошее мышление: основы вероятности и ее применение . Дуврские публикации. ISBN 9780486474380 . OCLC 319491702 .
- ^ Селлке, Томас; Баярри, MJ; Бергер, Джеймс О (2001). «Калибровка значений p для проверки точных нулевых гипотез». Американский статистик . 55 (1): 62–71. дои : 10.1198/000313001300339950 . ISSN 0003-1305 . S2CID 396772 .
- ^ Уилсон, диджей (2019). «Ответ на вопрос Хелда: когда среднее гармоническое значение p является фактором Байеса?» (PDF) . Труды Национальной академии наук США . 116 (13): 5857–5858. дои : 10.1073/pnas.1902157116 . ПМК 6442550 . ПМИД 30890643 .
- ^ Хелд, Л (2019). «О байесовской интерпретации среднего гармонического p -значения» . Труды Национальной академии наук США . 116 (13): 5855–5856. дои : 10.1073/pnas.1900671116 . ПМЦ 6442579 . ПМИД 30890644 .