q -значение (статистика)
При проверке статистических гипотез , в частности при проверке множественных гипотез , q значение в процедуре Стори обеспечивает средство контроля процента положительных ложных открытий (pFDR). [1] Точно так же, как p значение дает ожидаемый уровень ложноположительных результатов , полученный путем отклонения нулевой гипотезы для любого результата с равным или меньшим значением p , значение q дает ожидаемый pFDR, полученный путем отклонения нулевой гипотезы для любого результата с равным значением. или меньшее значение q . [2]
История
[ редактировать ]В статистике одновременная проверка нескольких гипотез с использованием методов, подходящих для проверки отдельных гипотез, имеет тенденцию давать множество ложноположительных результатов: так называемая проблема множественных сравнений . [3] Например, предположим, что нужно проверить 1000 нулевых гипотез, все из которых верны, и (как это принято при проверке одной гипотезы) отвергнуть нулевые гипотезы с уровнем значимости 0,05; из-за случайности можно было бы ожидать, что 5% результатов окажутся значимыми ( P <0,05), что даст 50 ложноположительных результатов (отклонение нулевой гипотезы). [4] С 1950-х годов статистики разрабатывали методы множественных сравнений, которые уменьшали количество ложноположительных результатов, например, контроль коэффициента семейных ошибок (FWER) с использованием поправки Бонферрони , но эти методы также увеличивали количество ложноотрицательных результатов (т.е. уменьшали количество ложноотрицательных результатов). статистическая мощность ). [3] В 1995 году Йоав Бенджамини и Йосеф Хохберг предложили контролировать частоту ложных открытий (FDR) как более статистически мощную альтернативу контролю FWER при проверке множественных гипотез. [3] pFDR и значение q были введены Джоном Д. Стори в 2002 году, чтобы улучшить ограничение FDR, а именно то, что FDR не определяется при отсутствии положительных результатов. [1] [5]
Определение
[ редактировать ]Пусть существует нулевая гипотеза и альтернативная гипотеза . Выполнять проверка гипотез; пусть тестовая статистика будет iid случайными величинами такой, что . То есть, если верно для теста ( ), затем следует нулевому распределению ; в то время как если это правда( ), затем следует альтернативному распределению . Позволять , то есть для каждого теста верно с вероятностью и верно с вероятностью . Обозначим критическую область (значения для чего отклонено) на уровне значимости к . Пусть эксперимент даст значение для тестовой статистики. Значение q формально определяется как
То есть значение q является нижней границей pFDR, если отклонено для тестовой статистики со значениями . Эквивалентно, значение q равно
что является нижней границей вероятности того, что верно, учитывая, что отклонено ( коэффициент ложного обнаружения ). [1]
Связь с p значением
[ редактировать ]Значение p определяется как
минимальная вероятность того, что отклоняется, поскольку верно (доля ложноположительных результатов ). Сравнивая определения значений p и q , можно увидеть, что значение q — это минимальная апостериорная вероятность того, что это правда. [1]
Интерпретация
[ редактировать ]Значение q можно интерпретировать как уровень ложных обнаружений (FDR): долю ложноположительных результатов среди всех положительных результатов. Учитывая набор тестовых статистических данных и связанных с ними значений q , отклонение нулевой гипотезы для всех тестов, значение q которых меньше или равно некоторому порогу. гарантирует, что ожидаемое значение частоты ложных обнаружений равно . [6]
Приложения
[ редактировать ]Биология
[ редактировать ]Экспрессия генов
[ редактировать ]Полногеномный анализ дифференциальной экспрессии генов включает одновременное тестирование экспрессии тысяч генов. Контроль FWER (обычно до 0,05) позволяет избежать чрезмерных ложноположительных результатов (т. е. обнаружения дифференциальной экспрессии в гене, который не экспрессируется дифференциально), но налагает строгий порог для значения p , что приводит к множеству ложноотрицательных результатов (многие дифференциально экспрессируемые гены игнорируются). . Однако контроль pFDR путем выбора генов со значительными значениями q снижает количество ложноотрицательных результатов (увеличивает статистическую мощность), обеспечивая при этом низкое ожидаемое значение доли ложноположительных результатов среди всех положительных результатов (например, 5%). [6]
Например, предположим, что среди 10 000 протестированных генов 1000 действительно дифференциально экспрессируются, а 9000 — нет:
- Если мы считаем, что каждый ген с p -значением менее 0,05 дифференциально экспрессируется, мы ожидаем, что 450 (5%) из 9000 генов, которые не экспрессируются дифференциально, окажутся дифференциально экспрессируемыми (450 ложноположительных результатов).
- Если мы контролируем FWER до 0,05, вероятность получения хотя бы одного ложного срабатывания составляет всего 5%. Однако этот очень строгий критерий снизит мощность настолько, что лишь немногие из 1000 генов, которые на самом деле экспрессируются дифференциально, окажутся дифференциально экспрессируемыми (многие ложноотрицательные результаты).
- Если мы контролируем pFDR до 0,05, считая все гены со значением q менее 0,05 дифференциально экспрессируемыми, то мы ожидаем, что 5% положительных результатов будут ложноположительными (например, 900 истинных положительных результатов, 45 ложных положительных результатов, 100 ложных положительных результатов). негативы, 8955 истинных негативов). Эта стратегия позволяет получить относительно небольшое количество как ложноположительных, так и ложноотрицательных результатов.
Реализации
[ редактировать ]Примечание: ниже приведен неполный список.
Р
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д Стори, Джон Д. (2002). «Прямой подход к уровню ложного обнаружения». Журнал Королевского статистического общества, серия B (статистическая методология) . 64 (3): 479–498. CiteSeerX 10.1.1.320.7131 . дои : 10.1111/1467-9868.00346 .
- ^ Стори, Джон Д. (2003). «Положительная частота ложных открытий: байесовская интерпретация и значение q» . Анналы статистики . 31 (6): 2013–2035. дои : 10.1214/aos/1074290335 .
- ^ Jump up to: а б с Бенджамини, Йоав; Хохберг, Йосеф (1995). «Контроль количества ложных обнаружений: практичный и мощный подход к множественному тестированию». Журнал Королевского статистического общества. Серия Б (Методическая) . 57 : 289–300. дои : 10.1111/j.2517-6161.1995.tb02031.x .
- ^ Нуццо, Регина (2014). «Научный метод: Статистические ошибки» . Природа . Проверено 5 марта 2019 г.
- ^ Стори, Джон Д. (2002). «Прямой подход к уровню ложного обнаружения». Журнал Королевского статистического общества, серия B (статистическая методология) . 64 (3): 479–498. CiteSeerX 10.1.1.320.7131 . дои : 10.1111/1467-9868.00346 .
- ^ Jump up to: а б Стори, Джон Д.; Тибширани, Роберт (2003). «Статистическая значимость для полногеномных исследований» . ПНАС . 100 (16): 9440–9445. Бибкод : 2003PNAS..100.9440S . дои : 10.1073/pnas.1530509100 . ПМК 170937 . ПМИД 12883005 .
- ^ Стори, Джон Д.; Басс, Эндрю Дж.; Дэбни, Алан; Робинсон, Дэвид; Уорнс, Грегори (2019). «qvalue: оценка значения Q для контроля частоты ложных обнаружений» . Биопроводник .