Правило трех (статистика)
В статистическом анализе правило трех гласит, что если определенное событие не произошло в выборке из n субъектов , интервал от 0 до 3/ n представляет собой 95% доверительный интервал для частоты возникновения в популяции . Когда n больше 30, это хорошее приближение к результатам более чувствительных тестов. Например, обезболивающее лекарство тестируется на 1500 людях , и не ни одного нежелательного явления зарегистрировано . На основе правила трех можно с 95% уверенностью сделать вывод, что менее чем у 1 человека из 500 (или 3/1500) возникнут нежелательные явления. По симметрии только для успешных результатов 95% доверительный интервал равен [1−3/ n ,1] .
Это правило полезно при интерпретации клинических исследований в целом, особенно в фазе II и фазе III, где часто существуют ограничения по продолжительности или статистической мощности . Правило трех применимо не только к медицинским исследованиям, но и к любому исследованию, проводимому n раз. Если 300 парашютов будут протестированы случайным образом и все они успешно откроются, то с уверенностью 95% будет сделан вывод, что менее 1 из 100 парашютов с одинаковыми характеристиками (3/300) выйдут из строя. [1]
Вывод
[ редактировать ]95% доверительный интервал ищется для вероятности p события, произошедшего для любого случайно выбранного отдельного индивидуума в популяции, при условии, что его возникновение не наблюдалось в n исследованиях Бернулли . Обозначая количество событий через X , мы поэтому хотим найти значения параметра p биномиального распределения , которые дают Pr( X = 0) ≤ 0,05. Затем можно вывести правило [2] либо из приближения Пуассона к биномиальному распределению , либо из формулы (1− p ) н для вероятности нулевых событий в биномиальном распределении. В последнем случае край доверительного интервала определяется соотношением Pr( X = 0) = 0,05 и, следовательно, (1− p ) н = 0,05, поэтому n ln (1– p ) = ln 0,05 ≈ −2,996. Округляя последнее до −3 и используя для p , близкого к 0, приближение ln(1− p ) ≈ − p (формула Тейлора), мы получаем границу интервала 3/ n .
По аналогичному аргументу значения числителя 3,51, 4,61 и 5,3 могут использоваться для доверительных интервалов 97%, 99% и 99,5% соответственно, и в целом верхний предел доверительного интервала может быть задан как , где желаемый уровень доверия.
Расширение
[ редактировать ]Неравенство Высочанского -Петунина показывает, что правило трех справедливо для унимодальных распределений с конечной дисперсией, выходящим за рамки только биномиального распределения, и дает возможность изменить коэффициент 3, если требуется другая достоверность. Неравенство Чебышева устраняет предположение об одномодальности ценой более высокого мультипликатора (около 4,5 для 95% уверенности). Неравенство Кантелли — это односторонняя версия неравенства Чебышева.
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Существуют и другие значения термина « правило трех » в математике, а также еще одно отдельное значение в статистике:
Полтора века назад Чарльз Дарвин сказал, что он «не верит ни во что, кроме фактического измерения и правила трех », под которым он, по-видимому, имел в виду вершину арифметических достижений джентльмена девятнадцатого века, решающего х в « 6 относится к 3, как 9 относится к х ». Несколько десятилетий спустя, в начале 1900-х годов, Карл Пирсон изменил смысл правила трех – «считать 3σ [ три стандартных отклонения ] определенно значимым» – и заявил об этом в своем новом журнале тестирования значимости « Биометрика» . Даже Дарвин в позднем возрасте, кажется, впал в замешательство. (Зилиак и Макклоски, 2008, стр. 26; примечание в скобках в оригинале)
- ^ «Профессор Мин» (2010) «Доверительный интервал с нулевыми событиями» , Детская больница милосердия. Проверено 1 января 2013 г.
Ссылки
[ редактировать ]- Эйпаш, Эрнст; Рольф Леферинг; СК Кум; Ганс Тройдл (1995). «Вероятность еще не произошедших нежелательных явлений: статистическое напоминание» . БМЖ . 311 (7005): 619–620. дои : 10.1136/bmj.311.7005.619 . ПМК 2550668 . ПМИД 7663258 .
- Хэнли, Дж.А.; А. Липпман-Хэнд (1983). «Если ничего не пойдет не так, все ли в порядке?». ДЖАМА . 249 (13): 1743–5. дои : 10.1001/jama.1983.03330370053031 . ПМИД 6827763 . S2CID 44723518 .
- Зилиак, СТ; Д.Н. Макклоски (2008). Культ статистической значимости: как стандартная ошибка стоит нам работы, справедливости и жизней . Издательство Мичиганского университета. ISBN 0472050079