График P – P

В статистике график P-P ( график вероятность-вероятность или график процентов-процентов или график значения P ) представляет собой вероятностный график для оценки того, насколько близко согласуются два набора данных , или для оценки того, насколько близко набор данных соответствует конкретной модели. Он работает путем построения графика двух кумулятивных функций распределения друг против друга; если они похожи, данные будут выглядеть почти прямой линией. Такое поведение похоже на поведение более широко используемого графика Q–Q , с которым его часто путают.
Определение
[ редактировать ]График AP – P отображает две кумулятивные функции распределения (cdfs) друг против друга: [ 1 ] учитывая два распределения вероятностей, с cdfs " F " и " G ", он строит поскольку z варьируется от к Поскольку cdf имеет диапазон [0,1], область определения этого параметрического графа равна а диапазон - это единичный квадрат
Таким образом, для входа z выходом является пара чисел, показывающая, какой и какой f процент g приходится процент на z или ниже .
Линия сравнения — это линия под углом 45° от (0,0) до (1,1), и распределения равны тогда и только тогда, когда график попадает на эту линию. Степень отклонения позволяет легко визуально определить, насколько различны распределения, но из-за ошибки выборки даже выборки, взятые из идентичных распределений, не будут выглядеть идентичными. [ 2 ]
Пример
[ редактировать ]Например, если два распределения не перекрываются, скажем, F находится ниже G, тогда график P – P будет перемещаться слева направо вдоль нижней части квадрата – когда z движется через опору F, cdf F изменяется от 0 до 1, в то время как CDF G остается на 0 – а затем перемещается вверх по правой стороне квадрата – CDF F теперь равен 1, поскольку все точки F лежат ниже всех точек G, и теперь CDF ходов G от 0 до 1 при движении z через опору G. (для этого пункта нужен график)
Использовать
[ редактировать ]Как показано в приведенном выше примере, если два распределения разделены в пространстве, график P – P даст очень мало данных – он полезен только для сравнения распределений вероятностей, которые имеют близкое или одинаковое расположение. Примечательно, что оно пройдет через точку (1/2, 1/2) тогда и только тогда, когда два распределения имеют одинаковую медиану .
Графики P–P иногда ограничиваются сравнением двух выборок, а не сравнением выборки с распределением теоретической модели. [ 3 ] Однако они имеют общее применение, особенно там, где не все наблюдения моделируются с одинаковым распределением.
Тем не менее, он нашел некоторое применение при сравнении выборочного распределения с известным теоретическим распределением: для n выборок построение графика непрерывного теоретического CDF против эмпирического CDF дало бы ступеньку (шаг, когда z достигает выборки) и достигло бы вершины. площади, когда была достигнута последняя точка данных. Вместо этого строят только точки, отображая наблюдаемые k- ые наблюдаемые точки (по порядку: формально наблюдаемая статистика k -го порядка) против k /( n + 1) квантиля теоретического распределения. [ 3 ] Этот выбор «положения графика» (выбор квантиля теоретического распределения) вызвал меньше споров, чем выбор графиков Q – Q. Полученная в результате точность соответствия линии 45° дает меру разницы между набором выборок и теоретическим распределением.
График AP – P можно использовать как графическое дополнение к тестам на соответствие вероятностных распределений. [ 4 ] [ 5 ] при этом на график включаются дополнительные линии, обозначающие либо конкретные области приемлемости, либо диапазон ожидаемого отклонения от линии 1:1. Доступна улучшенная версия графика P–P, называемая графиком SP или S–P. [ 4 ] [ 5 ] который использует преобразование, стабилизирующее дисперсию, для создания графика, на котором отклонения от линии 1:1 должны быть одинаковыми во всех местоположениях.
См. также
[ редактировать ]Ссылки
[ редактировать ]Цитаты
[ редактировать ]- ^ Непараметрический статистический вывод , Джин Дикинсон Гиббонс Субхабрата Чакраборти, 4-е издание, CRC Press, 2003, ISBN 978-0-8247-4052-8 , с. 145
- ^ Деррик, Б; Тохер, Д; Уайт, П. (2016). «Почему тест Уэлча устойчив к ошибкам I рода» . Количественные методы в психологии . 12 (1): 30–38. дои : 10.20982/tqmp.12.1.p030 .
- ^ Перейти обратно: а б Тестирование на нормальность , Генри К. Тоуд, CRC Press, 2002 г., ISBN 978-0-8247-9613-6 , Раздел 2.2.3, Процентно-процентные графики, с. 23
- ^ Перейти обратно: а б Майкл младший (1983) «Сюжет стабилизированной вероятности». Биометрика , 70(1), 11–17. JSTOR 2335939
- ^ Перейти обратно: а б Шорак, Г. Р. , Веллнер, Дж. А. (1986) Эмпирические процессы с применением к статистике , Уайли. ISBN 0-471-86725-X стр . 248–250
Источники
[ редактировать ]- Дэвидсон, Рассел; Маккиннон, Джеймс (январь 1998 г.). «Графические методы исследования размера и мощности проверок гипотез». Манчестерская школа . 66 (1): 1–26. CiteSeerX 10.1.1.57.4335 . дои : 10.1111/1467-9957.00086 .