Вероятностный график. График коэффициента корреляции.
График коэффициента корреляции вероятностного графика (PPCC) — это графический метод определения параметра формы для семейства распределения, который лучше всего описывает набор данных. Этот метод подходит для семейств, таких как Вейбулла , которые определяются одним параметром формы, а также параметрами местоположения и масштаба , и не подходит или даже невозможен для распределений, таких как нормальное , которые определяются только местоположением и масштабом. параметры.
Многие статистические анализы основаны на предположениях о распределении населения , от которого были получены данные. Однако семейства распределения могут иметь совершенно разные формы в зависимости от значения параметра формы . Поэтому поиск разумного выбора параметра формы является необходимым шагом в анализе. Во многих анализах основной целью анализа является поиск хорошей модели распределения данных.
Техника заключается в том, чтобы просто «построить график коэффициентов корреляции вероятностного графика для различных значений параметра формы и выбрать то значение, которое лучше всего подходит».
Определение
[ редактировать ]График PPCC формируется:
- Вертикальная ось: коэффициент корреляции вероятностного графика ;
- Горизонтальная ось: значение параметра формы.
То есть для ряда значений параметра формы вычисляется коэффициент корреляции для вероятностного графика, связанного с данным значением параметра формы. Эти коэффициенты корреляции отображаются в зависимости от соответствующих им параметров формы. Максимальный коэффициент корреляции соответствует оптимальному значению параметра формы. Для большей точности можно создать две итерации графика PPCC; первый предназначен для поиска правильной окрестности, а второй — для точной настройки оценки.
График PPCC используется в первую очередь для поиска подходящего значения параметра формы. Затем создается вероятностный график для определения оценок параметров местоположения и масштаба, а также для графической оценки адекватности распределения.
График PPCC отвечает на следующие вопросы:
- Какой член распределительной семьи лучше всего подходит?
- Обеспечивает ли наиболее подходящий член хорошее соответствие (с точки зрения построения вероятностного графика с высоким коэффициентом корреляции)?
- Подходит ли это семейство дистрибутивов по сравнению с другими дистрибутивами?
- Насколько чувствителен выбор параметра формы?
Сравнение дистрибутивов
[ редактировать ]Помимо поиска хорошего выбора для оценки параметра формы данного распределения, график PPCC может быть полезен при принятии решения о том, какое семейство распределений является наиболее подходящим. Например, учитывая набор данных о надежности , можно создать графики PPCC для распределения Вейбулла, логнормального , гамма- и обратного распределения Гаусса и, возможно, других на одной странице. На этой одной странице будет показано наилучшее значение параметра формы для нескольких распределений и дополнительно указано, какое из этих семейств распределений обеспечивает наилучшее соответствие (измеряемое коэффициентом корреляции графика максимальной вероятности). То есть, если максимальное значение PPCC для Вейбулла составляет 0,99 и только 0,94 для логнормального, то можно разумно заключить, что семейство Вейбулла является лучшим выбором.
При сравнении моделей распределения не следует просто выбирать ту, у которой максимальное значение PPCC. Во многих случаях несколько подборов распределения обеспечивают сопоставимые значения PPCC. Например, логарифмически нормальное значение и Вейбулла могут вполне хорошо соответствовать заданному набору данных о надежности. Обычно следует учитывать сложность распределения. То есть более простое распределение с немного меньшим значением PPCC может быть предпочтительнее более сложного распределения. Аналогичным образом, в некоторых случаях может быть теоретическое обоснование с точки зрения базовой научной модели для предпочтения распределения с немного меньшим значением PPCC. В других случаях может не потребоваться знать, оптимальна ли модель распределения, а достаточно знать, что она подходит для наших целей. То есть можно использовать методы, разработанные для нормально распределенных данных, даже если другие распределения соответствуют данным несколько лучше.
График Тьюки-лямбда PPCC для симметричных распределений
[ редактировать ]График Тьюки лямбда PPCC с параметром формы λ особенно полезен для симметричных распределений. Он указывает, является ли распределение коротким или длиннохвостым, а также может указывать на несколько распространенных распределений. Конкретно,
- λ = −1: распределение приблизительно Коши
- λ = 0: распределение в точности логистическое
- λ = 0,14: распределение примерно нормальное
- λ = 0,5: распределение U-образное
- λ = 1: распределение точно равномерное (−1, 1)
Если график Тьюки лямбда PPCC дает максимальное значение около 0,14, можно разумно заключить, что нормальное распределение является хорошей моделью для данных. Если максимальное значение меньше 0,14, распределение с длинным хвостом, такое как двойное экспоненциальное лучшим выбором будет или логистическое. Если максимальное значение близко к −1, это подразумевает выбор распределения с очень длинным хвостом, такого как Коши. Если максимальное значение больше 0,14, это подразумевает распределение с коротким хвостом, такое как бета или равномерное.
График Тьюки-лямбда PPCC используется, чтобы предложить подходящее распределение. Необходимо следить за PPCC и графиками вероятности соответствующих альтернатив.
См. также
[ редактировать ]Внешние ссылки
[ редактировать ]Ссылки
[ редактировать ]- Филлибен, Джей-Джей (февраль 1975 г.). «Тестирование коэффициента корреляции вероятностного графика на нормальность». Технометрика . 17 (1): 111–117. дои : 10.2307/1268008 . JSTOR 1268008 .
Эта статья включает общедоступные материалы Национального института стандартов и технологий.