Ранкит
В статистике статистики ранги набора данных — это ожидаемые значения порядка выборки из стандартного нормального распределения того же размера, что и данные. Они в основном используются в графике нормальной вероятности , графическом методе проверки нормальности .
Пример
[ редактировать ]Пожалуй, легче всего это понять на примере. Если выборка iid из шести элементов берется из нормально распределенной совокупности с ожидаемым значением 0 и дисперсией 1 ( стандартное нормальное распределение ), а затем сортируется в порядке возрастания, ожидаемые значения результирующей статистики порядка будут следующими:
- −1.2672, −0.6418, −0.2016, 0.2016, 0.6418, 1.2672.
Предположим, что числа в наборе данных
- 65, 75, 16, 22, 43, 40.
Затем их можно отсортировать и сопоставить с соответствующими рангами; в том порядке, в котором они
- 16, 22, 40, 43, 65, 75,
что дает очки:
точка данных | негодование |
---|---|
16 | −1.2672 |
22 | −0.6418 |
40 | −0.2016 |
43 | 0.2016 |
65 | 0.6418 |
75 | 1.2672 |
Эти точки затем отображаются как вертикальные и горизонтальные координаты диаграммы рассеяния .
Альтернативный метод
[ редактировать ]Альтернативно, вместо того, чтобы сортировать точки данных, можно ранжировать их и соответствующим образом переупорядочить ранги. Это дает те же пары чисел, но в другом порядке.
Для:
- 65, 75, 16, 22, 43, 40,
соответствующие ранги:
- 5, 6, 1, 2, 4, 3,
т. е. число, появляющееся первым, является 5-м наименьшим, число, появляющееся вторым, является 6-м наименьшим, число, появляющееся третьим, является наименьшим, число, появляющееся четвертым, является 2-м наименьшим и т. д. Соответственно перестраивают ожидаемую статистику нормального порядка, получая ранги этого набора данных:
точка данных | классифицировать | негодование |
---|---|---|
65 | 5 | 0.6418 |
75 | 6 | 1.2672 |
16 | 1 | −1.2672 |
22 | 2 | −0.6418 |
43 | 4 | 0.2016 |
40 | 3 | −0.2016 |
Ранкитский сюжет
[ редактировать ]График, на котором ранги располагаются по горизонтальной оси, а точки данных — по вертикальной оси, называется графиком рангов или графиком нормальной вероятности . Такой сюжет обязательно неубывающий. В больших выборках из нормально распределенной совокупности такой график будет приближаться к прямой линии. Существенные отклонения от прямолинейности считаются свидетельством против нормальности распределения.
Графики Ранкита обычно используются для визуальной демонстрации того, соответствуют ли данные заданному распределению вероятностей .
График рангов — это разновидность графика Q–Q : он отображает порядковую статистику (квантили) выборки в сравнении с определенными квантилями (рангами) предполагаемого нормального распределения. Однако на графиках Q – Q могут использоваться другие квантили нормального распределения.
История
[ редактировать ]График ранкита и слово ранкит были введены биологом и статистиком Честером Иттнером Блиссом (1899–1979).
См. также
[ редактировать ]- Пробит -анализ, разработанный К.И. Блиссом в 1934 году.