Семизначное резюме
В описательной статистике семизначная сводка представляет собой совокупность семи сводных статистических данных и является расширением пятизначной сводки . Есть три похожие, распространенные формы.
Как и в случае сводки из пяти чисел, ее можно представить в виде модифицированной ящичковой диаграммы , добавив штриховки на «усах» для двух дополнительных чисел.
Семизначное резюме
[ редактировать ]Следующие процентили (приблизительно) равномерно распределены по нормально распределенной переменной:
нормального распределения Семь итоговых чисел Нет. Приблизительный
процентильБолее точный
процентильАльтернативное имя (а) #1 2-й 2.15% нижний конец нижнего уса #2 9-е 8.87% нижняя штриховка усов #3 25-е 25.00% нижний квартиль или первый квартиль #4 50-й 50.00% медиана , среднее значение или второй квартиль #5 75-е место 75.00% верхний квартиль или третий квартиль #6 91-й 91.13% верхняя штриховка усов #7 98-й 97.85% верхний конец усов
Три средних значения – нижний квартиль , медиана и верхний квартиль – представляют собой обычные статистические данные из пятизначной сводки и являются стандартными значениями для прямоугольника на коробчатой диаграмме .
Два необычных процентиля на обоих концах используются потому, что местоположения всех семи значений будут примерно одинаково расположены, если данные распределены нормально. [а] Некоторые статистические тесты требуют нормально распределенных данных , поэтому нанесенные на график значения обеспечивают удобную визуальную проверку достоверности последующих тестов путем простого сканирования, чтобы увидеть, находятся ли отметки для этих семи процентилей на графике на одинаковом расстоянии друг от друга.
Обратите внимание, что в то время как крайние значения пятизначного сводного отчета зависят от количества выборок, этот семизначный сводный отчет не зависит от количества выборок и является несколько более стабильным, поскольку его концы защищены от обычных резких колебаний крайних значений выборку, заменив их более устойчивыми 2-м и 98-м процентилями.
Значения могут быть представлены с использованием модифицированной коробчатой диаграммы . 2-й и 98-й процентили представлены концами усов, а штриховки на усах обозначают 9-й и 91-й процентили.
Семизначная сумма Боули
[ редактировать ]Артур Боули использовал набор непараметрических статистических данных , названных «семизначными сводками», включая крайние значения, децили и квартили , а также медиану. [1]
Таким образом, цифры:
Семь сводных цифр Боули [1] Нет. процентиль Альтернативное имя (а) #1 0% минимум выборки (номинальный: наивысший нулевой процентиль) #2 10% первый дециль #3 25% нижний квартиль или первый квартиль #4 50% медиана , среднее значение или второй квартиль #5 75% верхний квартиль или третий квартиль #6 90% последний дециль #7 100% максимум выборки (номинальный: самый низкий сотый процентиль)
Обратите внимание, что средние пять из семи чисел почти такие же, как и в сводке из семи чисел, приведенной выше.
Сложение децилей позволяет вычислить междецильный диапазон , который для нормального распределения можно масштабировать, чтобы получить достаточно эффективную оценку стандартного отклонения, и 10%-ный промежуточный итог , который по сравнению с медианой дает представление об асимметрии в хвосты.
Семизначное резюме Тьюки
[ редактировать ]Джон Тьюки использовал семизначную сводку, состоящую из крайних значений, октилей , квартилей и медианы. [2]
Семь чисел:
Семь сводных цифр Тьюки [2] Нет. процентиль Альтернативное имя (а) #1 0% минимум выборки (номинальный: наивысший нулевой процентиль) #2 12.5% первый октиль #3 25.0% нижний квартиль или первый квартиль #4 50.0% медиана , среднее значение или второй квартиль #5 75.0% верхний квартиль или третий квартиль #6 87.5% последний октиль #7 100% максимум выборки (номинальный: самый низкий сотый процентиль)
Обратите внимание, что средние пять из семи чисел можно получить путем последовательного разделения упорядоченных данных на подмножества одинакового размера. Расширение семизначной сводки путем дальнейшего разделения дает девятизначную сводку , одиннадцатизначную сводку и так далее.
См. также
[ редактировать ]Сноски
[ редактировать ]- ^ Семь равноотстоящих процентилей с трехзначной точностью: 2,15%, 8,87%, 25,0%, 50,0%, 75,0%, 91,13% и 97,85%.
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Боули, А. (1920). Элементарное руководство по статистике (3-е изд.). п. 62 .
семь позиций — это максимум и минимум, медиана, квартиль и два дециля.
- ^ Перейти обратно: а б Тьюки, Дж. (1977). Исследовательский анализ данных . п. 53 .