Межквартильное среднее
Эта статья нуждается в дополнительных цитатах для проверки . ( январь 2024 г. ) |
Межквартильное среднее ( IQM ) (или среднее значение ) является статистической мерой центральной тенденции, основанной на усеченном среднем интерквартильном размахе . IQM очень похож на метод подсчета очков, используемый в видах спорта, которые оцениваются судейской коллегией: отбрасываются самые низкие и самые высокие оценки; вычислить среднее значение оставшихся баллов .
Расчет
[ редактировать ]При расчете IQM используются только данные между первым и третьим квартилем , а самые низкие 25% и самые высокие 25% данных отбрасываются.
при условии, что значения были упорядочены. [1]
Примеры
[ редактировать ]Размер набора данных делится на четыре
[ редактировать ]Метод лучше всего объяснить на примере. Рассмотрим следующий набор данных:
- 5, 8, 4, 38, 8, 6, 9, 7, 7, 3, 1, 6
Сначала отсортируйте список от самого низкого к высшему:
- 1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38
В наборе данных 12 наблюдений (точек данных), таким образом, у нас есть 4 квартиля по 3 числа. Отбросьте 3 самых низких и самых высоких значения:
1, 3, 4, 5, 6, 6, 7, 7, 8,8, 9, 38
Теперь у нас осталось 6 из 12 наблюдений; далее вычисляем среднее арифметическое этих чисел:
- х IQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6,5
Это интерквартильное среднее.
Для сравнения среднее арифметическое исходного набора данных равно
- (5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8.5
из-за сильного влияния выброса, 38.
Размер набора данных не делится на четыре
[ редактировать ]Приведенный выше пример состоял из 12 наблюдений в наборе данных, что очень упростило определение квартилей. Конечно, не во всех наборах данных количество наблюдений делится на 4. Мы можем скорректировать метод расчета IQM, чтобы учесть это. Поэтому в идеале мы хотим, чтобы IQM был равен среднему значению для симметричных распределений, например:
- 1, 2, 3, 4, 5
имеет среднее значение x mean = 3, и поскольку это распределение симметричное, x IQM желательно = 3.
Мы можем решить эту проблему, используя средневзвешенное значение квартилей и межквартильного набора данных:
Рассмотрим следующий набор данных из 9 наблюдений:
- 1, 3, 5, 7, 9, 11, 13, 15, 17
В каждом квартиле 9/4 = 2,25 наблюдений, в межквартильном диапазоне 4,5 наблюдений. Усеките размер дробного квартиля и удалите это число из 1-го и 4-го квартилей (2,25 наблюдений в каждом квартиле, таким образом, удаляются самые низкие 2 и самые высокие 2).
1, 3, (5), 7, 9, 11, (13),15, 17
Таким образом, в интерквартильном диапазоне имеется 3 полных наблюдения с весом 1 для каждого полного наблюдения и 2 дробных наблюдения с весом каждого наблюдения 0,75 (1-0,25 = 0,75). Таким образом, всего мы имеем 4,5 наблюдений в интерквартильном диапазоне (3×1 + 2×0,75 = 4,5 наблюдения).
IQM теперь рассчитывается следующим образом:
- х IQM = {(7 + 9 + 11) + 0,75 × (5 + 13)} / 4,5 = 9
В приведенном выше примере среднее значение имеет значение xmean = 9. Как и ожидалось, то же, что и IQM. Метод расчета IQM для любого числа наблюдений аналогичен; дробные вклады в IQM могут составлять 0, 0,25, 0,50 или 0,75.
Сравнение со средним и медианным
[ редактировать ]Межквартильное среднее имеет некоторые общие свойства как среднего , так и медианы :
- Как и медиана , IQM нечувствителен к выбросам ; в приведенном примере наибольшее значение (38) было очевидным выбросом набора данных, но его значение не используется при расчете IQM. С другой стороны, общее среднее ( среднее арифметическое ) чувствительно к этим выбросам: xmean = 8,5 .
- Как и среднее значение , IQM — это отдельный параметр, основанный на большом количестве наблюдений из набора данных. Медиана из всегда равна одному наблюдений в наборе данных (при условии нечетного количества наблюдений). Среднее значение может быть равно любому значению между самым низким и самым высоким наблюдением, в зависимости от значения всех других наблюдений. IQM может быть равен любому значению между первым и третьим квартилем, в зависимости от всех наблюдений в межквартильном диапазоне.
См. также
[ редактировать ]Связанная статистика
[ редактировать ]Приложения
[ редактировать ]- Лондонская межбанковская ставка предложения оценивала базовую процентную ставку как межквартильное среднее ставок, предлагаемых несколькими банками. ( SOFR , основная замена Libor в США, использует средневзвешенную по объему цену , которая не является устойчивой .)
- Everything2 использует межквартильное среднее значение репутации пользовательских рецензий для определения качества вклада пользователя. [1]
Ссылки
[ редактировать ]- ^ Салкинд, Нил (2010). Энциклопедия дизайна исследований . дои : 10.4135/9781412961288 . ISBN 978-1-4129-6127-1 .