Jump to content

Усеченное среднее

Усеченное среднее значение или усеченное среднее значение является статистической мерой центральной тенденции , во многом подобно среднему значению и медиане . Он включает в себя вычисление среднего значения после отбрасывания заданных частей распределения вероятностей или выборки на верхнем и нижнем уровнях и обычно отбрасывания равного количества того и другого. Количество сбрасываемых очков обычно указывается в процентах от общего количества очков, но также может быть указано как фиксированное количество очков.

Для большинства статистических приложений отбрасывается от 5 до 25 процентов концов. Например, для набора из 8 точек обрезка на 12,5 % приведет к отбрасыванию минимального и максимального значений в выборке: наименьшему и наибольшему значениям и вычислению среднего значения оставшихся 6 точек. Обрезанное среднее значение 25 % (когда отбрасываются самые низкие 25 % и самые высокие 25 %) известно как интерквартильное среднее .

Медиану можно рассматривать как полностью усеченное среднее значение, и она является наиболее устойчивой. Как и в случае с другими усеченными оценщиками , основным преимуществом усеченного среднего является надежность и более высокая эффективность для смешанных распределений и распределений с тяжелым хвостом (например, распределения Коши ) за счет более низкой эффективности для некоторых других распределений с менее сильным хвостом (таких как распределение Коши). нормальное распределение). Для промежуточных распределений различия между эффективностью среднего и медианы не очень велики, например, для распределения Стьюдента с двумя степенями свободы дисперсии среднего и медианы почти равны.

Терминология

[ редактировать ]

В некоторых регионах Центральной Европы оно также известно как среднее Виндзорское . [ нужна ссылка ] но это имя не следует путать со средним значением Винсора : в последнем наблюдения, которые отбрасывает усеченное среднее, вместо этого заменяются наибольшим/наименьшим из оставшихся значений.

Отбрасывание только максимума и минимума называется модифицированное среднее значение , особенно в управленческой статистике. [1] Это также известно как Олимпийский средний показатель (например, в сельском хозяйстве США, например, « Выбор среднего дохода от урожая ») из-за его использования в олимпийских соревнованиях, таких как система судейства ИСУ в фигурном катании , чтобы сделать оценку устойчивой к одному судье, выходящему за рамки. [2]

Интерполяция

[ редактировать ]

Когда процент отбрасываемых точек не дает целого числа, усеченное среднее значение может быть определено путем интерполяции, обычно линейной интерполяции, между ближайшими целыми числами. Например, если вам нужно вычислить усеченное среднее значение 15 % для выборки, содержащей 10 записей, строго это будет означать отбрасывание по 1 баллу с каждого конца (что эквивалентно усеченному среднему 10 %). При интерполяции вместо этого можно было бы вычислить усеченное среднее 10% (отбрасывая по 1 точке с каждого конца) и усеченное среднее 20% (отбрасывая 2 точки с каждого конца), а затем интерполируя, в данном случае усредняя эти два значения. Аналогично, при интерполяции усеченного среднего значения 12% можно было бы взять средневзвешенное значение : взвесить усеченное среднее значение 10% на 0,8 и усеченное среднее значение 20% на 0,2.

Преимущества

[ редактировать ]

Усеченное среднее значение является полезным средством оценки, поскольку оно менее чувствительно к выбросам, чем среднее значение, но все равно дает разумную оценку центральной тенденции или среднего значения для многих статистических моделей. В этом отношении его называют робастной оценкой . Например, при использовании в олимпийском судействе усечение максимального и минимального значений не позволяет одному судье повысить или понизить общую оценку, поставив исключительно высокую или низкую оценку.

Одна из ситуаций, в которой может быть выгодно использовать усеченное среднее значение, — это оценка параметра местоположения распределения Коши , колоколообразного распределения вероятностей с (намного) более толстыми хвостами, чем у нормального распределения . Можно показать, что усеченное среднее среднего порядка выборки в 24% (т.е. усечение выборки на 38% на каждом конце) дает оценку параметра местоположения совокупности, которая более эффективна, чем использование либо медианы выборки, либо полной выборки. выборочное среднее. [3] [4] Однако из-за «толстых хвостов» распределения Коши эффективность средства оценки снижается по мере того, как в оценке используется большая часть выборки. [3] [4] Обратите внимание, что для распределения Коши ни усеченное среднее, ни полное выборочное среднее, ни выборочная медиана не представляют собой оценку максимального правдоподобия и не являются столь асимптотически эффективными, как оценка максимального правдоподобия; однако оценку максимального правдоподобия вычислить сложнее, поэтому полезной альтернативой остается усеченное среднее. [4] [5]

Статистические тесты

[ редактировать ]

Можно выполнить t-критерий Стьюдента на основе усеченного среднего значения, который называется t-критерием Юэня, [6] [7] также имеет несколько реализаций в R. который [8] [9]

Метод подсчета очков, используемый во многих видах спорта , которые оцениваются судейской коллегией, представляет собой усеченный средний балл: отбрасываются самые низкие и самые высокие оценки; вычислить среднее значение оставшихся баллов . [10]

Базовая Libor процентная ставка рассчитывается как усеченное среднее: при наличии 18 ответов 4 верхних и 4 нижних отбрасываются, а оставшиеся 10 усредняются (полученный коэффициент обрезки 4/18 ≈ 22%). [11]

Рассмотрим набор данных, состоящий из:

{92, 19, 101 , 58, 1053 , 91, 26, 78, 10, 13, -40 , 101 , 86, 85, 15, 89, 89, 28, -5 , 41} (N = 20, среднее = 101,5)

5-й процентиль (-6,75) находится между -40 и -5, а 95-й процентиль (148,6) находится между 101 и 1053 (значения выделены жирным шрифтом). Тогда усеченное среднее значение на 5% приведет к следующему:

{92, 19, 101, 58, 91, 26, 78, 10, 13, 101, 86, 85, 15, 89, 89, 28, -5, 41} (N = 18, среднее = 56,5)

Этот пример можно сравнить с примером использования процедуры Winsorising .

См. также

[ редактировать ]
  1. ^ Арулможи, Г.; Статистика для менеджмента, 2-е издание, Tata McGraw-Hill Education, 2009, с. 458
  2. ^ Пол Э. Петерсон (3 августа 2012 г.). «Уроки LIBOR» . После компиляции котировок LIBOR использует процесс усечения среднего, при котором самые высокие и самые низкие значения отбрасываются, а оставшиеся значения усредняются. Его иногда называют «олимпийским средним показателем», поскольку он используется на Олимпийских играх, чтобы исключить влияние предвзятого судьи на окончательный результат спортсмена.
  3. ^ Перейти обратно: а б Ротенберг, Томас Дж.; Фишер, Франклин, М.; Тиланус, CB (1964). «Заметка об оценке по выборке Коши». Журнал Американской статистической ассоциации . 59 (306): 460–463. дои : 10.1080/01621459.1964.10482170 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ Перейти обратно: а б с Блох, Дэниел (1966). «Заметка об оценке параметров местоположения распределения Коши». Журнал Американской статистической ассоциации . 61 (316): 852–855. дои : 10.1080/01621459.1966.10480912 . JSTOR   2282794 .
  5. ^ Фергюсон, Томас С. (1978). «Оценки максимального правдоподобия параметров распределения Коши для выборок размера 3 и 4». Журнал Американской статистической ассоциации . 73 (361): 211–213. дои : 10.1080/01621459.1978.10480031 . JSTOR   2286549 .
  6. ^ Юэн, К.К. (1974) Обрезание t с двумя выборками для неравных дисперсий генеральной совокупности. Биометрика, 61, 165-170.
  7. ^ Уилкокс, Р.Р. (2005). Введение в робастную оценку и проверку гипотез. Академическая пресса.
  8. ^ «WRS2: Сборник надежных статистических методов» . 20 июля 2021 г.
  9. ^ «DescTools: Инструменты для описательной статистики» . 9 сентября 2021 г.
  10. ^ Бялик, Карл (27 июля 2012 г.). «Устранение предвзятости судей — задача олимпийского масштаба» . Уолл Стрит Джорнал . Проверено 7 сентября 2014 г.
  11. ^ «Ббалибор: Основы» . Ассоциация британских банкиров.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 07c8e65d981a0d540f909e18c7a25f62__1687795800
URL1:https://arc.ask3.ru/arc/aa/07/62/07c8e65d981a0d540f909e18c7a25f62.html
Заголовок, (Title) документа по адресу, URL1:
Truncated mean - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)