L-момент

В статистике — это последовательность статистических данных , L-моменты используемых для суммирования формы распределения вероятностей . [1] [2] [3] [4] Они представляют собой линейные комбинации порядковой статистики ( L-статистики ), аналогичных обычным моментам , и могут использоваться для расчета величин, аналогичных стандартному отклонению , асимметрии и эксцессу , называемым L-шкалой, L-асимметрией и L-эксцессом соответственно (L-шкала, L-асимметрия и L-эксцесс соответственно). -mean идентично обычному среднему ). Стандартизированные L-моменты называются отношениями L-моментов и аналогичны стандартизированным моментам . Как и в случае с обычными моментами, теоретическое распределение имеет набор L-моментов населения. L-моменты выборки могут быть определены для выборки из совокупности и могут использоваться в качестве оценок L-моментов совокупности.

L Популяционные - моменты

Для случайной величины X r - равен й L-момент популяции [1]

где X k:n обозначает статистику k -го порядка ( k -е наименьшее значение) в независимой выборке размера n из распределения X и обозначает ожидаемого значения оператор . В частности, первые четыре L-момента населенности равны

Обратите внимание, что коэффициенты r -го L-момента такие же, как и в r -м члене биномиального преобразования , используемого в r -го порядка конечной разности (конечный аналог производной).

Первые два из этих L-моментов имеют условные названия:

это «среднее», «L-среднее» или «L-местоположение»,
это «L-шкала».

L-шкала равна половине средней абсолютной разницы . [5]

Примеры L-моментов [ править ]

L-моменты выборки можно вычислить как L-моменты совокупности выборки, суммируя по подмножествам r -элементов выборки. следовательно, усреднение путем деления на биномиальный коэффициент :

Группируя их по статистике порядка, подсчитывает количество способов, которыми элемент выборки из n элементов может быть j -м элементом подмножества r элементов, и дает формулы вида, приведенного ниже. Прямые оценки первых четырех L-моментов в конечной выборке из n наблюдений: [6]

где x ( i ) i -го статистика порядка , а является биномиальным коэффициентом . Выборочные L-моменты также могут быть определены косвенно через взвешенные по вероятности моменты , [1] [7] [8] что приводит к более эффективному алгоритму их вычисления. [6] [9]

Соотношения L-моментов [ править ]

Набор отношений L-моментов или масштабированных L-моментов определяется формулой

Наиболее полезными из них являются называется L-асимметрией , и L -эксцесс .

Отношения L-моментов лежат в интервале (−1, 1) . Более точные границы можно найти для некоторых конкретных отношений моментов L; в частности, L-эксцесс лежит в [ - + 1 / 4 1 ) и ,

[1]

Также можно определить величину, аналогичную коэффициенту вариации , но на основе L-моментов: который называется «коэффициентом L-вариации», или «L-CV». Для неотрицательной случайной величины это лежит в интервале ( 0, 1 ) [1] и идентичен коэффициенту Джини . [10]

Сопутствующие количества [ править ]

L-моменты - это статистические величины, полученные из взвешенных по вероятности моментов. [11] (ШИМ), которые были определены ранее (1979 г.). [7] ШИМ используются для эффективной оценки параметров распределений, выражаемых в обратной форме, таких как Gumbel , [8] лямбда Тьюки и распределения Уэйкби .

Использование [ править ]

Существует два распространенных способа использования L-моментов, в обоих случаях аналогично обычным моментам:

  1. В качестве сводной статистики для данных.
  2. Получить оценки параметров вероятностных распределений , применяя метод моментов к L-моментам, а не к обычным моментам.

Помимо выполнения этих операций со стандартными моментами, последняя (оценка) чаще выполняется с использованием максимального правдоподобия методов ; однако использование L-моментов дает ряд преимуществ. В частности, L-моменты более устойчивы , чем обычные моменты, и для существования более высоких L-моментов требуется только, чтобы случайная величина имела конечное среднее значение. Одним из недостатков отношений L-моментов для оценки является их обычно меньшая чувствительность. Например, распределение Лапласа имеет эксцесс, равный 6, и слабые экспоненциальные хвосты, но большее отношение 4-го L-момента, чем, например, распределение Стьюдента с df=3, которое имеет бесконечный эксцесс и гораздо более тяжелые хвосты.

В качестве примера рассмотрим набор данных с несколькими точками данных и одним внешним значением данных. Если взять обычное стандартное отклонение этого набора данных, на него будет сильно влиять эта точка: однако, если взять L-шкалу, она будет гораздо менее чувствительна к этому значению данных. Следовательно, L-моменты гораздо более значимы при работе с выбросами в данных, чем обычные моменты. Однако существуют и другие, более подходящие методы для достижения еще более высокой надежности, чем просто замена моментов L-моментами. Одним из примеров этого является использование L-моментов в качестве сводной статистики в теории экстремальных значений (EVT). Это приложение показывает ограниченную устойчивость L-моментов, т.е. L-статистика не является устойчивой статистикой , поскольку одно экстремальное значение может сбить ее с толку, но поскольку они только линейны (а не статистика более высокого порядка ), на них меньше влияют экстремальные значения. ценности, чем обычные моменты.

Еще одно преимущество L-моментов перед обычными моментами заключается в том, что для их существования требуется только, чтобы случайная величина имела конечное среднее значение, поэтому L-моменты существуют, даже если более высокие условные моменты не существуют (например, для t-распределения Стьюдента с низкими степенями свобода ). Кроме того, конечная дисперсия необходима для того, чтобы стандартные ошибки оценок L-моментов были конечными. [1]

Некоторые упоминания L-моментов в статистической литературе включают книгу Дэвида и Нагараджи (2003, раздел 9.9). [12] и ряд документов. [10] [13] [14] [15] [16] [17] Сообщалось о ряде положительных сравнений L-моментов с обычными моментами. [18] [19]

Значения для некоторых распространенных дистрибутивов [ править ]

В таблице ниже приведены выражения для первых двух моментов L и числовые значения первых двух отношений L-моментов некоторых распространенных непрерывных распределений вероятностей с постоянными отношениями L-моментов. [1] [5] Более сложные выражения были получены для некоторых дальнейших распределений, для которых отношения L-моментов изменяются в зависимости от одного или нескольких параметров распределения, включая логнормальное распределение , гамма-распределение , обобщенное распределение Парето , обобщенное экстремальное значение и обобщенное логистическое распределения. [1]

Распределение Параметры среднее, λ 1 L-шкала, λ 2 L-асимметрия, τ 3 L-эксцесс, τ 4
Униформа а , б 1/2 ( а + б ) 1 / 6 ( б а ) 0 0
Логистика РС м с 0  1  / 6 = 0.1667
Нормальный м , п 2 м с / р 0 30 θ м / π - 9 = 0,1226
Лаплас м , б м 3/4 б 0 1 /  3  2 = 0.2357
Студенческая т , 2 дф п = 2 0 π / 2 2 = 1,111 0  3  / 8 = 0.375
Студенческая т , 4 дф п = 4 0 15/64 0,7363 π = 0  111  / 512 = 0.2168
Экспоненциальный л 1 / мин 1/2 . мин  1  / 3 = 0.3333  1  / 6 = 0.1667
Гумбель м , б м + в е б б журнал 2 (3) 2 log 2 (3) - 3 = 0,1699 16 - 10 log 2 (3) = 0,1504

Обозначения параметров каждого распределения такие же, как и в связанной статье. В выражении для среднего распределения Гамбеля γ e представляет собой константу Эйлера–Машерони 0,5772 1566 4901 ... .

Расширения [ править ]

Обрезанные L-моменты — это обобщения L-моментов, которые придают нулевой вес экстремальным наблюдениям. Поэтому они более устойчивы к наличию выбросов и, в отличие от L-моментов, могут быть четко определены для распределений, для которых среднее значение не существует, таких как распределение Коши . [20]

См. также [ править ]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б с д и ж г час Хоскинг, JRM (1990). «L-моменты: анализ и оценка распределений с использованием линейных комбинаций порядковой статистики». Журнал Королевского статистического общества, серия B. 52 (1): 105–124. JSTOR   2345653 .
  2. ^ Хоскинг, JRM (1992). «Моменты или L моменты? Пример сравнения двух показателей формы распределения». Американский статистик . 46 (3): 186–189. дои : 10.2307/2685210 . JSTOR   2685210 .
  3. ^ Хоскинг, JRM (2006). «О характеризации распределений их L-моментами». Журнал статистического планирования и выводов . 136 : 193–198. дои : 10.1016/j.jspi.2004.06.004 .
  4. ^ Асквит, WH (2011) Анализ распределения со статистикой L-момента с использованием среды R для статистических вычислений , Create Space Independent Publishing Platform, [печать по требованию], ISBN   1-463-50841-7
  5. Перейти обратно: Перейти обратно: а б Джонс, MC (2002). «Простейшее распределение Стьюдента». Журнал Королевского статистического общества, серия D. 51 (1): 41–49. дои : 10.1111/1467-9884.00297 . JSTOR   3650389 .
  6. Перейти обратно: Перейти обратно: а б Ван, QJ (1996). «Прямые выборочные оценки L-моментов». Исследования водных ресурсов . 32 (12): 3617–3619. дои : 10.1029/96WR02675 .
  7. Перейти обратно: Перейти обратно: а б Гринвуд, Дж.А.; Ландвер, JM; Маталас, Северная Каролина; Уоллис, младший (1979). «Вероятностно-взвешенные моменты: определение и связь с параметрами нескольких распределений, выраженными в обратной форме» (PDF) . Исследования водных ресурсов . 15 (5): 1049–1054. дои : 10.1029/WR015i005p01049 . S2CID   121955257 . Архивировано из оригинала (PDF) 10 февраля 2020 г.
  8. Перейти обратно: Перейти обратно: а б Ландвер, JM; Маталас, Северная Каролина; Уоллис, младший (1979). «Вероятностно-взвешенные моменты по сравнению с некоторыми традиционными методами оценки параметров и квантилей Гамбеля». Исследования водных ресурсов . 15 (5): 1055–1064. дои : 10.1029/WR015i005p01055 .
  9. ^ «L моментов» . График данных НИСТ. itl.nist.gov (документация). Национальный институт стандартов и технологий . 6 января 2006 г. Проверено 19 января 2013 г.
  10. Перейти обратно: Перейти обратно: а б Вальбуэна, Р.; Мальтамо, М.; Мехтатало, Л.; Пакален, П. (2017). «Ключевые структурные особенности бореальных лесов могут быть обнаружены непосредственно с использованием L-моментов по данным воздушного лидара» . Дистанционное зондирование окружающей среды . 194 : 437–446. дои : 10.1016/j.rse.2016.10.024 .
  11. ^ Хоскинг, JRM; Уоллис, младший (2005). Региональный частотный анализ: подход, основанный на L-моментах . Издательство Кембриджского университета. п. 3. ISBN  978-0521019408 . Проверено 22 января 2013 г.
  12. ^ Дэвид, HA; Нагараджа, HN (2003). Статистика заказов (3-е изд.). Уайли. ISBN  978-0-471-38926-2 .
  13. ^ Серфлинг, Р.; Сяо, П. (2007). «Вклад в многомерные L-моменты: матрицы L-комментариев». Журнал многомерного анализа . 98 (9): 1765–1781. CiteSeerX   10.1.1.62.4288 . дои : 10.1016/j.jmva.2007.01.008 .
  14. ^ Деликадо, П.; Гория, Миннесота (2008). «Небольшое выборочное сравнение методов максимального правдоподобия, моментов и L-моментов для асимметричного экспоненциального распределения мощности». Вычислительная статистика и анализ данных . 52 (3): 1661–1673. дои : 10.1016/j.csda.2007.05.021 .
  15. ^ Алькасасбе, MR; Ракаб, МЗ (2009). «Оценка параметров обобщенного логистического распределения: сравнительное исследование». Статистическая методология . 6 (3): 262–279. дои : 10.1016/j.stamet.2008.10.001 .
  16. ^ Джонс, MC (2004). «О некоторых выражениях для дисперсии, ковариации, асимметрии и L-моментов». Журнал статистического планирования и выводов . 126 (1): 97–106. дои : 10.1016/j.jspi.2003.09.001 .
  17. ^ Джонс, MC (2009). «Распределение Кумарасвами: распределение бета-типа с некоторыми преимуществами управляемости». Статистическая методология . 6 (1): 70–81. дои : 10.1016/j.stamet.2008.04.001 .
  18. ^ Ройстон, П. (1992). «Какие меры асимметрии и эксцесса являются лучшими?». Статистика в медицине . 11 (3): 333–343. дои : 10.1002/сим.4780110306 . ПМИД   1609174 .
  19. ^ Ульрих, Ти Джей; Велис, ДР; Вудбери, AD; Сакки, доктор медицины (2000). «L-моменты и C-моменты». Стохастические экологические исследования и оценка рисков . 14 (1): 50–68. дои : 10.1007/s004770050004 . S2CID   120542594 .
  20. ^ Эламир, Эльсайед А.Х.; Сехолт, Аллан Х. (2003). «Обрезанные L-моменты». Вычислительная статистика и анализ данных . 43 (3): 299–314. дои : 10.1016/S0167-9473(02)00250-5 .

Внешние ссылки [ править ]