L-момент
В статистике — это последовательность статистических данных , L-моменты используемых для суммирования формы распределения вероятностей . [1] [2] [3] [4] Они представляют собой линейные комбинации порядковой статистики ( L-статистики ), аналогичных обычным моментам , и могут использоваться для расчета величин, аналогичных стандартному отклонению , асимметрии и эксцессу , называемым L-шкалой, L-асимметрией и L-эксцессом соответственно (L-шкала, L-асимметрия и L-эксцесс соответственно). -mean идентично обычному среднему ). Стандартизированные L-моменты называются отношениями L-моментов и аналогичны стандартизированным моментам . Как и в случае с обычными моментами, теоретическое распределение имеет набор L-моментов населения. Выборочные L-моменты могут быть определены для выборки из совокупности и могут использоваться в качестве оценок L-моментов совокупности.
Население L-моменты
[ редактировать ]Для случайной величины X r - равен й L-момент популяции [1]
где X k:n обозначает статистику k -го порядка ( k -е наименьшее значение) в независимой выборке размера n из распределения X и обозначает ожидаемого значения оператор . В частности, первые четыре L-момента населенности равны
Обратите внимание, что коэффициенты r -го L-момента такие же, как и в r -м члене биномиального преобразования , используемого в r -го порядка конечной разности (конечный аналог производной).
Первые два из этих L-моментов имеют условные названия:
- это «среднее», «L-среднее» или «L-местоположение»,
- это «L-шкала».
L-шкала равна половине средней абсолютной разницы . [5]
Примеры L-моментов
[ редактировать ]L-моменты выборки можно вычислить как L-моменты совокупности выборки, суммируя по подмножествам r -элементов выборки. следовательно, усреднение путем деления на биномиальный коэффициент :
Группируя их по статистике порядка, подсчитывает количество случаев, когда элемент выборки из n элементов может быть j -м элементом подмножества r элементов, и дает формулы вида, приведенного ниже. Прямые оценки первых четырех L-моментов в конечной выборке из n наблюдений: [6]
где x ( i ) — i -го статистика порядка , а является биномиальным коэффициентом . Выборочные L-моменты также могут быть определены косвенно через взвешенные по вероятности моменты , [1] [7] [8] что приводит к более эффективному алгоритму их вычисления. [6] [9]
Передаточные числа L-моментов
[ редактировать ]Набор отношений L-моментов или масштабированных L-моментов определяется формулой
Наиболее полезными из них являются называется L-асимметрией , и L -эксцесс .
Отношения L-моментов лежат в интервале (−1, 1) . Более точные границы можно найти для некоторых конкретных отношений моментов L; в частности, L-эксцесс лежит в [ − + 1/4 и , ) 1
Также можно определить величину, аналогичную коэффициенту вариации , но на основе L-моментов: который называется «коэффициентом L-вариации», или «L-CV». Для неотрицательной случайной величины это лежит в интервале ( 0, 1 ) [1] и идентичен коэффициенту Джини . [10]
Сопутствующие количества
[ редактировать ]L-моменты - это статистические величины, полученные из взвешенных по вероятности моментов. [11] (ШИМ), которые были определены ранее (1979 г.). [7] ШИМ используются для эффективной оценки параметров распределений, выражаемых в обратной форме, таких как Gumbel , [8] лямбда Тьюки и распределения Уэйкби .
Использование
[ редактировать ]Существует два распространенных способа использования L-моментов, в обоих случаях аналогично обычным моментам:
- В качестве сводной статистики для данных.
- Получить оценки параметров вероятностных распределений , применяя метод моментов к L-моментам, а не к обычным моментам.
Помимо выполнения этих операций со стандартными моментами, последняя (оценка) чаще выполняется с использованием максимального правдоподобия методов ; однако использование L-моментов дает ряд преимуществ. В частности, L-моменты более устойчивы , чем обычные моменты, и для существования более высоких L-моментов требуется только, чтобы случайная величина имела конечное среднее значение. Одним из недостатков отношений L-моментов для оценки является их обычно меньшая чувствительность. Например, распределение Лапласа имеет эксцесс, равный 6, и слабые экспоненциальные хвосты, но большее соотношение 4-го L-момента, чем, например, распределение Стьюдента с df=3, которое имеет бесконечный эксцесс и гораздо более тяжелые хвосты.
В качестве примера рассмотрим набор данных с несколькими точками данных и одним внешним значением данных. Если взять обычное стандартное отклонение этого набора данных, на него будет сильно влиять эта точка: однако, если взять L-шкалу, она будет гораздо менее чувствительна к этому значению данных. Следовательно, L-моменты гораздо более значимы при работе с выбросами в данных, чем обычные моменты. Однако существуют и другие, более подходящие методы для достижения еще более высокой надежности, чем просто замена моментов L-моментами. Одним из примеров этого является использование L-моментов в качестве сводной статистики в теории экстремальных значений (EVT). Это приложение показывает ограниченную устойчивость L-моментов, т.е. L-статистика не является устойчивой статистикой , поскольку одно экстремальное значение может сбить ее с толку, но поскольку они только линейны (а не статистика более высокого порядка ), на них меньше влияют экстремальные значения. ценности, чем обычные моменты.
Еще одно преимущество L-моментов перед обычными моментами состоит в том, что для их существования требуется только, чтобы случайная величина имела конечное среднее значение, поэтому L-моменты существуют, даже если более высокие условные моменты не существуют (например, для t-распределения Стьюдента с низкими степенями свобода ). Кроме того, необходима конечная дисперсия для того, чтобы стандартные ошибки оценок L-моментов были конечными. [1]
Некоторые упоминания L-моментов в статистической литературе включают книгу Дэвида и Нагараджи (2003, раздел 9.9). [12] и ряд документов. [10] [13] [14] [15] [16] [17] Сообщалось о ряде положительных сравнений L-моментов с обычными моментами. [18] [19]
Значения для некоторых распространенных дистрибутивов
[ редактировать ]В таблице ниже приведены выражения для первых двух моментов L и численные значения первых двух отношений L-моментов некоторых распространенных непрерывных распределений вероятностей с постоянными отношениями L-моментов. [1] [5] Более сложные выражения были получены для некоторых дальнейших распределений, для которых отношения L-моментов изменяются в зависимости от одного или нескольких параметров распределения, включая логарифмически нормальное , гамма , обобщенное Парето , обобщенное экстремальное значение и обобщенное логистическое распределения. [1]
Распределение Параметры среднее, λ 1 L-шкала, λ 2 L-асимметрия, τ 3 L-эксцесс, τ 4 Униформа а , б 1 / 2 ( а + б ) 1 / 6 ( б – а ) 0 0 Логистика РС м с 0 1 / 6 = 0.1667 Нормальный м , п 2 м σ / √ π 0 30 θ м / π - 9 = 0,1226 Лаплас м , б м 3 / 4 b 0 1 / 3 √ 2 = 0.2357 Студенческая т , 2 дф п = 2 0 π / 2 √ 2 = 1.111 0 3 / 8 = 0.375 Студенческая т , 4 дф п = 4 0 15 / 64 π = 0.7363 0 111 / 512 = 0.2168 Экспоненциальный л 1 / λ 1 / 2 λ 1 / 3 = 0.3333 1 / 6 = 0.1667 Гумбель м , б м + в е б β log 2 (3) 2 log 2 (3) - 3 = 0,1699 16 - 10 log 2 (3) = 0,1504
Обозначения параметров каждого распределения такие же, как и в связанной статье. В выражении для среднего распределения Гамбеля γ e представляет собой константу Эйлера–Машерони 0,5772 1566 4901 ... .
Расширения
[ редактировать ]Обрезанные L-моменты — это обобщения L-моментов, которые придают нулевой вес экстремальным наблюдениям. Поэтому они более устойчивы к наличию выбросов и, в отличие от L-моментов, могут быть четко определены для распределений, для которых среднее значение не существует, таких как распределение Коши . [20]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж г час Хоскинг, JRM (1990). «L-моменты: анализ и оценка распределений с использованием линейных комбинаций порядковой статистики». Журнал Королевского статистического общества, серия B. 52 (1): 105–124. JSTOR 2345653 .
- ^ Хоскинг, JRM (1992). «Моменты или L моменты? Пример сравнения двух показателей формы распределения». Американский статистик . 46 (3): 186–189. дои : 10.2307/2685210 . JSTOR 2685210 .
- ^ Хоскинг, JRM (2006). «О характеризации распределений их L-моментами». Журнал статистического планирования и выводов . 136 : 193–198. дои : 10.1016/j.jspi.2004.06.004 .
- ^ Асквит, WH (2011) Анализ распределения со статистикой L-момента с использованием среды R для статистических вычислений , Create Space Independent Publishing Platform, [печать по требованию], ISBN 1-463-50841-7
- ^ Перейти обратно: а б Джонс, MC (2002). «Простейшее распределение Стьюдента». Журнал Королевского статистического общества, серия D. 51 (1): 41–49. дои : 10.1111/1467-9884.00297 . JSTOR 3650389 .
- ^ Перейти обратно: а б Ван, QJ (1996). «Прямые выборочные оценки L-моментов». Исследования водных ресурсов . 32 (12): 3617–3619. дои : 10.1029/96WR02675 .
- ^ Перейти обратно: а б Гринвуд, Дж.А.; Ландвер, JM; Маталас, Северная Каролина; Уоллис, младший (1979). «Вероятностно-взвешенные моменты: определение и связь с параметрами нескольких распределений, выраженными в обратной форме» (PDF) . Исследования водных ресурсов . 15 (5): 1049–1054. дои : 10.1029/WR015i005p01049 . S2CID 121955257 . Архивировано из оригинала (PDF) 10 февраля 2020 г.
- ^ Перейти обратно: а б Ландвер, JM; Маталас, Северная Каролина; Уоллис, младший (1979). «Вероятностно-взвешенные моменты по сравнению с некоторыми традиционными методами оценки параметров и квантилей Гамбеля». Исследования водных ресурсов . 15 (5): 1055–1064. дои : 10.1029/WR015i005p01055 .
- ^ «L моментов» . График данных НИСТ. itl.nist.gov (документация). Национальный институт стандартов и технологий . 6 января 2006 года . Проверено 19 января 2013 г.
- ^ Перейти обратно: а б Вальбуэна, Р.; Мальтамо, М.; Мехтатало, Л.; Пакален, П. (2017). «Ключевые структурные особенности бореальных лесов можно обнаружить непосредственно с помощью L-моментов по данным воздушного лидара» . Дистанционное зондирование окружающей среды . 194 : 437–446. дои : 10.1016/j.rse.2016.10.024 .
- ^ Хоскинг, JRM; Уоллис, младший (2005). Региональный частотный анализ: подход, основанный на L-моментах . Издательство Кембриджского университета. п. 3. ISBN 978-0521019408 . Проверено 22 января 2013 г.
- ^ Дэвид, HA; Нагараджа, HN (2003). Статистика заказов (3-е изд.). Уайли. ISBN 978-0-471-38926-2 .
- ^ Серфлинг, Р.; Сяо, П. (2007). «Вклад в многомерные L-моменты: матрицы L-комментариев». Журнал многомерного анализа . 98 (9): 1765–1781. CiteSeerX 10.1.1.62.4288 . дои : 10.1016/j.jmva.2007.01.008 .
- ^ Деликадо, П.; Гория, Миннесота (2008). «Небольшое выборочное сравнение методов максимального правдоподобия, моментов и L-моментов для асимметричного экспоненциального распределения мощности». Вычислительная статистика и анализ данных . 52 (3): 1661–1673. дои : 10.1016/j.csda.2007.05.021 .
- ^ Алькасасбе, MR; Ракаб, МЗ (2009). «Оценка параметров обобщенного логистического распределения: сравнительное исследование». Статистическая методология . 6 (3): 262–279. дои : 10.1016/j.stamet.2008.10.001 .
- ^ Джонс, MC (2004). «О некоторых выражениях для дисперсии, ковариации, асимметрии и L-моментов». Журнал статистического планирования и выводов . 126 (1): 97–106. дои : 10.1016/j.jspi.2003.09.001 .
- ^ Джонс, MC (2009). «Распределение Кумарасвами: распределение бета-типа с некоторыми преимуществами управляемости». Статистическая методология . 6 (1): 70–81. дои : 10.1016/j.stamet.2008.04.001 .
- ^ Ройстон, П. (1992). «Какие меры асимметрии и эксцесса являются лучшими?». Статистика в медицине . 11 (3): 333–343. дои : 10.1002/сим.4780110306 . ПМИД 1609174 .
- ^ Ульрих, Ти Джей; Велис, ДР; Вудбери, AD; Сакки, доктор медицины (2000). «L-моменты и C-моменты». Стохастические экологические исследования и оценка рисков . 14 (1): 50–68. дои : 10.1007/s004770050004 . S2CID 120542594 .
- ^ Эламир, Эльсайед А.Х.; Сехолт, Аллан Х. (2003). «Обрезанные L-моменты». Вычислительная статистика и анализ данных . 43 (3): 299–314. дои : 10.1016/S0167-9473(02)00250-5 .
Внешние ссылки
[ редактировать ]- Страница L-моментов Джонатан Р.М. Хоскинг, IBM Research
- Л моменты. по датаплотам Справочное руководство , том. 1, вспомогательная глава. Национальный институт стандартов и технологий , 2006 г. По состоянию на 25 мая 2010 г.
- Облегченный Python Lmo включает функции для быстрого расчета L-моментов, усеченных L-моментов и многомерных L-комментариев.