Jump to content

Эмпирическая функция распределения

Зеленая кривая, которая асимптотически приближается к высотам 0 и 1, не достигая их, представляет собой истинную кумулятивную функцию распределения стандартного нормального распределения. Серые штрихи представляют наблюдения в конкретной выборке, взятой из этого распределения, а горизонтальные шаги синей ступенчатой ​​функции (включая самую левую точку на каждом шаге, но не включая крайнюю правую точку) образуют эмпирическую функцию распределения этой выборки. (Нажмите здесь, чтобы загрузить новый график.)
Зеленая кривая, которая асимптотически приближается к высотам 0 и 1, не достигая их, представляет собой истинную кумулятивную функцию распределения стандартного нормального распределения . Серые штрихи представляют наблюдения в конкретной выборке , взятой из этого распределения, а горизонтальные шаги синей ступенчатой ​​функции (включая крайнюю левую точку на каждом шаге, но не включая крайнюю правую точку) образуют эмпирическую функцию распределения этой выборки. ( Нажмите здесь, чтобы загрузить новый график. )

В статистике эмпирическая функция распределения (обычно также называемая эмпирической кумулятивной функцией распределения , eCDF) — это функция распределения, с эмпирической мерой выборки связанная . [1] Эта кумулятивная функция распределения представляет собой ступенчатую функцию , которая увеличивается на 1/ n в каждой из n точек данных. Его значение при любом заданном значении измеряемой переменной представляет собой долю наблюдений измеряемой переменной, которые меньше или равны указанному значению.

Эмпирическая функция распределения — это оценка кумулятивной функции распределения, которая сформировала точки в выборке. Согласно теореме Гливенко – Кантелли , оно сходится с вероятностью 1 к основному распределению. Существует ряд результатов для количественной оценки скорости сходимости эмпирической функции распределения к базовой кумулятивной функции распределения.

Определение

[ редактировать ]

Пусть ( X 1 , …, X n ) независимые, одинаково распределенные действительные случайные величины с общей кумулятивной функцией распределения F ( t ) . Тогда эмпирическая функция распределения определяется как [2]

где является индикатором события А. ​При фиксированном t показатель случайная величина Бернулли с параметром p = F ( t ) ; следовательно биномиальная случайная величина со средним значением nF ( t ) и дисперсией nF ( t )(1 — F ( t )) . Это подразумевает, что является несмещенной оценкой F ( t ) .

Однако в некоторых учебниках определение дается как

[3] [4]

Асимптотические свойства

[ редактировать ]

Поскольку отношение ( n + 1)/ n приближается к 1 при стремлении n к бесконечности, асимптотические свойства двух приведенных выше определений одинаковы.

По усиленному закону больших чисел оценщик сходится к F ( t ) при n → ∞ почти наверняка для любого значения t : [2]

таким образом, оценщик является последовательным . Это выражение утверждает поточечную сходимость эмпирической функции распределения к истинной кумулятивной функции распределения. Существует более сильный результат, называемый теоремой Гливенко–Кантелли , который утверждает, что сходимость на самом деле происходит равномерно по t : [5]

Суп-норма в этом выражении называется статистикой Колмогорова-Смирнова для проверки согласия между эмпирическим распределением предполагаемая истинная кумулятивная функция распределения F. и другие функции нормы Вместо суп-нормы здесь могут быть разумно использованы . Например, буква Л 2 -норма порождает статистику Крамера-фон Мизеса .

Асимптотическое распределение можно дополнительно охарактеризовать несколькими различными способами. Во-первых, центральная предельная теорема утверждает, что поточечно , имеет асимптотически нормальное распределение со стандартом скорость сходимости: [2]

Этот результат расширяется теоремой Донскера , которая утверждает, что эмпирический процесс , рассматриваемый как функция, индексированная , сходится по распределению в пространстве Скорохода к средненулевому гауссовскому процессу , где B — стандартный броуновский мост . [5] Ковариационная структура этого гауссовского процесса имеет вид

Равномерную скорость сходимости в теореме Донскера можно определить количественно с помощью результата, известного как венгерское вложение : [6]

Альтернативно, скорость сходимости также может быть выражено количественно с точки зрения асимптотического поведения суп-нормы этого выражения. На этом форуме существует множество результатов, например, неравенство Дворецкого – Кифера – Вольфовица дает ограничение на хвостовые вероятности : [6]

Фактически Колмогоров показал, что если кумулятивная функция распределения F непрерывна, то выражение сходится по распределению к , которое имеет распределение Колмогорова , не зависящее от формы F .

Другой результат, следующий из закона повторного логарифма , состоит в том, что [6]

и

Доверительные интервалы

[ редактировать ]
Эмпирический CDF, CDF и графики доверительного интервала для различных размеров выборки нормального распределения
Эмпирический CDF, CDF и графики доверительного интервала для различных размеров выборки распределения Коши
Эмпирический CDF, CDF и графики доверительных интервалов для выборок различного размера с треугольным распределением

Согласно неравенству Дворецкого – Кифера – Вольфовица интервал, содержащий истинную CDF, , с вероятностью указывается как

В соответствии с приведенными выше границами мы можем построить эмпирический CDF, CDF и доверительные интервалы для различных распределений, используя любую из статистических реализаций.

Статистическая реализация

[ редактировать ]

Неполный список программных реализаций функции эмпирического распределения включает:

  • В программном обеспечении R мы вычисляем эмпирическую кумулятивную функцию распределения с помощью нескольких методов построения графика, печати и вычислений с использованием такого объекта «ecdf».
  • В MATLAB мы можем использовать график эмпирической кумулятивной функции распределения (cdf).
  • jmp из SAS , график CDF создает график эмпирической кумулятивной функции распределения.
  • Minitab , создайте эмпирический CDF
  • Mathwave , мы можем подогнать распределение вероятностей к нашим данным
  • Dataplot , мы можем построить эмпирический график CDF
  • Scipy , мы можем использовать scipy.stats.ecdf
  • Statsmodels , мы можем использовать statsmodels.distributions.empirical_distribution.ECDF
  • Matplotlib с использованием функции matplotlib.pyplot.ecdf (новая версия 3.8.0) [7]
  • Seaborn с использованием функции seaborn.ecdfplot
  • Plotly с использованием функцииplotly.express.ecdf.
  • Excel , мы можем построить эмпирический график CDF
  • ArviZ , используя az.plot_ecdf функцию

См. также

[ редактировать ]
  1. ^ Современное введение в вероятность и статистику: понимание почему и как . Мишель Деккинг. Лондон: Спрингер. 2005. с. 219. ИСБН  978-1-85233-896-1 . OCLC   262680588 . {{cite book}}: CS1 maint: другие ( ссылка )
  2. ^ Jump up to: а б с ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. п. 265 . ISBN  0-521-78450-6 .
  3. ^ Коулз, С. (2001) Введение в статистическое моделирование экстремальных значений . Спрингер, с. 36, Определение 2.4. ISBN   978-1-4471-3675-0 .
  4. ^ Мэдсен, Х.О., Кренк, С., Линд, С.К. (2006) Методы структурной безопасности . Дуврские публикации. п. 148-149. ISBN   0486445976
  5. ^ Jump up to: а б ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. п. 266 . ISBN  0-521-78450-6 .
  6. ^ Jump up to: а б с ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. п. 268 . ISBN  0-521-78450-6 .
  7. ^ «Что нового в Matplotlib 3.8.0 (13 сентября 2023 г.) — документация Matplotlib 3.8.3» .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 53392994ae7a7d1de3bef06e31400f66__1718256120
URL1:https://arc.ask3.ru/arc/aa/53/66/53392994ae7a7d1de3bef06e31400f66.html
Заголовок, (Title) документа по адресу, URL1:
Empirical distribution function - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)