Неравенство Дворецкого – Кифера – Вольфовица.

В теории вероятностей и статистике неравенство Дворецкого -Кифера-Вольфовица-Массарта ( неравенство ДКВ ) обеспечивает оценку расстояния в наихудшем случае эмпирически определенной функции распределения населения от связанной с ней функции распределения . Оно названо в честь Арье Дворецкого , Джека Кифера и Джейкоба Вулфовица , которые в 1956 году доказали неравенство
с неуказанной мультипликативной константой C перед показателем степени в правой части. [ 1 ]
В 1990 году Паскаль Массар доказал неравенство с точной константой C = 2: [ 2 ] подтверждая гипотезу Бирнбаума и Маккарти. [ 3 ] В 2021 году Майкл Нааман доказал многомерную версию неравенства ДКВ и обобщил результат Массарта о тесноте на многомерный случай, что приводит к точной константе, вдвое превышающей размерность k пространства, в котором находятся наблюдения: C = 2 k . [ 4 ]
Неравенство ДКВ
[ редактировать ]Для заданного натурального числа n пусть X 1 , X 2 , …, X n — вещественнозначные независимые и одинаково распределенные случайные величины с кумулятивной функцией распределения F (·). Пусть F n обозначает ассоциированную эмпирическую функцию распределения , определяемую формулой
так это вероятность того, что одна случайная величина меньше, чем , и это доля случайных величин, меньших, чем .
Неравенство Дворецкого – Кифера – Вольфовица ограничивает вероятность того, что случайная функция F n отличается от F более чем на заданную константу ε > 0 в любом месте действительной прямой. Точнее, имеется односторонняя оценка
откуда также следует двусторонняя оценка [ 5 ]
Это усиливает теорему Гливенко – Кантелли за счет количественного определения скорости сходимости при стремлении n к бесконечности. Он также оценивает хвостовую вероятность статистики Колмогорова–Смирнова . Приведенные выше неравенства следуют из случая, когда F соответствует равномерному распределению на [0,1] [ 6 ] поскольку F n имеет те же распределения, что и G n ( F ), где G n — эмпирическое распределение U 1 , U 2 , …, Un , где они независимы и равномерны (0,1), и отмечая, что
с равенством тогда и только тогда, когда F непрерывно.
Многомерный случай
[ редактировать ]В многомерном случае X 1 , X 2 , …, X n представляет собой iid-последовательность k -мерных векторов. Если F n — многомерная эмпирическая функция распределения функций, то
для каждого ε , n , k > 0. Член ( n + 1) можно заменить на 2 для любого достаточно большого n . [ 4 ]
Оценщик Каплана – Мейера
[ редактировать ]Неравенство Дворецкого – Кифера – Вольфовица получено для оценки Каплана – Мейера , которая представляет собой цензурированный справа аналог эмпирической функции распределения данных.
для каждого и для некоторой константы , где – оценка Каплана – Мейера, и – цензурирующая функция распределения. [ 7 ]
Создание групп CDF
[ редактировать ]Неравенство Дворецкого-Кифера-Вольфовица является одним из методов создания доверительных границ на основе CDF и создания доверительной полосы , которую иногда называют доверительной полосой Колмогорова-Смирнова . Целью этого доверительного интервала является удержание всего CDF на заданном доверительном уровне, в то время как альтернативные подходы пытаются достичь доверительного уровня только в каждой отдельной точке, что может обеспечить более жесткую границу. Границы DKW проходят параллельно и одинаково выше и ниже эмпирического CDF. Равноотстоящий доверительный интервал вокруг эмпирического CDF допускает различную частоту нарушений в зависимости от поддержки распределения. В частности, CDF чаще выходит за пределы границы CDF, оцененной с использованием неравенства ДКВ вблизи медианы распределения, чем вблизи конечных точек распределения.
Интервал, содержащий истинный CDF, , с вероятностью часто указывается как
что также является частным случаем асимптотической процедуры для многомерного случая, [ 4 ] при этом используется следующее критическое значение
для многомерного теста; можно заменить 2 k на k ( n + 1) для проверки, которая справедлива для всех n ; более того, многомерный тест, описанный Нааманом, можно обобщить для учета гетерогенности и зависимости.
См. также
[ редактировать ]- Неравенство концентрации - сводка границ наборов случайных величин.
Ссылки
[ редактировать ]- ^ Дворецкий, А. ; Кифер, Дж .; Вулфовиц, Дж. (1956), «Асимптотический минимаксный характер выборочной функции распределения и классической полиномиальной оценки» , Анналы математической статистики , 27 (3): 642–669, doi : 10.1214/aoms/1177728174 , MR 0083864
- ^ Массарт, П. (1990), «Точная константа в неравенстве Дворецкого – Кифера – Вольфовица» , Annals of Probability , 18 (3): 1269–1283, doi : 10.1214/aop/1176990746 , MR 06296
- ^ Бирнбаум, ZW; Маккарти, RC (1958). «Верхняя доверительная граница без распределения для Pr{Y<X}, основанная на независимых выборках X и Y» . Анналы математической статистики . 29 : 558–562. дои : 10.1214/aoms/1177706631 . МР 0093874 . Збл 0087.34002 .
- ^ Перейти обратно: а б с Нааман, Михаил (2021). «О точной константе в многомерном неравенстве Дворецкого – Кифера – Вольфовица» . Статистика и вероятностные буквы . 173 : 1–8. дои : 10.1016/j.spl.2021.109088 . S2CID 233844405 .
- ^ Косорок, М.Р. (2008), «Глава 11: Дополнительные результаты эмпирического процесса», Введение в эмпирические процессы и полупараметрический вывод , Springer, стр. 210, ISBN 9780387749778
- ^ Шорак, Греция ; Веллнер, Дж. А. (1986), Эмпирические процессы с применением к статистике , Wiley, ISBN 0-471-86725-Х
- ^ Битуз, Д.; Лоран, Б.; Массарт, П. (1999), «Неравенство типа Дворецкого – Кифера – Вольфовица для оценки Каплана – Мейера», Annales de l'Institut Henri Poincaré B , 35 (6), Elsevier : 735–763, Bibcode : 1999AIHPB.. 35..735Б , дои : 10.1016/С0246-0203(99)00112-0