V-статистика
V-статистика — это класс статистики, названный в честь Рихарда фон Мизеса , который разработал свою теорию асимптотического распределения в фундаментальной статье в 1947 году. [1] V-статистика тесно связана с U-статистикой. [2] [3] (U означает « непредвзятый »), представленный Василием Хёффдингом в 1948 году. [4] V-статистика — это статистическая функция (выборки), определяемая конкретным статистическим функционалом распределения вероятностей.
Статистические функции
[ редактировать ]Статистика, которую можно представить в виде функционалов эмпирической функции распределения называются статистическими функционалами . [5] Дифференцируемость функционала T играет ключевую роль в подходе фон Мизеса; таким образом, фон Мизес рассматривает дифференцируемые статистические функционалы . [1]
Примеры статистических функций
[ редактировать ]-
k -й – центральный момент это функционал , где — значение X. ожидаемое Соответствующая статистическая функция -й центральный момент выборки представляет собой k ,
-
представляет Статистика согласия хи-квадрат собой статистическую функцию T ( F n ), соответствующую статистическому функционалу
-
Крамера –фон-Мизеса и Андерсона–Дарлинга Статистика согласия основана на функционале
Представление в виде V-статистики
[ редактировать ]Предположим, x 1 , ..., x n является выборкой. В типичных приложениях статистическая функция имеет представление в виде V-статистики.
где h — симметричная ядерная функция. Серфлинг [6] обсуждается, как найти ядро на практике. V mn называется V-статистикой степени m .
Симметричное ядро степени 2 — это функция h ( x , y ), такая что h ( x , y ) = h ( y , x ) для всех x и y в области определения h. Для выборок x 1 , ..., x n определяется соответствующая V-статистика
Пример V-статистики
[ редактировать ]-
Примером V-статистики степени 2 является второй центральный момент m 2 .
Если час ( Икс , y ) знак равно ( Икс - y ) 2 /2 соответствующая V-статистика равна
- .
Асимптотическое распределение
[ редактировать ]В примерах 1–3 асимптотическое распределение статистики разное: в (1) оно нормальное , в (2) — хи-квадрат , а в (3) — взвешенная сумма переменных хи-квадрат.
Подход фон Мизеса представляет собой объединяющую теорию, охватывающую все вышеперечисленные случаи. [1] Неформально тип асимптотического распределения статистической функции зависит от порядка «вырождения», который определяется тем, какой член является первым неисчезающим членом в разложении Тейлора функционала T . Если это линейный член, предельное распределение нормальное; в противном случае возникают типы распределений более высокого порядка (при подходящих условиях, когда выполняется центральная предельная теорема).
Существует иерархия случаев, параллельная асимптотической теории U-статистики . [7] Пусть A ( m ) будет свойством, определяемым:
- Являюсь ) :
- Var( h ( X 1 , ..., X k )) = 0 для k < m , и Var ( h ( X 1 , ..., X k )) > 0 для k = m ;
- н м /2 R mn стремится к нулю (по вероятности). ( R mn — остаточный член ряда Тейлора для T .)
Случай m = 1 (невырожденное ядро):
Если A (1) истинно, статистика является выборочным средним, и Центральная предельная теорема подразумевает, что T(F n ) асимптотически нормальна .
В примере дисперсии (4) m 2 является асимптотически нормальным со средним значением и дисперсия , где .
Случай m = 2 (вырожденное ядро):
Предположим, что А (2) истинно и и . Тогда nV 2,n сходится по распределению к взвешенной сумме независимых переменных хи-квадрат:
где являются независимыми стандартными нормальными переменными и зависящие от распределения F и функционала T. — константы , В этом случае асимптотическое распределение называется квадратичной формой центрированных гауссовских случайных величин . Статистика V 2, n называется вырожденной ядерной V-статистикой . V-статистика, связанная с функционалом Крамера – фон Мизеса. [1] (Пример 3) является примером вырожденной ядерной V-статистики. [8]
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Jump up to: а б с д фон Мизес (1947)
- ^ Ли (1990)
- ^ Koroljuk & Borovskich (1994)
- ^ Хоффдинг (1948)
- ^ фон Мизес (1947), с. 309; Серфлинг (1980), с. 210.
- ^ Серфлинг (1980, раздел 6.5)
- ^ Серфлинг (1980, гл. 5–6); Ли (1990, глава 3)
- ^ См. Ли (1990, стр. 160) о функции ядра.
Ссылки
[ редактировать ]- Хоффдинг, В. (1948). «Класс статистики с асимптотически нормальным распределением» . Анналы математической статистики . 19 (3): 293–325. дои : 10.1214/aoms/1177730196 . JSTOR 2235637 .
- Koroljuk, V.S.; Borovskich, Yu.V. (1994). Theory of U -statistics (English translation by P.V.Malyshev and D.V.Malyshev from the 1989 Ukrainian ed.). Dordrecht: Kluwer Academic Publishers. ISBN 0-7923-2608-3 .
- Ли, Эй Джей (1990). У -статистика: теория и практика . Марселя Деккера, Inc. Нью-Йорк: ISBN 0-8247-8253-4 .
- Нейхаус, Г. (1977). «Функциональные предельные теоремы для U -статистики в вырожденном случае» . Журнал многомерного анализа . 7 (3): 424–439. дои : 10.1016/0047-259X(77)90083-5 .
- Розенблатт, М. (1952). «Предельные теоремы, связанные с вариантами статистики фон Мизеса» . Анналы математической статистики . 23 (4): 617–623. дои : 10.1214/aoms/1177729341 . JSTOR 2236587 .
- Серфлинг, Р.Дж. (1980). Аппроксимационные теоремы математической статистики . Нью-Йорк: Джон Уайли и сыновья. ISBN 0-471-02403-1 .
- Тейлор, РЛ; Даффер, ПЗ; Паттерсон, РФ (1985). Предельные теоремы для сумм перестановочных случайных величин . Нью-Джерси: Роуман и Алланхельд.
- фон Мизес, Р. (1947). «Об асимптотическом распределении дифференцируемых статистических функций» . Анналы математической статистики . 18 (2): 309–348. дои : 10.1214/aoms/1177730385 . JSTOR 2235734 .