Jump to content

Хотеллинга Т -квадрат Распределение

Хотеллинг'с Т 2 распределение
Функция плотности вероятности
Кумулятивная функция распределения
Параметры p - размерность случайных величин
м – в зависимости от размера выборки
Поддерживать если
в противном случае.

В статистике , особенно при проверке гипотез , Хотеллинга Т -квадрат распределения ( T 2 ), предложенный Гарольдом Хотеллингом , [1] — это многомерное распределение вероятностей , которое тесно связано с F -распределением и наиболее примечательно тем, что возникает как распределение набора выборочных статистических данных , которые являются естественным обобщением статистики, лежащей в основе Стьюдента t -распределения . Хотеллинга статистики t -квадрат ( t 2 ) — это обобщение Стьюдента t -статистики , которая используется при проверке многомерных гипотез . [2]

Мотивация

[ редактировать ]

Распределение возникает в многомерной статистике при проведении тестов различий между (многомерными) средними значениями различных групп населения, где тесты для одномерных задач будут использовать t -критерий .Распределение названо в честь Гарольда Хотеллинга -распределения Стьюдента , который разработал его как обобщение t . [1]

Определение

[ редактировать ]

Если вектор является гауссовским многомерным распределением с нулевым средним значением и единичной ковариационной матрицей и это случайная матрица с распределением Уишарта с матрицей единичного масштаба и m степенями свободы , а d и M независимы друг от друга, то квадратичная форма имеет распределение Хотеллинга (с параметрами и ): [3]

Можно показать, что если случайная величина X -квадрат распределения Хотеллинга имеет Т , , затем: [1]

где представляет собой F -распределение с параметрами p и m p + 1.

Хотеллинга Т -квадрат

[ редактировать ]

Позволять быть выборочной ковариацией :

мы обозначаем транспонирование апострофом . где Можно показать, что является положительной (полу) определенной матрицей и следует p -вариантному распределению Уишарта с n - 1 степенями свободы. [4] Выборочная ковариационная матрица средних показаний .

определяется Хотеллинга Тогда t -квадрат статистики как: [5]

что пропорционально расстоянию Махаланобиса между выборочным средним и . По этой причине следует ожидать, что статистика примет низкие значения, если и высокие значения, если они разные.

Из распределения ,

где представляет собой F -распределение с параметрами p и n p .

Чтобы вычислить p значение (здесь не связанное с переменной p ), обратите внимание, что распределение эквивалентно подразумевает, что

Затем используйте величину слева, чтобы оценить значение p , соответствующее выборке, которое получается из F -распределения. Доверительная область также может быть определена с использованием аналогичной логики.

Мотивация

[ редактировать ]

Позволять обозначают p -вариантное нормальное распределение с местоположением и известная ковариация . Позволять

быть n независимыми одинаково распределенными (iid) случайными величинами , которые можно представить как векторы-столбцы действительных чисел. Определять

быть выборочным средним с ковариацией . Можно показать, что

где распределение хи-квадрат с p степенями свободы. [6]

Доказательство
Proof

Every positive-semidefinite symmetric matrix has a positive-semidefinite symmetric square root , and if it is nonsingular, then its inverse has a positive-definite square root .

Since , we haveConsequently and this is simply the sum of squares of independent standard normal random variables. Thus its distribution is

Alternatively, one can argue using density functions and characteristic functions, as follows.

Proof

To show this use the fact that and derive the characteristic function of the random variable . As usual, let denote the determinant of the argument, as in .

By definition of characteristic function, we have:[7]

There are two exponentials inside the integral, so by multiplying the exponentials we add the exponents together, obtaining:

Now take the term off the integral, and multiply everything by an identity , bringing one of them inside the integral:

But the term inside the integral is precisely the probability density function of a multivariate normal distribution with covariance matrix and mean , so when integrating over all , it must yield per the probability axioms.[clarification needed] We thus end up with:

where is an identity matrix of dimension . Finally, calculating the determinant, we obtain:

which is the characteristic function for a chi-square distribution with degrees of freedom.

Двухвыборочная статистика

[ редактировать ]

Если и , с выборками, независимо взятыми из двух независимых многомерных нормальных распределений с одинаковым средним значением и ковариацией, и мы определяем

как образец означает, и

как соответствующие выборочные ковариационные матрицы. Затем

— это несмещенная оценка объединенной ковариационной матрицы (расширение объединенной дисперсии ).

Наконец, двухвыборочная t- квадратная статистика Хотеллинга имеет вид

[ редактировать ]

Это может быть связано с F-распределением соотношением [4]

Ненулевое распределение этой статистики представляет собой нецентральное F-распределение (отношение нецентральной случайной величины Хи-квадрат и независимой центральной Хи-квадрат случайной величины ).

с

где - вектор разницы между средними значениями генеральной совокупности.

В случае с двумя переменными формула значительно упрощается, позволяя понять, как корреляция , между переменными влияет . Если мы определим

и

затем

Таким образом, если разности в двух строках вектора имеют один и тот же знак, в общем, становится меньше, так как становится более позитивным. Если разности имеют противоположные знаки становится больше, так как становится более позитивным.

Одномерный частный случай можно найти в t-критерии Уэлча .

В литературе были предложены более надежные и мощные тесты, чем тест Хотеллинга с двумя выборками, см., например, тесты на основе межточечного расстояния, которые можно применять также тогда, когда количество переменных сопоставимо с количеством испытуемых или даже превышает его. [8] [9]

См. также

[ редактировать ]
  1. ^ Jump up to: а б с Хотеллинг, Х. (1931). «Обобщение коэффициента Стьюдента» . Анналы математической статистики . 2 (3): 360–378. дои : 10.1214/aoms/1177732979 .
  2. ^ Джонсон, РА; Вичерн, Д.В. (2002). Прикладной многомерный статистический анализ . Том. 5. Прентис-холл.
  3. ^ Эрик В. Вайсштейн, MathWorld
  4. ^ Jump up to: а б Мардия, КВ; Кент, Джей Ти; Бибби, Дж. М. (1979). Многомерный анализ . Академическая пресса. ISBN  978-0-12-471250-8 .
  5. ^ квадрат Хотеллинга «6.5.4.3. Т- » .
  6. Конец главы 4.2 книги Johnson, RA & Wichern, DW (2002).
  7. ^ Биллингсли, П. (1995). «26. Характеристические функции». Вероятность и мера (3-е изд.). Уайли. ISBN  978-0-471-00710-4 .
  8. ^ Мароцци, М. (2016). «Многомерные тесты, основанные на расстояниях между точками, с применением к магнитно-резонансной томографии». Статистические методы в медицинских исследованиях . 25 (6): 2593–2610. дои : 10.1177/0962280214529104 . ПМИД   24740998 .
  9. ^ Мароцци, М. (2015). «Многомерные многодистанционные тесты для крупномасштабных исследований случай-контроль с небольшим размером выборки». Статистика в медицине . 34 (9): 1511–1526. дои : 10.1002/сим.6418 . ПМИД   25630579 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 33b6b17b1b78c98015cdad82040793bf__1719261720
URL1:https://arc.ask3.ru/arc/aa/33/bf/33b6b17b1b78c98015cdad82040793bf.html
Заголовок, (Title) документа по адресу, URL1:
Hotelling's T-squared distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)