Jump to content

Преобразование Фишера

(Перенаправлено из z-преобразования Фишера )
График преобразования (оранжевый цвет). Непреобразованный выборочный коэффициент корреляции отложен на горизонтальной оси, а преобразованный коэффициент отложен на вертикальной оси. Функция идентичности (серая) также показана для сравнения.

В статистике преобразование Фишера (или Фишера z -преобразование ) коэффициента корреляции Пирсона представляет собой его обратный гиперболический тангенс (артан). Когда выборочный коэффициент корреляции r близок к 1 или -1, его распределение сильно искажено , что затрудняет оценку доверительных интервалов и применение критериев значимости для коэффициента корреляции совокупности ρ. [1] [2] [3] Преобразование Фишера решает эту проблему, давая переменную, распределение которой приблизительно нормально , с дисперсией, стабильной при различных значениях r .

Определение

[ редактировать ]

Учитывая набор N пар двумерных выборок ( X i , Y i ), i = 1, ..., N , выборочный коэффициент корреляции r определяется выражением

Здесь обозначает ковариацию между переменными и и означает стандартное отклонение соответствующей переменной. Z-преобразование Фишера r определяется как

где «ln» — функция натурального логарифма , а «artanh» — обратная функция гиперболического тангенса .

( X , Y ) имеет двумерное нормальное распределение с корреляцией ρ, а пары ( Xi Если , Yi ) независимы и одинаково распределены , то z приблизительно нормально распределено со средним значением

и стандартное отклонение, которое не зависит от значения корреляции rho (т. е. преобразование, стабилизирующее дисперсию )

где N — размер выборки, а ρ — истинный коэффициент корреляции.

Это преобразование и его обратное

большой выборки может использоваться для построения доверительного интервала для r с использованием стандартной нормальной теории и выводов. См. также применение к частичной корреляции .

Преобразование Фишера с и . На иллюстрации показана точная функция плотности вероятности (черный цвет), вместе с функциями плотности вероятности обычного преобразования Фишера (синий) и полученной путем включения дополнительных членов, которые зависят от (красный). Последнее приближение визуально неотличимо от точного ответа (его максимальная ошибка составляет 0,3% по сравнению с 3,4% базового Фишера).

Хотеллинг дает краткий вывод преобразования Фишера. [4]

Чтобы вывести преобразование Фишера, нужно начать с рассмотрения произвольной возрастающей дважды дифференцируемой функции , сказать . Нахождение первого члена в целом расширение соответствующей асимметрии результаты [5] в

Параметр и решая соответствующее дифференциальное уравнение для дает обратный гиперболический тангенс функция.

образом расширяя среднее значение m и дисперсию v Аналогичным , человек получает

м =

и

v =

соответственно.

Дополнительные члены не являются частью обычного преобразования Фишера. Для больших значений и небольшие значения они представляют собой значительное повышение точности при минимальных затратах, хотя и значительно усложняют вычисление обратного выражения - выражение в замкнутой форме недоступно. Почти постоянная дисперсия преобразования является результатом устранения его асимметрии – фактическое улучшение достигается за счет последнего, а не за счет дополнительных членов. Включая дополнительные члены, т.е. вычисление (zm)/v 1/2 , дает:

которое имеет в превосходном приближении стандартное нормальное распределение . [6]

Калькулятор доверительного интервала значений r-квадрата (или коэффициента детерминации/объяснения или согласия). [7]

Приложение

[ редактировать ]

Применение преобразования Фишера можно улучшить с помощью программного калькулятора, как показано на рисунке. Предполагая, что найденное значение r-квадрата равно 0,80, имеется 30 данных. [ нужны разъяснения ] и принимая 90% доверительный интервал, значение r-квадрата в другой случайной выборке из той же совокупности может находиться в диапазоне от 0,588 до 0,921. Когда r-квадрат выходит за пределы этого диапазона, популяция считается другой.

Обсуждение

[ редактировать ]

Преобразование Фишера — это приближенное преобразование, стабилизирующее дисперсию для r, когда X и Y следуют двумерному нормальному распределению. Это означает, что дисперсия z примерно постоянна для всех значений коэффициента корреляции населения ρ . Без преобразования Фишера дисперсия r уменьшается по мере | р | приближается к 1. Поскольку преобразование Фишера является приблизительно тождественной функцией, когда | р | < 1/2, иногда полезно помнить, что дисперсия r хорошо аппроксимируется величиной 1/ N, пока | р | не слишком велико, а N не слишком мало. Это связано с тем фактом, что асимптотическая дисперсия r равна 1 для двумерных нормальных данных.

Поведение этого преобразования тщательно изучалось с тех пор, как Фишер представил его в 1915 году. Сам Фишер нашел точное распределение z для данных из двумерного нормального распределения в 1921 году; Гайен в 1951 году [8] определил точное распределение z для данных из двумерного распределения Эджворта типа А. Хотеллинг в 1953 году рассчитал выражения ряда Тейлора для моментов z и несколько связанных с ним статистических данных. [9] и Хокинс в 1989 году обнаружили асимптотическое распределение z для данных из распределения с ограниченными четвертыми моментами. [10]

Альтернативой преобразованию Фишера является использование точной плотности доверительного распределения для ρ, определяемой выражением [11] [12] где — гипергеометрическая функция Гаусса и .

Другое использование

[ редактировать ]

Хотя преобразование Фишера в основном связано с коэффициентом корреляции произведения-момента Пирсона для двумерных нормальных наблюдений, его также можно применять к коэффициенту ранговой корреляции Спирмена в более общих случаях. [13] Аналогичный результат для асимптотического распределения применим, но с небольшим поправочным коэффициентом: подробности см. в цитируемой статье.

См. также

[ редактировать ]
  1. ^ Фишер, Р.А. (1915). «Частотное распределение значений коэффициента корреляции в выборках неопределенно большой популяции». Биометрика . 10 (4): 507–521. дои : 10.2307/2331838 . hdl : 2440/15166 . JSTOR   2331838 .
  2. ^ Фишер, Р.А. (1921). «О« вероятной ошибке »коэффициента корреляции, полученного на основе небольшой выборки» (PDF) . Метрон . 1 :3–32.
  3. ^ Рик Виклин. Преобразование Фишера коэффициента корреляции. 20 сентября 2017 г. https://blogs.sas.com/content/iml/2017/09/20/fishers-transformation-correlation.html . По состоянию на 15 февраля 2022 г.
  4. ^ Хотеллинг, Гарольд (1953). «Новый взгляд на коэффициент корреляции и его преобразования» . Журнал Королевского статистического общества, серия B (методологический) . 15 (2): 193–225. дои : 10.1111/j.2517-6161.1953.tb00135.x . ISSN   0035-9246 .
  5. ^ Уинтерботтом, Алан (1979). «Заметки о выводе преобразования Фишера коэффициента корреляции» . Американский статистик . 33 (3): 142–143. дои : 10.2307/2683819 . ISSN   0003-1305 . JSTOR   2683819 .
  6. ^ Врбик, Ян (декабрь 2005 г.). «Популяционные моменты выборочных распределений». Вычислительная статистика . 20 (4): 611–621. дои : 10.1007/BF02741318 . S2CID   120592303 .
  7. ^ Калькулятор r-квадрата
  8. ^ Гайен, АК (1951). «Частотное распределение коэффициента корреляции продукта-момента в случайных выборках любого размера, взятых из ненормальных вселенных». Биометрика . 38 (1/2): 219–247. дои : 10.1093/biomet/38.1-2.219 . JSTOR   2332329 .
  9. ^ Хотеллинг, Х (1953). «Новый взгляд на коэффициент корреляции и его преобразования». Журнал Королевского статистического общества, серия B. 15 (2): 193–225. JSTOR   2983768 .
  10. ^ Хокинс, Д.Л. (1989). «Использование статистики U для получения асимптотического распределения статистики Z Фишера» . Американский статистик . 43 (4): 235–237. дои : 10.2307/2685369 . JSTOR   2685369 .
  11. ^ Таральдсен, Гуннар (2021). «Плотность достоверности корреляции» . Санкхья А. дои : 10.1007/s13171-021-00267-y . ISSN   0976-8378 . S2CID   244594067 .
  12. ^ Таральдсен, Гуннар (2020). «Уверенность в корреляции» . дои : 10.13140/RG.2.2.23673.49769 . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  13. ^ Зар, Джеррольд Х. (2005). «Корреляция рангов Спирмена: обзор». Энциклопедия биостатистики . дои : 10.1002/9781118445112.stat05964 . ISBN  9781118445112 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 14cd32c8f92a7aea66ae577423644a68__1717291020
URL1:https://arc.ask3.ru/arc/aa/14/68/14cd32c8f92a7aea66ae577423644a68.html
Заголовок, (Title) документа по адресу, URL1:
Fisher transformation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)