Преобразование Фишера
В статистике преобразование Фишера (или Фишера z -преобразование ) коэффициента корреляции Пирсона представляет собой его обратный гиперболический тангенс (артан). Когда выборочный коэффициент корреляции r близок к 1 или -1, его распределение сильно искажено , что затрудняет оценку доверительных интервалов и применение критериев значимости для коэффициента корреляции совокупности ρ. [1] [2] [3] Преобразование Фишера решает эту проблему, давая переменную, распределение которой приблизительно нормально , с дисперсией, стабильной при различных значениях r .
Определение
[ редактировать ]Учитывая набор N пар двумерных выборок ( X i , Y i ), i = 1, ..., N , выборочный коэффициент корреляции r определяется выражением
Здесь обозначает ковариацию между переменными и и означает стандартное отклонение соответствующей переменной. Z-преобразование Фишера r определяется как
где «ln» — функция натурального логарифма , а «artanh» — обратная функция гиперболического тангенса .
( X , Y ) имеет двумерное нормальное распределение с корреляцией ρ, а пары ( Xi Если , Yi ) независимы и одинаково распределены , то z приблизительно нормально распределено со средним значением
и стандартное отклонение, которое не зависит от значения корреляции rho (т. е. преобразование, стабилизирующее дисперсию )
где N — размер выборки, а ρ — истинный коэффициент корреляции.
Это преобразование и его обратное
большой выборки может использоваться для построения доверительного интервала для r с использованием стандартной нормальной теории и выводов. См. также применение к частичной корреляции .
Вывод
[ редактировать ]Эту статью может потребовать очистки Википедии , чтобы она соответствовала стандартам качества . Конкретная проблема заключается в том, что этапы вывода не изложены полностью. ( Июль 2021 г. ) |
Хотеллинг дает краткий вывод преобразования Фишера. [4]
Чтобы вывести преобразование Фишера, нужно начать с рассмотрения произвольной возрастающей дважды дифференцируемой функции , сказать . Нахождение первого члена в целом расширение соответствующей асимметрии результаты [5] в
Параметр и решая соответствующее дифференциальное уравнение для дает обратный гиперболический тангенс функция.
образом расширяя среднее значение m и дисперсию v Аналогичным , человек получает
- м =
и
- v =
соответственно.
Дополнительные члены не являются частью обычного преобразования Фишера. Для больших значений и небольшие значения они представляют собой значительное повышение точности при минимальных затратах, хотя и значительно усложняют вычисление обратного выражения - выражение в замкнутой форме недоступно. Почти постоянная дисперсия преобразования является результатом устранения его асимметрии – фактическое улучшение достигается за счет последнего, а не за счет дополнительных членов. Включая дополнительные члены, т.е. вычисление (zm)/v 1/2 , дает:
которое имеет в превосходном приближении стандартное нормальное распределение . [6]
Приложение
[ редактировать ]Применение преобразования Фишера можно улучшить с помощью программного калькулятора, как показано на рисунке. Предполагая, что найденное значение r-квадрата равно 0,80, имеется 30 данных. [ нужны разъяснения ] и принимая 90% доверительный интервал, значение r-квадрата в другой случайной выборке из той же совокупности может находиться в диапазоне от 0,588 до 0,921. Когда r-квадрат выходит за пределы этого диапазона, популяция считается другой.
Обсуждение
[ редактировать ]Преобразование Фишера — это приближенное преобразование, стабилизирующее дисперсию для r, когда X и Y следуют двумерному нормальному распределению. Это означает, что дисперсия z примерно постоянна для всех значений коэффициента корреляции населения ρ . Без преобразования Фишера дисперсия r уменьшается по мере | р | приближается к 1. Поскольку преобразование Фишера является приблизительно тождественной функцией, когда | р | < 1/2, иногда полезно помнить, что дисперсия r хорошо аппроксимируется величиной 1/ N, пока | р | не слишком велико, а N не слишком мало. Это связано с тем фактом, что асимптотическая дисперсия r равна 1 для двумерных нормальных данных.
Поведение этого преобразования тщательно изучалось с тех пор, как Фишер представил его в 1915 году. Сам Фишер нашел точное распределение z для данных из двумерного нормального распределения в 1921 году; Гайен в 1951 году [8] определил точное распределение z для данных из двумерного распределения Эджворта типа А. Хотеллинг в 1953 году рассчитал выражения ряда Тейлора для моментов z и несколько связанных с ним статистических данных. [9] и Хокинс в 1989 году обнаружили асимптотическое распределение z для данных из распределения с ограниченными четвертыми моментами. [10]
Альтернативой преобразованию Фишера является использование точной плотности доверительного распределения для ρ, определяемой выражением [11] [12] где — гипергеометрическая функция Гаусса и .
Другое использование
[ редактировать ]Хотя преобразование Фишера в основном связано с коэффициентом корреляции произведения-момента Пирсона для двумерных нормальных наблюдений, его также можно применять к коэффициенту ранговой корреляции Спирмена в более общих случаях. [13] Аналогичный результат для асимптотического распределения применим, но с небольшим поправочным коэффициентом: подробности см. в цитируемой статье.
См. также
[ редактировать ]- Преобразование данных (статистика)
- Мета-анализ (это преобразование используется в метаанализе для стабилизации дисперсии)
- Частичная корреляция
- Коэффициент корреляции Пирсона § Вывод
Ссылки
[ редактировать ]- ^ Фишер, Р.А. (1915). «Частотное распределение значений коэффициента корреляции в выборках неопределенно большой популяции». Биометрика . 10 (4): 507–521. дои : 10.2307/2331838 . hdl : 2440/15166 . JSTOR 2331838 .
- ^ Фишер, Р.А. (1921). «О« вероятной ошибке »коэффициента корреляции, полученного на основе небольшой выборки» (PDF) . Метрон . 1 :3–32.
- ^ Рик Виклин. Преобразование Фишера коэффициента корреляции. 20 сентября 2017 г. https://blogs.sas.com/content/iml/2017/09/20/fishers-transformation-correlation.html . По состоянию на 15 февраля 2022 г.
- ^ Хотеллинг, Гарольд (1953). «Новый взгляд на коэффициент корреляции и его преобразования» . Журнал Королевского статистического общества, серия B (методологический) . 15 (2): 193–225. дои : 10.1111/j.2517-6161.1953.tb00135.x . ISSN 0035-9246 .
- ^ Уинтерботтом, Алан (1979). «Заметки о выводе преобразования Фишера коэффициента корреляции» . Американский статистик . 33 (3): 142–143. дои : 10.2307/2683819 . ISSN 0003-1305 . JSTOR 2683819 .
- ^ Врбик, Ян (декабрь 2005 г.). «Популяционные моменты выборочных распределений». Вычислительная статистика . 20 (4): 611–621. дои : 10.1007/BF02741318 . S2CID 120592303 .
- ^ Калькулятор r-квадрата
- ^ Гайен, АК (1951). «Частотное распределение коэффициента корреляции продукта-момента в случайных выборках любого размера, взятых из ненормальных вселенных». Биометрика . 38 (1/2): 219–247. дои : 10.1093/biomet/38.1-2.219 . JSTOR 2332329 .
- ^ Хотеллинг, Х (1953). «Новый взгляд на коэффициент корреляции и его преобразования». Журнал Королевского статистического общества, серия B. 15 (2): 193–225. JSTOR 2983768 .
- ^ Хокинс, Д.Л. (1989). «Использование статистики U для получения асимптотического распределения статистики Z Фишера» . Американский статистик . 43 (4): 235–237. дои : 10.2307/2685369 . JSTOR 2685369 .
- ^ Таральдсен, Гуннар (2021). «Плотность достоверности корреляции» . Санкхья А. дои : 10.1007/s13171-021-00267-y . ISSN 0976-8378 . S2CID 244594067 .
- ^ Таральдсен, Гуннар (2020). «Уверенность в корреляции» . дои : 10.13140/RG.2.2.23673.49769 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Зар, Джеррольд Х. (2005). «Корреляция рангов Спирмена: обзор». Энциклопедия биостатистики . дои : 10.1002/9781118445112.stat05964 . ISBN 9781118445112 .