Преобразование, стабилизирующее дисперсию
В прикладной статистике преобразование , стабилизирующее дисперсию, — это преобразование данных , которое специально выбрано либо для упрощения графического исследовательского анализа данных, либо для обеспечения возможности применения простых методов, основанных на регрессии или дисперсионном анализе . [ 1 ]
Обзор
[ редактировать ]Цель выбора преобразования, стабилизирующего дисперсию, состоит в том, чтобы найти простую функцию ƒ , которую можно применить к значениям x в наборе данных для создания новых значений y = ƒ ( x ), таких, что изменчивость значений y не связана с их среднее значение. Например, предположим, что значения x являются реализациями различных распределений Пуассона : т.е. каждое из распределений имеет разные средние значения μ . Затем, поскольку для распределения Пуассона дисперсия идентична среднему значению, дисперсия изменяется вместе со средним значением. Однако если простое преобразование, стабилизирующее дисперсию,
применяется, дисперсия выборки, связанная с наблюдением, будет почти постоянной: в разделе Преобразование Анскомба подробности и некоторые альтернативные преобразования см. .
Хотя преобразования, стабилизирующие дисперсию, хорошо известны для определенных параметрических семейств распределений, таких как распределение Пуассона и биномиальное распределение , некоторые типы анализа данных выполняются более эмпирически: например, путем поиска среди степенных преобразований , чтобы найти подходящее фиксированное преобразование. Альтернативно, если анализ данных предлагает функциональную форму связи между дисперсией и средним значением, это можно использовать для вывода преобразования, стабилизирующего дисперсию. [ 2 ] если для среднего µ Таким образом ,
Подходящей основой для преобразования, стабилизирующего дисперсию, может быть
где для удобства можно выбрать произвольную константу интегрирования и произвольный масштабный коэффициент.
Пример: относительная дисперсия
[ редактировать ]Если X является положительной случайной величиной и для некоторой константы s, дисперсия задается как h ( µ ) = s 2 м 2 тогда стандартное отклонение пропорционально среднему значению, которое называется фиксированной относительной ошибкой . В этом случае преобразование, стабилизирующее дисперсию, имеет вид
То есть преобразование, стабилизирующее дисперсию, является логарифмическим преобразованием.
Пример: абсолютная плюс относительная дисперсия.
[ редактировать ]Если дисперсия задана как h ( µ ) = σ 2 + с 2 м 2 тогда в дисперсии доминирует фиксированная дисперсия σ 2 когда | | | достаточно мал, и в нем преобладает относительная дисперсия s 2 м 2 когда | | | достаточно велик. В этом случае преобразование, стабилизирующее дисперсию, имеет вид
То есть преобразование, стабилизирующее дисперсию, представляет собой обратный гиперболический синус масштабированного значения x / λ для λ = σ / s .
Пример: корреляция Пирсона
[ редактировать ]Преобразование Фишера представляет собой преобразование, стабилизирующее дисперсию коэффициента корреляции Пирсона.
Связь с дельта-методом
[ редактировать ]Здесь дельта-метод представлен в общих чертах, но этого достаточно, чтобы увидеть связь с преобразованиями, стабилизирующими дисперсию. Чтобы увидеть более формальный подход, см. дельта-метод .
Позволять быть случайной величиной, причем и . Определять , где является регулярной функцией. Приближение Тейлора первого порядка для является:
Из приведенного выше уравнения получаем:
- и
Этот метод аппроксимации называется дельта-методом.
Рассмотрим теперь случайную величину такой, что и . Обратите внимание на связь между дисперсией и средним значением, которая подразумевает, например, гетероскедастичность в линейной модели. Следовательно, цель состоит в том, чтобы найти функцию такой, что имеет дисперсию, независимую (по крайней мере приблизительно) от его ожидания.
Наложение условия , из этого равенства следует дифференциальное уравнение:
Это обыкновенное дифференциальное уравнение в результате разделения переменных имеет следующее решение:
Последнее выражение впервые появилось в статье М. С. Бартлетта . [ 3 ]
Ссылки
[ редактировать ]- ^ Эверитт, бакалавр наук (2002). Кембриджский статистический словарь (2-е изд.). ЧАШКА. ISBN 0-521-81099-Х .
- ^ Додж, Ю. (2003). Оксфордский словарь статистических терминов . ОУП. ISBN 0-19-920613-9 .
- ^ Бартлетт, MS (1947). «Использование трансформаций». Биометрия . 3 : 39–52. дои : 10.2307/3001536 .