Силовое преобразование
В статистике степенное преобразование — это семейство функций, применяемых для создания монотонного преобразования данных с использованием степенных функций . Это метод преобразования данных , используемый для стабилизации дисперсии , придания данным более нормального распределения , повышения достоверности показателей связи (таких как корреляция Пирсона между переменными) и для других процедур стабилизации данных.
Степенные преобразования используются во многих областях, включая анализ с несколькими разрешениями и вейвлет-анализ . [1] статистический анализ данных, медицинские исследования, моделирование физических процессов, [2] геохимический анализ данных , [3] эпидемиология [4] и многие другие области клинических, экологических и социальных исследований.
Определение
[ редактировать ]Степенное преобразование определяется как непрерывная функция степенного параметра λ , обычно задаваемого в кусочной форме, что делает его непрерывным в точке сингулярности ( λ = 0). Для векторов данных ( y 1 ,..., y n ), в которых каждый y i > 0, степенное преобразование равно
где
— среднее геометрическое наблюдений y 1 , ..., y n . Дело в это предел как приближается к 0. Чтобы увидеть это, обратите внимание, что - с помощью ряда Тейлора . Затем и все, кроме становится ничтожным для достаточно мал.
Включение ( λ − 1)-й степени среднего геометрического в знаменатель упрощает научную интерпретацию любого уравнения, включающего , поскольку единицы измерения не меняются при изменении λ .
Бокс и Кокс (1964) ввели в это преобразование среднее геометрическое, сначала включив якобиан масштабированного степенного преобразования.
с вероятностью. Этот якобиан выглядит следующим образом:
нормальную логарифмическую вероятность в ее максимуме Это позволяет записать следующим образом:
Отсюда, поглощая в выражение для выдает выражение, которое устанавливает, что минимизация суммы квадратов остатков от эквивалентно максимизации суммы нормального логарифмического правдоподобия отклонений от и журнал якобиана преобразования.
Значение при Y = 1 для любого λ равно 0, а производная по Y равна 1 для любого λ . Иногда Y — это версия какой-то другой переменной, масштабированной так, чтобы дать Y = 1 при каком-то среднем значении.
Преобразование представляет собой степенное преобразование, но выполнено таким образом, чтобы сделать его непрерывным с параметром λ при λ = 0. Оно оказалось популярным в регрессионном анализе , включая эконометрику .
Бокс и Кокс также предложили более общую форму преобразования, включающую параметр сдвига.
что справедливо, если y i + α > 0 для всех i . Если τ( Y , λ, α) следует усеченному нормальному распределению , то Y говорят, что соответствует распределению Бокса-Кокса .
Бикель и Доксум устранили необходимость использования усеченного распределения , расширив диапазон преобразования до всех y следующим образом:
где sn(.) — знаковая функция . Это изменение в определении не имеет большого практического значения, пока меньше, чем , что обычно и есть. [5]
Бикель и Доксум также доказали, что оценки параметров непротиворечивы и асимптотически нормальны при соответствующих условиях регулярности, хотя стандартная нижняя граница Крамера – Рао может существенно занижать дисперсию, когда значения параметров малы по сравнению с дисперсией шума. [5] Однако проблема недооценки дисперсии может не быть существенной проблемой во многих приложениях. [6] [7]
Преобразование Бокса – Кокса
[ редактировать ]Однопараметрические преобразования Бокса – Кокса определяются как
и двухпараметрические преобразования Бокса – Кокса как
как описано в оригинальной статье. [8] [9] При этом первые преобразования справедливы для , а второй для . [8]
Параметр оценивается с использованием функции правдоподобия профиля и критериев согласия. [10]
Доверительный интервал
[ редактировать ]Доверительный интервал для преобразования Бокса – Кокса можно асимптотически построить, используя теорему Уилкса о функции правдоподобия профиля, чтобы найти все возможные значения которые удовлетворяют следующему ограничению: [11]
Пример
[ редактировать ]Набор данных о печени BUPA [12] содержит данные о ферментах печени АЛТ и γGT . Предположим, мы заинтересованы в использовании log(γGT) для прогнозирования ALT. График данных показан на панели (а) рисунка. Похоже, что дисперсия непостоянная, и преобразование Бокса-Кокса может помочь.
Логарифмическое правдоподобие параметра мощности показано на панели (b). Горизонтальная опорная линия находится на расстоянии χ 1 2 /2 от максимума и может использоваться для определения приблизительного 95% доверительного интервала для λ. Похоже, что значение, близкое к нулю, будет хорошим, поэтому мы берем журналы.
Возможно, преобразование можно улучшить, добавив в преобразование журнала параметр сдвига. На панели (c) рисунка показано логарифмическое правдоподобие. В этом случае максимум правдоподобия близок к нулю, что позволяет предположить, что параметр сдвига не нужен. Последняя панель показывает преобразованные данные с наложенной линией регрессии.
Обратите внимание: хотя преобразования Бокса-Кокса могут значительно улучшить подгонку модели, существуют некоторые проблемы, с которыми преобразование не может помочь. В текущем примере данные имеют довольно тяжелые хвосты, поэтому предположение о нормальности нереалистично, и надежный регрессионный подход приводит к более точной модели.
Эконометрическое приложение
[ редактировать ]Экономисты часто характеризуют производственные отношения каким-либо вариантом трансформации Бокса-Кокса. [13]
Рассмотрим обычное представление производства Q как зависящего от услуг, предоставляемых основным капиталом K и рабочими часами N :
Решая вопрос Q путем обращения преобразования Бокса – Кокса, мы находим
которая известна как производственная функция постоянной эластичности замещения (CES) .
Производственная функция ЕЭП является однородной функцией первой степени.
Когда λ = 1, это дает линейную производственную функцию:
Когда λ → 0, это дает знаменитую производственную функцию Кобба – Дугласа :
Мероприятия и демонстрации
[ редактировать ]Страницы ресурсов SOCR содержат ряд практических интерактивных занятий. [14] демонстрация преобразования Бокса-Кокса (степень) с использованием Java-апплетов и диаграмм. Они непосредственно иллюстрируют влияние этого преобразования на графики Q–Q , диаграммы рассеяния X–Y , временных рядов графики и гистограммы .
Преобразование Йео – Джонсона
[ редактировать ]Преобразование Йео-Джонсона [15] допускает также нулевые и отрицательные значения . может быть любым действительным числом, где производит трансформацию идентичности.Закон трансформации гласит:
Примечания
[ редактировать ]- ^ Гао, Пэйшэн; Ву, Вейлинь (2006). «Классификация нарушений качества электроэнергии с использованием вейвлет-машин и машин опорных векторов». Шестая международная конференция по проектированию и применению интеллектуальных систем . ИСДА '06. Том. 1. Вашингтон, округ Колумбия, США: Компьютерное общество IEEE. стр. 201–206. дои : 10.1109/ISDA.2006.217 . ISBN 9780769525280 . S2CID 2444503 .
- ^ Глузман, С.; Юкалов, В.И. (01.01.2006). «Самоподобные степенные преобразования в задачах экстраполяции». Журнал математической химии . 39 (1): 47–56. arXiv : cond-mat/0606104 . Бибкод : 2006cond.mat..6104G . дои : 10.1007/s10910-005-9003-7 . ISSN 1572-8897 . S2CID 118965098 .
- ^ Ховарт, Р.Дж.; Эрл, СЭМ (1 февраля 1979 г.). «Применение обобщенного степенного преобразования к геохимическим данным». Журнал Международной ассоциации математической геологии . 11 (1): 45–62. дои : 10.1007/BF01043245 . ISSN 1573-8868 . S2CID 121582755 .
- ^ Питерс, Дж.Л.; Раштон, Л.; Саттон, Эй Джей; Джонс, ДР; Абрамс, КР; Магглстоун, Массачусетс (2005). «Байесовские методы перекрестного синтеза эпидемиологических и токсикологических данных». Журнал Королевского статистического общества, серия C. 54 : 159–172. дои : 10.1111/j.1467-9876.2005.00476.x . S2CID 121909404 .
- ^ Jump up to: а б Бикель, Питер Дж .; Доксум, Челл А. (июнь 1981 г.). «Возврат к анализу преобразований». Журнал Американской статистической ассоциации . 76 (374): 296–311. дои : 10.1080/01621459.1981.10477649 .
- ^ Сакиа, Р.М. (1992), «Техника преобразования Бокса-Кокса: обзор», The Statistician , 41 (2): 169–178, CiteSeerX 10.1.1.469.7176 , doi : 10.2307/2348250 , JSTOR 2348250
- ^ Ли, Фэнфэй (11 апреля 2005 г.), Преобразования Бокса-Кокса: обзор (PDF) (слайд-презентация), Сан-Паулу, Бразилия: Университет Сан-Паулу, Бразилия , получено 2 ноября 2014 г.
- ^ Jump up to: а б Бокс, Джордж Э.П .; Кокс, доктор медицинских наук (1964). «Анализ преобразований». Журнал Королевского статистического общества, серия B. 26 (2): 211–252. JSTOR 2984418 . МР 0192611 .
- ^ Джонстон, Дж. (1984). Эконометрические методы (Третье изд.). Нью-Йорк: МакГроу-Хилл. стр. 61–74. ISBN 978-0-07-032685-9 .
- ^ Асар, О.; Илк, О.; Даг, О. (2017). «Оценка параметра преобразования мощности Box-Cox с помощью тестов согласия». Коммуникации в статистике — моделирование и вычисления . 46 (1): 91–105. arXiv : 1401.3812 . дои : 10.1080/03610918.2014.957839 . S2CID 41501327 .
- ^ Абрамович, Феликс; Ритов, Яаков (2013). Статистическая теория: краткое введение . ЦРК Пресс. стр. 121–122. ISBN 978-1-4398-5184-5 .
- ^ Набор данных о заболеваниях печени BUPA
- ^ Зарембка, П. (1974). «Преобразование переменных в эконометрике». Границы в эконометрике . Нью-Йорк: Академическая пресса. стр. 81–104. ISBN 0-12-776150-0 .
- ^ Графики семейства Power Transform , веб-страницы SOCR
- ^ Йео, Ин-Квон; Джонсон, Ричард А. (2000). «Новое семейство степенных преобразований для улучшения нормальности или симметрии». Биометрика . 87 (4): 954–959. дои : 10.1093/биомет/87.4.954 . JSTOR 2673623 .
Ссылки
[ редактировать ]- Бокс, Джордж Э.П .; Кокс, доктор медицинских наук (1964). «Анализ преобразований». Журнал Королевского статистического общества, серия B. 26 (2): 211–252. JSTOR 2984418 . МР 0192611 .
- Кэрролл, Р.Дж.; Руперт, Д. (1981). «О предсказании и семье трансформации власти» (PDF) . Биометрика . 68 (3): 609–615. дои : 10.1093/biomet/68.3.609 .
- ДеГрут, Миннесота (1987). «Разговор с Джорджем Боксом» . Статистическая наука . 2 (3): 239–258. дои : 10.1214/ss/1177013223 .
- Хандельсман, диджей (2002). «Оптимальные преобразования мощности для анализа концентрации спермы и других параметров спермы». Журнал андрологии . 23 (5).
- Глузман, С.; Юкалов, В.И. (2006). «Самоподобные степенные преобразования в задачах экстраполяции». Журнал математической химии . 39 (1): 47–56. arXiv : cond-mat/0606104 . Бибкод : 2006cond.mat..6104G . дои : 10.1007/s10910-005-9003-7 . S2CID 118965098 .
- Ховарт, Р.Дж.; Эрл, СЭМ (1979). «Применение обобщенного степенного преобразования к геохимическим данным». Журнал Международной ассоциации математической геологии . 11 (1): 45–62. дои : 10.1007/BF01043245 . S2CID 121582755 .
Внешние ссылки
[ редактировать ]- Ниши, Р. (2001) [1994], «Преобразование Бокса – Кокса» , Энциклопедия математики , EMS Press ( фиксированная ссылка )
- Сэнфорд Вайсберг, Преобразования власти Йео-Джонсона