Объясненная вариация
В статистике измеряет долю , объясненная вариация в которой математическая модель объясняет вариацию ( дисперсию ) данного набора данных. Часто вариацию количественно определяют как дисперсию ; тогда более конкретный термин «объясненная дисперсия» можно использовать .
Дополнительная часть общей вариации называется необъяснимой или остаточной вариацией ; Аналогично, при обсуждении дисперсии как таковой ее называют необъяснимой или остаточной дисперсией .
с точки зрения информации получения Определение
Получение информации за моделирования лучшего счет
Следуя Кенту (1983), [1] мы используем информацию Фрейзера (Fraser 1965) [2]
где плотность вероятности случайной величины , и с ( ) — два семейства параметрических моделей. Семейство моделей 0 является более простым, с ограниченным пространством параметров. .
Параметры определяются путем оценки максимального правдоподобия ,
Прирост информации модели 1 по сравнению с моделью 0 записывается как
где для удобства включен коэффициент 2. Γ всегда неотрицательна; он измеряет, насколько лучшая модель семейства 1 лучше лучшей модели семейства 0 при объяснении g ( r ).
Получение информации с помощью условной модели [ править ]
Предположим, что двумерная случайная величина где X следует рассматривать как объясняющую переменную, а Y как зависимую переменную. Модели семейства 1 «объясняют» Y через X ,
- ,
тогда как в семействе 0 X и Y считаются независимыми. Мы определяем случайность Y как и случайность Y , учитывая X , по . Затем,
можно интерпретировать как долю дисперсии данных, которая «объясняется» X .
и обобщенное использование Особые случаи
Линейная регрессия
Необъяснимая доля дисперсии — это устоявшаяся концепция в контексте линейной регрессии . Обычное определение коэффициента детерминации основано на фундаментальной концепции объясненной дисперсии.
как мера объясненной дисперсии Коэффициент корреляции
Пусть X — случайный вектор, а Y — случайная величина, моделируемая нормальным распределением с центром . В этом случае полученная выше доля объясненной вариации равен квадрату коэффициента корреляции .
Обратите внимание на сильные предположения модели: центр распределения Y должен быть линейной функцией от X , и для любого заданного x распределение Y должно быть нормальным. В других ситуациях интерпретация, как правило, не оправдана. как доля объясненной дисперсии.
В анализе главных компонент [ править ]
Объясненная дисперсия обычно используется в анализе главных компонент . Связь с получением информации Фрейзером-Кентом еще предстоит прояснить.
Критика [ править ]
Поскольку доля «объясненной дисперсии» равна квадрату коэффициента корреляции , он разделяет все недостатки последнего: он отражает не только качество регрессии, но и распределение независимых (обусловливающих) переменных.
По словам одного критика: «Таким образом, дает «процент дисперсии, объясненной» регрессией, выражение, которое для большинства социологов имеет сомнительное значение, но имеет большую риторическую ценность. Если это число велико, регрессия дает хорошее соответствие, и нет смысла искать дополнительные переменные. Другие уравнения регрессии для других наборов данных считаются менее удовлетворительными или менее эффективными, если их ниже. Ничего о поддерживает эти претензии». [3] : 58 И после построения примера, где усиливается просто за счет совместного рассмотрения данных из двух разных популяций: «Объяснимая дисперсия ничего не объясняет». [3] [ нужна страница ] [4] : 183
См. также [ править ]
Ссылки [ править ]
- ^ Кент, Дж.Т. (1983). «Получение информации и общая мера корреляции». Биометрика . 70 (1): 163–173. дои : 10.1093/biomet/70.1.163 . JSTOR 2335954 .
- ^ Фрейзер, DAS (1965). «Об информации в статистике» . Энн. Математика. Статист . 36 (3): 890–896. дои : 10.1214/aoms/1177700061 .
- ^ Jump up to: Перейти обратно: а б Ахен, Швейцария (1982). Интерпретация и использование регрессии . Беверли-Хиллз: Сейдж. стр. 58–59. ISBN 0-8039-1915-8 .
- ^ Ахен, Швейцария (1990). « Что объясняет «Объясненная дисперсия»?: Ответ». Политический анализ . 2 (1): 173–184. дои : 10.1093/пан/2.1.173 .