Доля дисперсии необъяснима
Эта статья в значительной степени или полностью опирается на один источник . ( июнь 2020 г. ) |
В статистике необъяснимая доля дисперсии ( FVU ) в контексте задачи регрессии представляет собой долю дисперсии регрессии ( зависимой переменной) Y которая неправильно предсказана объясняющими переменными X. , которую нельзя объяснить, т. е .
Формальное определение [ править ]
Предположим, нам дана функция регрессии уступая по каждому оценка где вектор i й наблюдения по всем объясняющим переменным. [1] : 181 Мы определяем долю необъяснимой дисперсии (FVU) как:
где Р 2 – коэффициент детерминации , а VAR err и VAR tot – дисперсия остатков и выборочная дисперсия зависимой переменной. SS err (сумма квадратов ошибок прогнозов, что эквивалентно остаточной сумме квадратов ), SS tot ( общая сумма квадратов ) и SS reg (сумма квадратов регрессии, что эквивалентно объясненной сумме квадратов ) определяются выражением
Альтернативно, долю необъяснимой дисперсии можно определить следующим образом:
где MSE( f ) — среднеквадратическая ошибка функции регрессии ƒ .
Объяснение [ править ]
Для понимания ФВУ полезно рассмотреть второе определение. При попытке предсказать Y самая наивная функция регрессии, о которой мы можем подумать, — это постоянная функция, предсказывающая среднее значение Y , т. е. . Отсюда следует, что СКО этой функции равно дисперсии Y ; то есть SS err = SS tot и SS reg = 0. В этом случае никакие изменения Y не могут быть учтены, и FVU тогда имеет максимальное значение, равное 1.
В более общем смысле, FVU будет равен 1, если объясняющие переменные X ничего не говорят нам об Y в том смысле, что прогнозируемые значения Y не согласуются с Y . Но по мере того, как прогноз становится лучше и MSE может быть уменьшена, FVU снижается. В случае идеального предсказания, когда для всех i MSE равно 0, SS err = 0, SS reg = SS tot и FVU равно 0.
См. также [ править ]
- Коэффициент детерминации
- Корреляция
- Объясненная сумма квадратов
- Несоответствующая сумма квадратов
- Линейная регрессия
- Регрессионный анализ
- Средняя абсолютная масштабированная ошибка
Ссылки [ править ]
- ^ Ахен, Швейцария (1990). « Что объясняет «Объясненная дисперсия»?: Ответ». Политический анализ . 2 (1): 173–184. дои : 10.1093/пан/2.1.173 .