Jump to content

Объясненная вариация

В статистике измеряет долю , объясненная вариация в которой математическая модель объясняет вариацию ( дисперсию ) данного набора данных. Часто вариацию количественно определяют как дисперсию ; тогда более конкретный термин «объясненная дисперсия» можно использовать .

Дополнительная часть общей вариации называется необъяснимой или остаточной вариацией ; Аналогично, при обсуждении дисперсии как таковой ее называют необъяснимой или остаточной дисперсией .

Определение с точки зрения получения информации

[ редактировать ]

Получение информации за счет лучшего моделирования

[ редактировать ]

Следуя Кенту (1983), [1] мы используем информацию Фрейзера (Fraser 1965) [2]

где плотность вероятности случайной величины , и с ( ) — два семейства параметрических моделей. Семейство моделей 0 является более простым, с ограниченным пространством параметров. .

Параметры определяются путем оценки максимального правдоподобия ,

Прирост информации модели 1 по сравнению с моделью 0 записывается как

где для удобства включен коэффициент 2. Γ всегда неотрицательна; он измеряет, насколько лучшая модель семейства 1 лучше лучшей модели семейства 0 при объяснении g ( r ).

Получение информации с помощью условной модели

[ редактировать ]

Предположим, что двумерная случайная величина где X следует рассматривать как объясняющую переменную, а Y как зависимую переменную. Модели семейства 1 «объясняют» Y через X ,

,

тогда как в семействе 0 X и Y считаются независимыми. Мы определяем случайность Y как и случайность Y , учитывая X , по . Затем,

можно интерпретировать как долю дисперсии данных, которая «объясняется» X .

Особые случаи и обобщенное использование

[ редактировать ]

Линейная регрессия

[ редактировать ]

Необъяснимая доля дисперсии — это устоявшаяся концепция в контексте линейной регрессии . Обычное определение коэффициента детерминации основано на фундаментальной концепции объясненной дисперсии.

Коэффициент корреляции как мера объясненной дисперсии

[ редактировать ]

Пусть X — случайный вектор, а Y — случайная величина, моделируемая нормальным распределением с центром . В этом случае полученная выше доля объясненной вариации равен квадрату коэффициента корреляции .

Обратите внимание на сильные предположения модели: центр распределения Y должен быть линейной функцией от X , и для любого заданного x распределение Y должно быть нормальным. В других ситуациях интерпретация, как правило, не оправдана. как доля объясненной дисперсии.

В анализе главных компонент

[ редактировать ]

Объясненная дисперсия обычно используется в анализе главных компонент . Связь с получением информации Фрейзером-Кентом еще предстоит прояснить.

Поскольку доля «объясненной дисперсии» равна квадрату коэффициента корреляции , он разделяет все недостатки последнего: он отражает не только качество регрессии, но и распределение независимых (обусловливающих) переменных.

По словам одного критика: «Таким образом, дает «процент дисперсии, объясненной» регрессией, выражение, которое для большинства социологов имеет сомнительное значение, но имеет большую риторическую ценность. Если это число велико, регрессия дает хорошее соответствие, и нет смысла искать дополнительные переменные. Другие уравнения регрессии для других наборов данных считаются менее удовлетворительными или менее эффективными, если их ниже. Ничего о поддерживает эти претензии». [3] : 58  И после построения примера, где усиливается просто за счет совместного рассмотрения данных из двух разных популяций: «Объяснимая дисперсия ничего не объясняет». [3] [ нужна страница ] [4] : 183 

См. также

[ редактировать ]
  1. ^ Кент, Дж.Т. (1983). «Получение информации и общая мера корреляции». Биометрика . 70 (1): 163–173. дои : 10.1093/biomet/70.1.163 . JSTOR   2335954 .
  2. ^ Фрейзер, DAS (1965). «Об информации в статистике» . Энн. Математика. Статист . 36 (3): 890–896. дои : 10.1214/aoms/1177700061 .
  3. ^ Jump up to: а б Ахен, Швейцария (1982). Интерпретация и использование регрессии . Беверли-Хиллз: Сейдж. стр. 58–59. ISBN  0-8039-1915-8 .
  4. ^ Ахен, Швейцария (1990). « Что объясняет «Объясненная дисперсия»?: Ответ». Политический анализ . 2 (1): 173–184. дои : 10.1093/пан/2.1.173 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3513039db96ec7de378f6c18bbd41315__1715202960
URL1:https://arc.ask3.ru/arc/aa/35/15/3513039db96ec7de378f6c18bbd41315.html
Заголовок, (Title) документа по адресу, URL1:
Explained variation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)