Jump to content

Фиктивная переменная (статистика)

(Перенаправлено из переменной индикатора )

В регрессионном анализе фиктивная переменная (также известная как индикаторная переменная или просто фиктивная переменная ) — это переменная, которая принимает двоичное значение (0 или 1), чтобы указать на отсутствие или присутствие некоторого категориального эффекта, который, как можно ожидать, может изменить результат. [1] Например, если бы мы изучали взаимосвязь между биологическим полом и доходом , мы могли бы использовать фиктивную переменную, чтобы представить пол каждого человека в исследовании. Переменная может принимать значение 1 для мужчин и 0 для женщин (или наоборот). В машинном обучении это известно как горячее кодирование .

Фиктивные переменные обычно используются в регрессионном анализе для представления категориальных переменных, имеющих более двух уровней, таких как уровень образования или род занятий. В этом случае будет создано несколько фиктивных переменных для представления каждого уровня переменной, и только одна фиктивная переменная будет принимать значение 1 для каждого наблюдения. Фиктивные переменные полезны, поскольку позволяют нам включать в наш анализ категориальные переменные, которые в противном случае было бы трудно включить из-за их нечисловой природы. Они также могут помочь нам контролировать мешающие факторы и повысить достоверность наших результатов.

Как и любое добавление переменных в модель, добавление фиктивных переменных увеличит соответствие модели внутри выборки ( коэффициент детерминации ), но за счет меньшего количества степеней свободы и потери общности модели (модель вне выборки). соответствовать). Слишком большое количество фиктивных переменных приводит к тому, что модель не дает каких-либо общих выводов.

Фиктивные переменные полезны в различных случаях. Например, в эконометрическом анализе временных рядов фиктивные переменные могут использоваться для обозначения возникновения войн или крупных забастовок . Таким образом, его можно рассматривать как логическое значение , т. е. значение истинности , представленное в виде числового значения 0 или 1 (как это иногда делается в компьютерном программировании ).

Фиктивные переменные могут быть распространены на более сложные случаи. Например, сезонные эффекты могут быть учтены путем создания фиктивных переменных для каждого сезона: D1=1, если наблюдение ведется летом, и равно нулю в противном случае; D2=1 тогда и только тогда, когда осень, в противном случае равно нулю; D3=1 тогда и только тогда, когда зима, в противном случае равно нулю; и D4=1 тогда и только тогда, когда пружина, в противном случае равна нулю. В панельных данных фиктивные оценщики фиксированных эффектов создаются для каждой единицы в поперечных данных (например, фирмы или страны) или периодов в объединенном временном ряду . Однако в таких регрессиях либо постоянный член необходимо удалить , либо одну из фиктивных переменных, что сделает ее базовой категорией, по которой оцениваются остальные, по следующей причине:

Если бы были включены фиктивные переменные для всех категорий, их сумма была бы равна 1 для всех наблюдений, что идентично и, следовательно, идеально коррелирует с переменной вектора единиц, коэффициент которой является постоянным членом; если бы также присутствовала переменная вектор единиц, это привело бы к идеальной мультиколлинеарности , [2] так что обращение матрицы в алгоритме оценивания было бы невозможно. Это называется ловушкой фиктивной переменной .

См. также

[ редактировать ]
  1. ^ Дрейпер, Северная Каролина; Смит, Х. (1998) Прикладной регрессионный анализ , Wiley. ISBN 0-471-17082-8 (глава 14)
  2. ^ Костюмы, Дэниел Б. (1957). «Использование фиктивных переменных в уравнениях регрессии». Журнал Американской статистической ассоциации . 52 (280): 548–551. JSTOR   2281705 .

Дальнейшее чтение

[ редактировать ]
  • Астериу, Димитриос; Холл, СГ (2015). «Фиктивные переменные». Прикладная эконометрика (3-е изд.). Лондон: Пэлгрейв Макмиллан. стр. 209–230. ISBN  978-1-137-41546-2 .
  • Койман, Мариус А. (1976). Фиктивные переменные в эконометрике . Тилбург: Издательство Тилбургского университета. ISBN  90-237-2919-6 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f7c95e2b966b233f57a500b528f37651__1701987540
URL1:https://arc.ask3.ru/arc/aa/f7/51/f7c95e2b966b233f57a500b528f37651.html
Заголовок, (Title) документа по адресу, URL1:
Dummy variable (statistics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)