Jump to content

Спецификация статистической модели

(Перенаправлено из Спецификации (регрессия) )

В статистике . спецификация модели является частью процесса построения статистической модели : спецификация состоит из выбора подходящей функциональной формы модели и выбора переменных, которые следует включить Например, учитывая личный доход вместе с годами обучения и опыт работы , мы могли бы указать функциональную связь следующее: [1]

где — это необъяснимая ошибка , которая, как предполагается, включает в себя независимые и одинаково распределенные гауссовы переменные .

Статистик сэр Дэвид Кокс сказал: «Как осуществляется перевод предметной задачи в статистическую модель, часто является наиболее важной частью анализа». [2]

Ошибка спецификации и предвзятость

[ редактировать ]

Ошибка спецификации возникает, когда функциональная форма или выбор независимых переменных плохо отражают соответствующие аспекты истинного процесса генерации данных. В частности, смещение ( ожидаемое значение разницы оцениваемого параметра и истинного базового значения) возникает, если независимая переменная коррелирует с ошибками, присущими основному процессу. Существует несколько различных возможных причин ошибки спецификации; некоторые из них перечислены ниже.

  • Может быть использована неподходящая функциональная форма.
  • Переменная, исключенная из модели, может иметь связь как с зависимой переменной , так и с одной или несколькими независимыми переменными (что приводит к смещению пропущенной переменной ). [3]
  • В модель может быть включена нерелевантная переменная (хотя это не создает систематической ошибки, но предполагает переоснащение и поэтому может привести к плохой прогнозирующей эффективности).
  • Зависимая переменная может быть частью системы одновременных уравнений (что приводит к смещению одновременности).

Кроме того, ошибки измерения могут повлиять на независимые переменные: хотя это не ошибка спецификации, она может создать статистическую погрешность.

Обратите внимание, что все модели будут иметь некоторую ошибку в спецификации. Действительно, в статистике есть распространенный афоризм, что « все модели неверны ». По словам Бёрнема и Андерсона,

«Моделирование – это не только наука, но и искусство, и оно направлено на поиск хорошей аппроксимирующей модели… как основы для статистических выводов». [4]

Обнаружение неправильной спецификации

[ редактировать ]

Тест Ramsey RESET может помочь проверить наличие ошибок спецификации в регрессионном анализе .

В приведенном выше примере, связывающем личный доход с образованием и опытом работы, если предположения модели верны, то наименьших квадратов оценки параметров методом и будет эффективным и объективным . диагностика спецификации обычно включает тестирование первого-четвертого момента остатков Следовательно , . [5]

Модельное здание

[ редактировать ]

Построение модели включает в себя поиск набора отношений, представляющих процесс, генерирующий данные. Для этого необходимо избегать всех источников неправильных спецификаций, упомянутых выше.

Один из подходов — начать с модели в общей форме, основанной на теоретическом понимании процесса генерации данных. Затем модель можно подогнать к данным и проверить на наличие различных источников неточностей в рамках задачи, называемой проверкой статистической модели . Теоретическое понимание может затем направить модификацию модели таким образом, чтобы сохранить теоретическую обоснованность, одновременно устраняя источники неправильных спецификаций. Но если окажется невозможным найти теоретически приемлемую спецификацию, соответствующую данным, теоретическую модель, возможно, придется отвергнуть и заменить другой.

Здесь уместна цитата Карла Поппера : «Всякий раз, когда теория кажется вам единственно возможной, воспринимайте это как знак того, что вы не поняли ни теорию, ни проблему, которую она призвана решить». [6]

Другой подход к построению модели — указать несколько разных моделей в качестве кандидатов, а затем сравнить эти модели-кандидаты друг с другом. Цель сравнения — определить, какая модель-кандидат наиболее подходит для статистических выводов. Общие критерии сравнения моделей включают следующее: R 2 , фактор Байеса и критерий отношения правдоподобия вместе с его относительным правдоподобием обобщения . Дополнительную информацию по этой теме см. в разделе Выбор статистической модели .

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Этот конкретный пример известен как функция дохода Mincer .
  2. ^ Кокс, Д.Р. (2006), Принципы статистического вывода , издательство Кембриджского университета , стр. 197 .
  3. ^ « Количественные методы II: Эконометрика », Колледж Уильяма и Мэри .
  4. ^ Бернхэм, КП; Андерсон, Д.Р. (2002), Выбор модели и мультимодельный вывод: практический теоретико-информационный подход (2-е изд.), Springer-Verlag , §1.1 .
  5. ^ Лонг, Дж. Скотт ; Триведи, Правин К. (1993). «Некоторые тесты спецификации модели линейной регрессии». В Боллене, Кеннет А .; Лонг, Дж. Скотт (ред.). Тестирование моделей структурных уравнений . Издательство SAGE . стр. 66–110.
  6. ^ Поппер, Карл (1972), Объективное знание: эволюционный подход , Oxford University Press .

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4b0987ed77339b771f050201f595ab52__1692803220
URL1:https://arc.ask3.ru/arc/aa/4b/52/4b0987ed77339b771f050201f595ab52.html
Заголовок, (Title) документа по адресу, URL1:
Statistical model specification - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)