Спецификация статистической модели
В статистике . спецификация модели является частью процесса построения статистической модели : спецификация состоит из выбора подходящей функциональной формы модели и выбора переменных, которые следует включить Например, учитывая личный доход вместе с годами обучения и опыт работы , мы могли бы указать функциональную связь следующее: [1]
где — это необъяснимая ошибка , которая, как предполагается, включает в себя независимые и одинаково распределенные гауссовы переменные .
Статистик сэр Дэвид Кокс сказал: «Как осуществляется перевод предметной задачи в статистическую модель, часто является наиболее важной частью анализа». [2]
Ошибка спецификации и предвзятость
[ редактировать ]Ошибка спецификации возникает, когда функциональная форма или выбор независимых переменных плохо отражают соответствующие аспекты истинного процесса генерации данных. В частности, смещение ( ожидаемое значение разницы оцениваемого параметра и истинного базового значения) возникает, если независимая переменная коррелирует с ошибками, присущими основному процессу. Существует несколько различных возможных причин ошибки спецификации; некоторые из них перечислены ниже.
- Может быть использована неподходящая функциональная форма.
- Переменная, исключенная из модели, может иметь связь как с зависимой переменной , так и с одной или несколькими независимыми переменными (что приводит к смещению пропущенной переменной ). [3]
- В модель может быть включена нерелевантная переменная (хотя это не создает систематической ошибки, но предполагает переоснащение и поэтому может привести к плохой прогнозирующей эффективности).
- Зависимая переменная может быть частью системы одновременных уравнений (что приводит к смещению одновременности).
Кроме того, ошибки измерения могут повлиять на независимые переменные: хотя это не ошибка спецификации, она может создать статистическую погрешность.
Обратите внимание, что все модели будут иметь некоторую ошибку в спецификации. Действительно, в статистике есть распространенный афоризм, что « все модели неверны ». По словам Бёрнема и Андерсона,
«Моделирование – это не только наука, но и искусство, и оно направлено на поиск хорошей аппроксимирующей модели… как основы для статистических выводов». [4]
Обнаружение неправильной спецификации
[ редактировать ]Тест Ramsey RESET может помочь проверить наличие ошибок спецификации в регрессионном анализе .
В приведенном выше примере, связывающем личный доход с образованием и опытом работы, если предположения модели верны, то наименьших квадратов оценки параметров методом и будет эффективным и объективным . диагностика спецификации обычно включает тестирование первого-четвертого момента остатков Следовательно , . [5]
Модельное здание
[ редактировать ]Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( февраль 2019 г. ) |
Построение модели включает в себя поиск набора отношений, представляющих процесс, генерирующий данные. Для этого необходимо избегать всех источников неправильных спецификаций, упомянутых выше.
Один из подходов — начать с модели в общей форме, основанной на теоретическом понимании процесса генерации данных. Затем модель можно подогнать к данным и проверить на наличие различных источников неточностей в рамках задачи, называемой проверкой статистической модели . Теоретическое понимание может затем направить модификацию модели таким образом, чтобы сохранить теоретическую обоснованность, одновременно устраняя источники неправильных спецификаций. Но если окажется невозможным найти теоретически приемлемую спецификацию, соответствующую данным, теоретическую модель, возможно, придется отвергнуть и заменить другой.
Здесь уместна цитата Карла Поппера : «Всякий раз, когда теория кажется вам единственно возможной, воспринимайте это как знак того, что вы не поняли ни теорию, ни проблему, которую она призвана решить». [6]
Другой подход к построению модели — указать несколько разных моделей в качестве кандидатов, а затем сравнить эти модели-кандидаты друг с другом. Цель сравнения — определить, какая модель-кандидат наиболее подходит для статистических выводов. Общие критерии сравнения моделей включают следующее: R 2 , фактор Байеса и критерий отношения правдоподобия вместе с его относительным правдоподобием обобщения . Дополнительную информацию по этой теме см. в разделе Выбор статистической модели .
См. также
[ редактировать ]- Абдуктивное рассуждение
- Концептуальная модель
- Анализ данных
- Преобразование данных (статистика)
- Планирование экспериментов
- Тест Дурбина – Ву – Хаусмана
- Исследовательский анализ данных
- Выбор функции
- Гетероскедастичность , статистическая ошибка второго порядка.
- Тест информационной матрицы
- Идентификация модели
- Принцип бережливости
- Ложные отношения
- Обоснованность статистического вывода
- Статистический вывод
- Статистическая теория обучения
Примечания
[ редактировать ]- ^ Этот конкретный пример известен как функция дохода Mincer .
- ^ Кокс, Д.Р. (2006), Принципы статистического вывода , издательство Кембриджского университета , стр. 197 .
- ^ « Количественные методы II: Эконометрика », Колледж Уильяма и Мэри .
- ^ Бернхэм, КП; Андерсон, Д.Р. (2002), Выбор модели и мультимодельный вывод: практический теоретико-информационный подход (2-е изд.), Springer-Verlag , §1.1 .
- ^ Лонг, Дж. Скотт ; Триведи, Правин К. (1993). «Некоторые тесты спецификации модели линейной регрессии». В Боллене, Кеннет А .; Лонг, Дж. Скотт (ред.). Тестирование моделей структурных уравнений . Издательство SAGE . стр. 66–110.
- ^ Поппер, Карл (1972), Объективное знание: эволюционный подход , Oxford University Press .
Дальнейшее чтение
[ редактировать ]- Акаике, Хиротугу (1994), «Последствия информационной точки зрения на развитие статистической науки», в Боздогане, Х. (ред.), Материалы первой конференции США и Японии по границам статистического моделирования: информационный подход. —Том 3 , Kluwer Academic Publishers , стр. 27–38 .
- Астериу, Димитриос; Холл, Стивен Г. (2011). «Неверная спецификация: неправильные регрессоры, ошибки измерения и неправильные функциональные формы». Прикладная эконометрика (второе изд.). Пэлгрейв Макмиллан . стр. 172–197.
- Коулгрейв, Н.; Ракстон, Джорджия (2017). «Спецификация и мощность статистической модели: рекомендации по использованию пула, проверенного тестами, при анализе экспериментальных данных» . Труды Королевского общества Б. 284 (1851): 20161850. doi : 10.1098/rspb.2016.1850 . ПМК 5378071 . ПМИД 28330912 .
- Гуджарати, Дамодар Н .; Портер, Дон К. (2009). «Эконометрическое моделирование: спецификация модели и диагностическое тестирование». Основная эконометрика (Пятое изд.). МакГроу-Хилл/Ирвин . стр. 467–522. ISBN 978-0-07-337577-9 .
- Харрелл, Фрэнк (2001), Стратегии регрессионного моделирования , Springer .
- Кмента, Ян (1986). Элементы эконометрики (второе изд.). Нью-Йорк: Издательство Macmillan. стр. 442–455 . ISBN 0-02-365070-2 .
- Леманн, Э.Л. (1990). «Спецификация модели: взгляды Фишера и Неймана и более поздние разработки» . Статистическая наука . 5 (2): 160–168. дои : 10.1214/ss/1177012164 .
- Маккиннон, Джеймс Г. (1992). «Тестирование спецификации модели и искусственная регрессия». Журнал экономической литературы . 30 (1): 102–146. JSTOR 2727880 .
- Маддала, GS ; Лахири, Каджал (2009). «Диагностическая проверка, выбор модели и тестирование технических характеристик». Введение в эконометрику (Четвертое изд.). Уайли . стр. 401–449. ISBN 978-0-470-01512-4 .
- Сапра, Сунил (2005). «Тест регрессионной спецификации ошибок (RESET) для обобщенных линейных моделей» (PDF) . Экономический вестник . 3 (1): 1–6.