Идентифицируемость
В статистике должна идентифицируемость — это свойство, которому удовлетворять модель точный вывод , чтобы был возможен . Модель является идентифицируемой , если теоретически возможно узнать истинные значения основных параметров этой модели после получения от нее бесконечного числа наблюдений. Математически это эквивалентно утверждению, что разные значения параметров должны порождать разные распределения вероятностей наблюдаемых переменных. Обычно модель идентифицируема только при определенных технических ограничениях, и в этом случае совокупность этих требований называется условиями идентификации .
Модель, которую невозможно идентифицировать, называется неидентифицируемой или неидентифицируемой : две или более параметризации эквивалентны с точки зрения наблюдения . В некоторых случаях, даже если модель не поддается идентификации, все же можно узнать истинные значения определенного подмножества параметров модели. В этом случае мы говорим, что модель частично идентифицируема . В других случаях можно узнать местоположение истинного параметра до определенной конечной области пространства параметров, и в этом случае модель становится идентифицируемой .
Помимо строго теоретического исследования свойств модели, идентифицируемость можно рассматривать в более широком смысле, когда модель тестируется на наборах экспериментальных данных с использованием анализа идентифицируемости . [1]
Определение
[ редактировать ]Позволять быть статистической моделью с пространством параметров . Мы говорим, что идентифицируемо , если отображение является один к одному : [2]
Это определение означает, что различные значения θ должны соответствовать различным распределениям вероятностей: если θ 1 ≠ θ 2 , то также P θ 1 ≠ P θ 2 . [3] Если распределения определены в терминах функций плотности вероятности (PDF), то две PDF-файлы следует считать различными, только если они различаются по множеству ненулевой меры (например, две функции ƒ 1 ( x ) = 1 0 ≤ x < 1 и ƒ 2 ( x ) = 1 0 ≤ x ≤ 1 различаются только в одной точке x = 1 — наборе нулевой меры — и, следовательно, не могут рассматриваться как отдельные PDF-файлы).
Идентифицируемость модели в смысле обратимости отображения эквивалентно возможности узнать истинный параметр модели, если за моделью можно наблюдать неопределенно долго. Действительно, если { X t } ⊆ S — последовательность наблюдений модели, то по закону больших чисел усиленному
для любого измеримого множества A ⊆ S (здесь 1 {...} — индикаторная функция ). Таким образом, при бесконечном числе наблюдений мы сможем найти истинное распределение вероятностей P 0 в модели, а поскольку приведенное выше условие идентифицируемости требует, чтобы отображение быть обратимым, мы также сможем найти истинное значение параметра, который породил данное распределение P 0 .
Примеры
[ редактировать ]Пример 1
[ редактировать ]Позволять быть обычным семейством в масштабе местоположения :
Затем
Это выражение равно нулю почти для всех x только тогда, когда все его коэффициенты равны нулю, что возможно только при | σ 1 | = | σ 2 | и μ 1 = μ 2 . Поскольку в масштабе параметр σ ограничен значением больше нуля, мы заключаем, что модель идентифицируема: ƒ θ 1 = ƒ θ 2 ⇔ θ 1 = θ 2 .
Пример 2
[ редактировать ]Позволять быть стандартной моделью линейной регрессии :
матрицы (где ′ обозначает транспонирование ). Тогда параметр β идентифицируем тогда и только тогда, когда матрица является обратимым. Таким образом, это условие идентификации в модели.
Пример 3
[ редактировать ]Предполагать — классическая ошибок в переменных линейная модель :
где ( ε , η , x* только переменные ( x , y ) — совместно нормальные независимые случайные величины с нулевым ожидаемым значением и неизвестными дисперсиями, и наблюдаются ). Тогда эту модель невозможно идентифицировать, [4] только произведение βσ² ∗ (где σ² ∗ — это дисперсия скрытого регрессора x* ). Это также пример модели, идентифицируемой множеством : хотя точное значение β невозможно узнать, мы можем гарантировать, что оно должно лежать где-то в интервале ( β yx , 1 ÷ β xy ), где β yx — коэффициент в МНК. регрессия y по x , а β xy — коэффициент регрессии OLS x по y . [5]
Если отказаться от предположения о нормальности и потребовать, чтобы x* были не нормально распределены, сохранив лишь условие независимости ε ⊥ η ⊥ x* , то модель станет идентифицируемой. [4]
См. также
[ редактировать ]Ссылки
[ редактировать ]Цитаты
[ редактировать ]- ^ Рауэ, А.; Кройц, К.; Майвальд, Т.; Бахманн, Дж.; Шиллинг, М.; Клингмюллер, У.; Тиммер, Дж. (1 августа 2009 г.). «Структурный и практический анализ идентифицируемости частично наблюдаемых динамических моделей с использованием вероятности профиля» . Биоинформатика . 25 (15): 1923–1929. doi : 10.1093/биоинформатика/btp358 . ПМИД 19505944 .
- ^ Леманн и Казелла 1998 , гл. 1, Определение 5.2
- ^ ван дер Ваарт 1998 , с. 62
- ^ Перейти обратно: а б Разлив креветок 1950 г.
- ^ Казелла и Бергер 2002 , с. 583
Источники
[ редактировать ]- Казелла, Джордж ; Бергер, Роджер Л. (2002), Статистический вывод (2-е изд.), ISBN 0-534-24312-6 , LCCN 2001025794
- Сяо, Ченг (1983), Идентификация , Справочник по эконометрике, Том. 1, гл.4, Издательство «Северная Голландия»
- Леманн, Эль ; Казелла, Г. (1998), Теория точечной оценки (2-е изд.), Springer, ISBN 0-387-98502-6
- Рейерсол, Олав (1950), «Идентифицируемость линейной связи между переменными, которые подвержены ошибкам», Econometrica , 18 (4): 375–389, doi : 10.2307/1907835 , JSTOR 1907835
- ван дер Ваарт, AW (1998), Асимптотическая статистика , Издательство Кембриджского университета , ISBN 978-0-521-49603-2
Дальнейшее чтение
[ редактировать ]- Уолтер, Э. ; Пронцато, Л. (1997), Идентификация параметрических моделей на основе экспериментальных данных , Springer
Эконометрика
[ редактировать ]- Льюбель, Артур (01 декабря 2019 г.). «Зоопарк идентификации: значения идентификации в эконометрике» . Журнал экономической литературы . 57 (4). Американская экономическая ассоциация: 835–903. дои : 10.1257/jel.20181361 . ISSN 0022-0515 . S2CID 125792293 .
- Мацкин, Роза Л. (2013). «Непараметрическая идентификация в структурных экономических моделях». Ежегодный обзор экономики . 5 (1): 457–486. doi : 10.1146/annurev- Economics-082912-110231 .
- Ротенберг, Томас Дж. (1971). «Идентификация в параметрических моделях». Эконометрика . 39 (3): 577–591. дои : 10.2307/1913267 . ISSN 0012-9682 . JSTOR 1913267 .