Парадокс Фридмана
В анализе статистическом Фридмана парадокс [ 1 ] [ 2 ] названная в честь Дэвида Фридмана , представляет собой проблему выбора модели , при которой переменные-предикторы , не имеющие отношения к зависимой переменной, могут проходить тесты на значимость – как индивидуально с помощью t-теста, так и совместно с помощью F-теста на значимость регрессии. Фридман продемонстрировал (посредством моделирования и асимптотических вычислений), что это обычное явление, когда количество переменных аналогично количеству точек данных.
В частности, если зависимая переменная и k регрессоры являются независимыми нормальными переменными и имеется n наблюдений, то, когда k и n совместно стремятся к бесконечности в отношении k / n = ρ ,
- Р 2 переходит в ρ ,
- F-статистика для общей регрессии достигает 1,0, и
- число ложно значимых регрессоров переходит в αk , где α — выбранная критическая вероятность (вероятность ошибки I рода для регрессора). Этот третий результат интуитивно понятен, поскольку он говорит, что количество ошибок типа I равно вероятности ошибки типа I для отдельного параметра, умноженной на количество параметров, значимость которых проверяется.
Совсем недавно новые теоретико-информационные оценки. в попытке решить эту проблему были разработаны [ 3 ] в дополнение к сопутствующей проблеме предвзятости выбора модели, [ 4 ] при этом оценки переменных-предикторов, которые имеют слабую связь с переменной ответа, являются смещенными.
Ссылки
[ редактировать ]- ^ Фридман, Дэвид А. (1983). «Заметки об уравнениях экранирующей регрессии». Американский статистик . 37 (2): 152–155. дои : 10.1080/00031305.1983.10482729 . ISSN 0003-1305 .
- ^ Фридман, Лоуренс С.; Пи, Дэвид (ноябрь 1989 г.). «Вернуться к примечанию об уравнениях экранирующей регрессии». Американский статистик . 43 (4): 279–282. дои : 10.2307/2685389 . JSTOR 2685389 .
- ^ Лукач, ПМ, Бёрнем, К.П. и Андерсон, Д.Р. (2010) «Предвзятость выбора модели и парадокс Фридмана». Анналы Института статистической математики , 62(1), 117–125. два : 10.1007/s10463-009-0234-4
- ^ Бернэм, КП, и Андерсон, ДР (2002). Выбор модели и мультимодельный вывод: практическо-теоретический подход, 2-е изд. Спрингер-Верлаг.