Пресс-статистика
В статистике ( сумма квадратов прогнозируемых остаточных ошибок PRESS ) — это форма перекрестной проверки , используемая в регрессионном анализе для получения сводной меры соответствия модели выборке наблюдений, которые сами по себе не использовались для оценки модели. Он рассчитывается как сумма квадратов остатков прогноза для этих наблюдений. [1] [2] [3] В частности, статистика PRESS представляет собой исчерпывающую форму перекрестной проверки, поскольку она проверяет все возможные способы разделения исходных данных на обучающий и проверочный наборы.
После создания подобранной модели каждое наблюдение по очереди удаляется, а модель переоснащается с использованием оставшихся наблюдений (аналогично перекрестной проверке с исключением одного ). Прогнозируемое значение вне выборки рассчитывается для пропущенного наблюдения в каждом случае, а статистика PRESS рассчитывается как сумма квадратов всех полученных ошибок прогнозирования: [4]
С помощью этой процедуры статистика PRESS может быть рассчитана для нескольких структур-кандидатов модели для одного и того же набора данных, при этом самые низкие значения PRESS указывают на лучшие структуры. Модели, которые чрезмерно параметризованы ( переоснащены ), будут иметь тенденцию давать небольшие остатки для наблюдений, включенных в подбор модели, но большие остатки для исключенных наблюдений.Статистика PRESS широко используется в ленивом обучении и локально линейном обучении для ускорения оценки и выбора размера окрестности. [5] [6]
См. также [ править ]
Ссылки [ править ]
- ^ «Учебник по электронной статистике Statsoft — Статистический словарь» . Архивировано из оригинала 10 мая 2016 года . Проверено 13 мая 2016 г.
- ^ Аллен, DM (1974), «Взаимосвязь между выбором переменных и увеличением данных и методом прогнозирования», Technometrics , 16, 125–127.
- ^ Тарпи, Таддеус (2000) «Заметка о прогнозной сумме статистики квадратов для ограниченных наименьших квадратов», The American Statistician , Vol. 54, № 2, май, стр. 116–118.
- ^ «Графическое руководство по R: статистика Аллена PRESS (прогнозируемая сумма квадратов), также известная как P-квадрат» . Архивировано из оригинала 27 февраля 2018 года . Проверено 27 февраля 2018 г.
- ^ Аткесон, Кристофер Г.; Мур, Эндрю В.; Шааль, Стефан (1 февраля 1997 г.). «Локально взвешенное обучение» . Обзор искусственного интеллекта . 11 (1): 11–73. дои : 10.1023/А:1006559212014 . ISSN 1573-7462 . S2CID 9219592 . Архивировано из оригинала 6 мая 2021 года . Проверено 25 сентября 2020 г.
- ^ Бонтемпи, Джанлука; Бираттари, Мауро; Берсини, Хьюг (1 января 1999 г.). «Ленивое обучение локальному моделированию и проектированию средств управления». Международный журнал контроля . 72 (7–8): 643–658. дои : 10.1080/002071799220830 .