Наименее обрезанные квадраты
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Июль 2019 г. ) |
Наименьшие обрезанные квадраты ( LTS ), или наименьшая обрезанная сумма квадратов , представляют собой надежный статистический метод , который подгоняет функцию к набору данных, не подвергаясь при этом чрезмерному влиянию присутствия выбросов. [1] . Это один из многих методов устойчивой регрессии .
Описание метода
[ редактировать ]Вместо стандартного метода наименьших квадратов , который минимизирует сумму квадратов остатков по n точкам, метод LTS пытается минимизировать сумму квадратов остатков по подмножеству. , из этих точек. Неиспользованный баллы не влияют на посадку.
В стандартной задаче наименьших квадратов предполагаемые значения параметра β определяются как те значения, которые минимизируют целевую функцию S (β) квадратов остатков:
где остатки определяются как разности между значениями зависимых переменных (наблюдений) и значениями модели:
и где n — общее количество точек данных. Для анализа методом наименьших обрезанных квадратов эта целевая функция заменяется функцией, построенной следующим образом. Для фиксированного значения β пусть обозначают набор упорядоченных абсолютных значений остатков (в порядке возрастания абсолютного значения). В этих обозначениях стандартная функция суммы квадратов равна
в то время как целевая функция для LTS равна
Вычислительные соображения
[ редактировать ]Поскольку этот метод является бинарным, в котором точки либо включаются, либо исключаются, решения в закрытой форме не существует. В результате методы поиска решения LTS просеивают комбинации данных, пытаясь найти подмножество k , которое дает наименьшую сумму квадратов остатков. Существуют методы для низких n , которые позволяют найти точное решение; однако с увеличением n количество комбинаций быстро растет, что приводит к появлению методов, пытающихся найти приближенные (но в целом достаточные) решения.
Ссылки
[ редактировать ]- Руссиу, П.Дж. (1984). «Регрессия наименьших медиан квадратов». Журнал Американской статистической ассоциации . 79 (388): 871–880. дои : 10.1080/01621459.1984.10477105 . JSTOR 2288718 .
- Руссиу, П.Дж.; Лерой, AM (2005) [1987]. Надежная регрессия и обнаружение выбросов . Уайли. дои : 10.1002/0471725382 . ISBN 978-0-471-85233-9 .
- Ли, Л.М. (2005). «Алгоритм вычисления точной оценки простой линейной регрессии с ограничениями по методу наименьших квадратов». Вычислительная статистика и анализ данных . 48 (4): 717–734. дои : 10.1016/j.csda.2004.04.003 .
- Аткинсон, AC; Ченг, Т.-Ц. (1999). «Вычисление регрессии наименьших обрезанных квадратов с помощью прямого поиска». Статистика и вычисления . 9 (4): 251–263. дои : 10.1023/А:1008942604045 .
- Юнг, Кан-Мо (2007). «Оценщик наименьших обрезанных квадратов в модели ошибок в переменных». Журнал прикладной статистики . 34 (3): 331–338. дои : 10.1080/02664760601004973 .