Влиятельное наблюдение
В статистике влиятельное наблюдение — это наблюдение для статистического расчета , удаление которого из набора данных заметно изменило бы результат расчета. [1] В частности, в регрессионном анализе влиятельным является наблюдение, удаление которого оказывает большое влияние на оценки параметров. [2]
Оценка
[ редактировать ]Для измерения влияния были предложены различные методы. [3] [4] Предположим предполагаемую регрессию , где представляет собой вектор-столбец n × 1 для переменной ответа, - n × k матрица плана независимых переменных (включая константу), - вектор невязки n × 1, а представляет собой вектор k × 1 оценок некоторого параметра совокупности. . Также определите , проекции матрица . Тогда мы имеем следующие меры воздействия:
- , где обозначает коэффициенты, оцененные по i -й строке из удалено, обозначает i -е значение матрицы главная диагональ. Таким образом, DFBETA измеряет разницу в оценке каждого параметра с учетом и без влиятельной точки. Для каждой переменной и каждого наблюдения существует DFBETA (если имеется N наблюдений и k переменных, то существует N·k DFBETA). [5] В таблице показаны DFBETA для третьего набора данных из квартета Анскомба (нижний левый график на рисунке):
х | и | перехватывать | склон |
10.0 | 7.46 | -0.005 | -0.044 |
8.0 | 6.77 | -0.037 | 0.019 |
13.0 | 12.74 | -357.910 | 525.268 |
9.0 | 7.11 | -0.033 | 0 |
11.0 | 7.81 | 0.049 | -0.117 |
14.0 | 8.84 | 0.490 | -0.667 |
6.0 | 6.08 | 0.027 | -0.021 |
4.0 | 5.39 | 0.241 | -0.209 |
12.0 | 8.15 | 0.137 | -0.231 |
7.0 | 6.42 | -0.020 | 0.013 |
5.0 | 5.73 | 0.105 | -0.087 |
Выбросы, рычаги воздействия и влияние
[ редактировать ]Выброс , можно определить как точку данных которая заметно отличается от других наблюдений. [6] [7] Точкой высокого воздействия являются наблюдения, сделанные при экстремальных значениях независимых переменных. [8] Оба типа нетипичных наблюдений заставят линию регрессии приблизиться к точке. [2] В квартете Анскомба нижнее правое изображение имеет точку с высоким рычагом, а нижнее левое изображение имеет отдаленную точку.
См. также
[ редактировать ]- Функция влияния (статистика)
- Выброс
- Использовать
- Регрессионный анализ
- Расстояние Кука § Обнаружение весьма влиятельных наблюдений
- Обнаружение аномалий
Ссылки
[ редактировать ]- ^ Берт, Джеймс Э.; Барбер, Джеральд М.; Ригби, Дэвид Л. (2009), Элементарная статистика для географов , Guilford Press, стр. 513, ISBN 9781572304840 .
- ^ Jump up to: а б с Эверитт, Брайан (1998). Кембриджский статистический словарь . Кембридж, Великобритания, Нью-Йорк: Издательство Кембриджского университета. ISBN 0-521-59346-8 .
- ^ Победитель Ларри (25 марта 2002 г.). «Статистика влияния, выбросы и диагностика коллинеарности» .
- ^ Белсли, Дэвид А.; Кух, Эдвин; Уэлш, Рой Э. (1980). Регрессионная диагностика: выявление влиятельных данных и источников коллинеарности . Ряд Уайли по вероятности и математической статистике. Нью-Йорк: Джон Уайли и сыновья . стр. 11–16. ISBN 0-471-05856-4 .
- ^ «Выбросы и DFBETA» (PDF) . Архивировано (PDF) из оригинала 11 мая 2013 г.
- ^ Граббс, Ф.Е. (февраль 1969 г.). «Процедуры обнаружения посторонних наблюдений в выборках». Технометрика . 11 (1): 1–21. дои : 10.1080/00401706.1969.10490657 .
Исключительное наблюдение, или «выброс», — это наблюдение, которое заметно отличается от других членов выборки, в которой оно встречается.
- ^ Маддала, GS (1992). «Выбросы» . Введение в эконометрику (2-е изд.). Нью-Йорк: Макмиллан. стр. 89 . ISBN 978-0-02-374545-4 .
Выброс — это наблюдение, которое далеко удалено от остальных наблюдений.
- ^ Эверитт, бакалавр наук (2002). Кембриджский статистический словарь . Издательство Кембриджского университета. ISBN 0-521-81099-Х .
Дальнейшее чтение
[ редактировать ]- Дехон, Кэтрин; Гасснер, Марджори; Верарди, Винченцо (2009). «Остерегайтесь «хороших» выбросов и чрезмерно оптимистичных выводов». Оксфордский бюллетень экономики и статистики . 71 (3): 437–452. дои : 10.1111/j.1468-0084.2009.00543.x . S2CID 154376487 .
- Кеннеди, Питер (2003). «Надежная оценка» . Руководство по эконометрике (Пятое изд.). Кембридж: MIT Press. стр. 372–388. ISBN 0-262-61183-Х .