Jump to content

Теорема Гаусса–Маркова

(Перенаправлено со сферической ошибки )

В статистике применяется теорема Гаусса –Маркова (или просто теорема Гаусса для некоторых авторов) [1] утверждает, что обычный метод наименьших квадратов (OLS) имеет самую низкую дисперсию выборки в классе линейных модели линейной несмещенных оценок , если ошибки в регрессии некоррелированы . , имеют равные дисперсии и математическое ожидание, равное нулю [2] ошибки не обязательно должны быть нормальными Для применения теоремы , а также независимыми и одинаково распределенными (только некоррелированными со средним нулевым значением и гомоскедастическими с конечной дисперсией).

Требование несмещенности нельзя отбросить, поскольку существуют смещенные оценки с меньшей дисперсией и среднеквадратической ошибкой. Например, оценщик Джеймса – Стейна (который также снижает линейность) и гребневая регрессия обычно превосходят обычные методы наименьших квадратов. Фактически, обычный метод наименьших квадратов редко является даже допустимой оценкой , как показывает феномен Штейна - при оценке более чем двух неизвестных переменных обычный метод наименьших квадратов всегда будет работать хуже (по среднеквадратической ошибке), чем оценщик Штейна.

Более того, теорема Гаусса-Маркова не применяется при рассмотрении более принципиальных функций потерь, таких как назначенное правдоподобие или расхождение Кульбака-Лейблера , за исключением ограниченного случая нормально распределенных ошибок.

В результате этих открытий статистики обычно мотивируют обычные наименьшие квадраты принципом максимального правдоподобия или рассматривают его как своего рода приблизительный байесовский вывод .

Теорема названа в честь Карла Фридриха Гаусса и Андрея Маркова . Гаусс предоставил оригинальное доказательство. [3] которое впоследствии было существенно обобщено Марковым. [4]

Скалярный оператор случая

[ редактировать ]

Предположим, нам даны два вектора случайных величин: и что мы хотим найти лучшую линейную оценку данный , используя лучший линейный оценщик Где параметры и оба действительные числа.

Такой оценщик будет иметь то же среднее значение и стандартное отклонение, что и , то есть, .

Следовательно, если вектор имеет соответствующее среднее и стандартное отклонение , лучшим линейным оценщиком будет

с имеет то же среднее значение и стандартное отклонение, что и .

Заявление

[ редактировать ]

Предположим, что мы имеем в матричной записи линейную зависимость

расширяется до,

где являются неслучайными, но ненаблюдаемыми параметрами, неслучайны и наблюдаемы (так называемые «объяснительные переменные»), случайны, и поэтому случайны. Случайные величины называются «возмущением», «шумом» или просто «ошибкой» (будет противопоставлено «остатку» далее в статье; см. ошибки и остатки в статистике ). Обратите внимание: чтобы включить константу в приведенную выше модель, можно ввести константу как переменную. с недавно введенным последним столбцом X, равным единице, т.е. для всех . Обратите внимание, что, хотя в качестве выборочных ответов, следующие утверждения и аргументы, включая предположения, доказательства и другие, предполагаются при единственном условии знания но не

Предположения Гаусса – Маркова касаются набора ошибочных случайных величин: :

  • Они имеют среднее ноль:
  • Они гомоскедастичны , то есть все имеют одинаковую конечную дисперсию: для всех и
  • Отдельные члены ошибки не коррелируют:

Линейная оценка представляет собой линейную комбинацию

в котором коэффициенты не могут зависеть от базовых коэффициентов , поскольку они не наблюдаемы, но могут зависеть от значений , поскольку эти данные наблюдаемы. (Зависимость коэффициентов от каждого обычно нелинейно; оценка линейна в каждом и, следовательно, в каждом случайном вот почему это «линейная» регрессия .) Говорят, что оценка несмещена тогда и только тогда, когда

независимо от ценностей . Теперь позвольте — некоторая линейная комбинация коэффициентов. Тогда среднеквадратическая ошибка соответствующей оценки равна

другими словами, это ожидание квадрата взвешенной суммы (по параметрам) различий между оценщиками и соответствующими параметрами, которые необходимо оценить. (Поскольку мы рассматриваем случай, когда все оценки параметров несмещены, эта среднеквадратическая ошибка равна дисперсии линейной комбинации.) Наилучшая линейная несмещенная оценка (СИНИЙ) вектора параметров имеет наименьшую среднеквадратическую ошибку для каждого вектора параметров линейной комбинации. Это эквивалентно условию, что

является положительной полуопределенной матрицей для любой другой линейной несмещенной оценки .

Обычная оценка методом наименьших квадратов (OLS) — это функция

из и (где обозначает транспонирование ), который минимизирует сумму квадратов остатков (суммы неверного прогноза):

Теорема теперь утверждает, что оценка OLS является лучшей линейной несмещенной оценкой (СИНИЙ).

Основная идея доказательства состоит в том, что оценка методом наименьших квадратов некоррелирует с любой линейной несмещенной оценкой нуля, т. е. с каждой линейной комбинацией коэффициенты которого не зависят от ненаблюдаемой но чье ожидаемое значение всегда равно нулю.

Примечание

[ редактировать ]

Доказательство того, что МНК действительно минимизирует сумму квадратов остатков, можно провести следующим образом: вычислить матрицу Гессе и показать, что она положительно определена.

Функция MSE, которую мы хотим минимизировать, равна для модели множественной регрессии с p переменными. Первая производная где это матрица дизайна

Матрица Гессе вторых производных равна

Предполагая, что столбцы линейно независимы, так что обратимо, пусть , затем

Теперь позвольте быть собственным вектором .

С точки зрения векторного умножения это означает где собственное значение, соответствующее . Более того,

Наконец, как собственный вектор было произвольным, это означает, что все собственные значения положительны, поэтому является положительно определенным. Таким образом, действительно является глобальным минимумом.

Или просто посмотрите это для всех векторов . Таким образом, гессиан является положительно определенным, если имеет полный ранг.

Доказательство

[ редактировать ]

Позволять быть еще одной линейной оценкой с где это ненулевая матрица. Поскольку мы ограничиваемся несмещенными оценками, минимальная среднеквадратическая ошибка подразумевает минимальную дисперсию. Поэтому цель состоит в том, чтобы показать, что такая оценка имеет дисперсию не меньшую, чем дисперсия оценщик OLS. Мы рассчитываем:

Следовательно, поскольку является ненаблюдаемым , является несмещенным тогда и только тогда, когда . Затем:

С является положительной полуопределенной матрицей, превышает положительной полуопределенной матрицей.

Замечания по доказательству

[ редактировать ]

Как было сказано ранее, состояние является положительной полуопределенной матрицей, что эквивалентно тому свойству, что лучшая линейная несмещенная оценка является (лучший в том смысле, что он имеет минимальную дисперсию). Чтобы увидеть это, позвольте еще одна линейная несмещенная оценка .

Более того, равенство имеет место тогда и только тогда, когда . Мы рассчитываем

Это доказывает, что равенство имеет место тогда и только тогда, когда что придает уникальность оценщику МНК как СИНИЙ.

Обобщенная оценка методом наименьших квадратов

[ редактировать ]

Обобщенный метод наименьших квадратов (GLS), разработанный Эйткеном , [5] расширяет теорему Гаусса-Маркова на случай, когда вектор ошибок имеет нескалярную ковариационную матрицу. [6] Оценщик Эйткена также СИНИЙ.

Теорема Гаусса – Маркова, сформулированная в эконометрике

[ редактировать ]

В большинстве методов МНК регрессоры (интересующие параметры) в матрице плана предполагаются фиксированными в повторяющихся выборках. Это предположение считается неприемлемым для такой преимущественно неэкспериментальной науки, как эконометрика . [7] Вместо этого предположения теоремы Гаусса – Маркова формулируются при условии, что .

Линейность

[ редактировать ]

Предполагается, что зависимая переменная является линейной функцией переменных, указанных в модели. Спецификация должна быть линейной по своим параметрам. Это не означает, что между независимыми и зависимыми переменными должна существовать линейная связь. Независимые переменные могут принимать нелинейные формы, если параметры линейны. Уравнение квалифицируется как линейный, в то время как можно преобразовать в линейную, заменив по другому параметру, скажем . Уравнение с параметром, зависящим от независимой переменной, не считается линейным, например , где является функцией .

Преобразования данных часто используются для преобразования уравнения в линейную форму. Например, функция Кобба-Дугласа , часто используемая в экономике, является нелинейной:

Но его можно выразить в линейной форме, взяв натуральный логарифм обеих частей: [8]

Это предположение также охватывает вопросы спецификации: предполагается, что выбрана правильная функциональная форма и нет пропущенных переменных .

Однако следует помнить, что параметры, которые минимизируют остатки преобразованного уравнения, не обязательно минимизируют остатки исходного уравнения.

Строгая экзогенность

[ редактировать ]

Для всех наблюдений, ожидание (условное от регрессоров) члена ошибки равно нулю: [9]

где — вектор данных регрессоров для i -го наблюдения и, следовательно, — это матрица данных или матрица проектирования.

Геометрически это предположение означает, что и ортогональны (т. е. их друг другу, так что их внутренний продукт перекрестный момент) равен нулю.

Это предположение нарушается, если объясняющие переменные измеряются с ошибкой или являются эндогенными . [10] Эндогенность может быть результатом одновременности , когда причинно-следственная связь течет вперед и назад между зависимой и независимой переменной. инструментальных переменных Для решения этой проблемы обычно используются методы .

Полный ранг

[ редактировать ]

Пример матрицы данных должен иметь полный ранг столбца .

В противном случае не является обратимым, и оценщик МНК не может быть вычислен.

Нарушением этого предположения является совершенная мультиколлинеарность , т.е. некоторые объясняющие переменные линейно зависимы. Один из сценариев, в котором это произойдет, называется «ловушкой фиктивной переменной», когда базовая фиктивная переменная не опускается, что приводит к идеальной корреляции между фиктивными переменными и постоянным термином. [11]

Мультиколлинеарность (пока она не «идеальна») может присутствовать, что приводит к менее эффективной, но все же несмещенной оценке. Оценки будут менее точными и очень чувствительными к конкретным наборам данных. [12] Мультиколлинеарность можно обнаружить, по числу обусловленности или коэффициенту инфляции дисперсии среди прочего, .

Сферические ошибки

[ редактировать ]

Внешний продукт вектора ошибок должен быть сферическим.

Это означает, что термин ошибки имеет равномерную дисперсию ( гомоскедастичность ) и не имеет серийной корреляции . [13] Если это предположение нарушается, МНК все равно будет объективным, но неэффективным . Термин «сферические ошибки» будет описывать многомерное нормальное распределение : если в многомерной нормальной плотности, то уравнение - это формула для шара с центром в точке µ и радиусом σ в n-мерном пространстве. [14]

Гетероскедастичность возникает, когда величина ошибки коррелирует с независимой переменной. Например, в регрессии расходов на питание и доходов ошибка коррелирует с доходом. Люди с низким доходом обычно тратят на еду одинаковую сумму, в то время как люди с высоким доходом могут тратить очень большую сумму или столько же, сколько тратят люди с низким доходом. Гетероскедастичность также может быть вызвана изменениями в практике измерений. Например, по мере того, как статистические управления улучшают свои данные, ошибка измерения уменьшается, поэтому величина ошибки со временем уменьшается.

Это предположение нарушается при наличии автокорреляции . Автокорреляцию можно визуализировать на графике данных, когда данное наблюдение с большей вероятностью будет лежать выше подобранной линии, если соседние наблюдения также лежат выше подобранной линии регрессии. Автокорреляция часто встречается в данных временных рядов, где ряд данных может испытывать «инерцию». Если зависимой переменной требуется некоторое время, чтобы полностью поглотить шок. Также может возникнуть пространственная автокорреляция. Географические области могут иметь аналогичные ошибки. Автокорреляция может быть результатом неправильной спецификации, например, выбора неправильной функциональной формы. В этих случаях исправление спецификации является одним из возможных способов борьбы с автокорреляцией.

Когда предположение о сферических ошибках может быть нарушено, можно показать, что обобщенная оценка наименьших квадратов имеет СИНИЙ цвет. [6]

См. также

[ редактировать ]

Другая объективная статистика

[ редактировать ]
  1. ^ См. главу 7 Джонсон, РА; Вичерн, Д.В. (2002). Прикладной многомерный статистический анализ . Том. 5. Прентис-холл.
  2. ^ Тейл, Анри (1971). «Лучшая линейная несмещенная оценка и прогноз». Принципы эконометрики . Нью-Йорк: Джон Уайли и сыновья. стр. 119–124 . ISBN  0-471-85845-5 .
  3. ^ Плакетт, Р.Л. (1949). «Историческая справка о методе наименьших квадратов». Биометрика . 36 (3/4): 458–460. дои : 10.2307/2332682 .
  4. ^ Дэвид, ФН; Нейман, Дж. (1938). «Распространение теоремы Маркова о наименьших квадратах». Статистические исследования Мемуары . 2 : 105–116. OCLC   4025782 .
  5. ^ Эйткен, AC (1935). «О наименьших квадратах и ​​линейных комбинациях наблюдений». Труды Королевского общества Эдинбурга . 55 : 42–48. дои : 10.1017/S0370164600014346 .
  6. ^ Jump up to: а б Хуанг, Дэвид С. (1970). Регрессия и эконометрические методы . Нью-Йорк: Джон Уайли и сыновья. стр. 127–147 . ISBN  0-471-41754-8 .
  7. ^ Хаяси, Фумио (2000). Эконометрика . Издательство Принстонского университета. п. 13. ISBN  0-691-01018-8 .
  8. ^ Уолтерс, А.А. (1970). Введение в эконометрику . Нью-Йорк: WW Нортон. п. 275. ИСБН  0-393-09931-8 .
  9. ^ Хаяси, Фумио (2000). Эконометрика . Издательство Принстонского университета. п. 7. ISBN  0-691-01018-8 .
  10. ^ Джонстон, Джон (1972). Эконометрические методы (Второе изд.). Нью-Йорк: МакГроу-Хилл. стр. 267–291 . ISBN  0-07-032679-7 .
  11. ^ Вулдридж, Джеффри (2012). Вводная эконометрика (Пятое международное изд.). Юго-Западный. п. 220 . ISBN  978-1-111-53439-4 .
  12. ^ Джонстон, Джон (1972). Эконометрические методы (Второе изд.). Нью-Йорк: МакГроу-Хилл. стр. 159–168 . ISBN  0-07-032679-7 .
  13. ^ Хаяси, Фумио (2000). Эконометрика . Издательство Принстонского университета. п. 10. ISBN  0-691-01018-8 .
  14. ^ Раманатан, Раму (1993). «Несферические возмущения». Статистические методы в эконометрике . Академическая пресса. стр. 330–351 . ISBN  0-12-576830-3 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 55b874be7e31fc8b6b3421bd7cf31ac2__1722089760
URL1:https://arc.ask3.ru/arc/aa/55/c2/55b874be7e31fc8b6b3421bd7cf31ac2.html
Заголовок, (Title) документа по адресу, URL1:
Gauss–Markov theorem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)