М-оценщик
В статистике , М-оценки представляют собой широкий класс экстремальных оценок для которых целевой функцией является выборочное среднее значение. [1] И нелинейный метод наименьших квадратов , и оценка максимального правдоподобия являются частными случаями M-оценок. Определение М-оценок было мотивировано надежной статистикой , которая способствовала появлению новых типов М-оценок. [ нужна ссылка ] Однако М-оценки не являются по своей сути надежными, что ясно из того факта, что они включают в себя оценки максимального правдоподобия, которые, как правило, не являются надежными. Статистическая процедура оценки M-оценки набора данных называется M-оценкой .
В более общем смысле, M-оценщик может быть определен как ноль оценочной функции . [2] [3] [4] [5] [6] [7] Эта оценочная функция часто является производной другой статистической функции. Например, оценка максимального правдоподобия — это точка, в которой производная функции правдоподобия по параметру равна нулю; оценка максимального правдоподобия является критической точкой оценочной таким образом , функции. [8] Во многих приложениях такие M-оценщики можно рассматривать как оценивающие характеристики совокупности.
Историческая мотивация
[ редактировать ]Метод наименьших квадратов является прототипом М-оценки, поскольку оценка определяется как минимум суммы квадратов остатков.
Еще один популярный метод M-оценки — оценка максимального правдоподобия. Для семейства функций плотности вероятности f, параметризованных θ , максимального правдоподобия оценка θ вычисляется для каждого набора данных путем максимизации функции правдоподобия в пространстве параметров { θ }. Когда наблюдения независимы и одинаково распределены, ML-оценка удовлетворяет
или, что то же самое,
Оценки максимального правдоподобия обладают оптимальными свойствами в пределе бесконечного числа наблюдений при довольно общих условиях, но могут быть смещенными и не самыми эффективными оценками для конечных выборок.
Определение
[ редактировать ]В 1964 году Питер Дж. Хубер предложил обобщить оценку максимального правдоподобия до минимизации
где ρ — функция с определенными свойствами (см. ниже). Решения
называются М-оценками («М» означает «тип максимального правдоподобия» (Huber, 1981, стр. 43)); другие типы робастных оценок включают L-оценки , R-оценки и S-оценки . Таким образом, оценки максимального правдоподобия (MLE) являются особым случаем M-оценок. При соответствующем масштабировании M-оценки представляют собой частные случаи оценок экстремума (в которых можно использовать более общие функции наблюдений).
Функция ρ или ее производная ψ могут быть выбраны таким образом, чтобы обеспечить желательные свойства оценщика (с точки зрения смещения и эффективности), когда данные действительно соответствуют предполагаемому распределению, и «неплохое» поведение, когда данные генерируются на основе модели, которая в некотором смысле близка к предполагаемому распределению.
Типы
[ редактировать ]M-оценщики — это решения θ , которые минимизируют
Эту минимизацию всегда можно выполнить напрямую. Часто проще дифференцировать по θ и найти корень производной. Когда такое дифференцирование возможно, говорят, что M-оценщик имеет ψ-тип . В противном случае говорят, что M-оценка имеет ρ-тип .
В большинстве практических случаев М-оценки имеют ψ-тип.
p-тип
[ редактировать ]Для положительного целого числа r пусть и быть мерными пространствами. представляет собой вектор параметров. M-оценка ρ-типа определяется через измеримую функцию . Он отображает распределение вероятностей на к значению (если он существует), что минимизирует :
Например, для оценки максимального правдоподобия : , где .
ψ-тип
[ редактировать ]Если является дифференцируемым относительно , вычисление обычно гораздо проще. M-оценка ψ-типа T определяется через измеримую функцию . Он отображает распределение вероятностей F на к значению (если оно существует), которое решает векторное уравнение:
Например, для оценки максимального правдоподобия : , где обозначает транспонирование вектора u и .
Такая оценка не обязательно является M-оценкой ρ-типа, но если ρ имеет непрерывную первую производную по , то необходимым условием того, чтобы M-оценка ψ-типа была M-оценкой ρ-типа, является . Предыдущие определения можно легко распространить на конечные выборки.
Если функция ψ убывает до нуля как , оценка называется нисходящей . Такие оценки обладают некоторыми дополнительными желательными свойствами, например, полным отказом от грубых выбросов.
Вычисление
[ редактировать ]Для многих вариантов выбора ρ или ψ не существует решения в замкнутой форме, и требуется итерационный подход к вычислениям. Можно использовать стандартные алгоритмы оптимизации функций, такие как Ньютон-Рафсон . Однако в большинстве случаев методом наименьших квадратов с итеративным перевзвешиванием можно выполнить алгоритм аппроксимации ; обычно это предпочтительный метод.
Для некоторых вариантов выбора ψ, в частности, для повторно нисходящих функций, решение может быть неединственным. Этот вопрос особенно актуален в многомерных и регрессионных задачах. Таким образом, необходима определенная осторожность, чтобы гарантировать выбор хороших отправных точек. Надежные отправные точки, такие как медиана как оценка местоположения и медианное абсолютное отклонение как одномерная оценка масштаба, являются общими.
Концентрирующие параметры
[ редактировать ]При вычислении M-оценок иногда полезно переписать целевую функцию , чтобы уменьшить размерность параметров. Процедура называется «концентрацией» или «профилированием». Примеры, в которых концентрация параметров увеличивает скорость вычислений, включают, казалось бы, несвязанные модели регрессии (SUR). [9] Рассмотрим следующую задачу M-оценки:
Предполагая дифференцируемость функции q , M-оценщик решает условия первого порядка:
Теперь, если мы сможем решить второе уравнение для γ в терминах и , второе уравнение принимает вид:
где g, нужно найти некоторую функцию. Теперь мы можем переписать исходную целевую функцию исключительно через β, подставив функцию g вместо . В результате происходит сокращение количества параметров.
Можно ли выполнить эту процедуру, зависит от конкретных проблем. Однако, когда это возможно, концентрация параметров может в значительной степени облегчить вычисления. Например, при оценке модели SUR из 6 уравнений с 5 объясняющими переменными в каждом уравнении по максимальному правдоподобию количество параметров уменьшается с 51 до 30. [9]
Несмотря на свою привлекательную особенность в вычислениях, концентрация параметров имеет ограниченное применение при выводе асимптотических свойств M-оценки. [10] Наличие W в каждом слагаемом целевой функции затрудняет применение закона больших чисел и центральной предельной теоремы .
Характеристики
[ редактировать ]Распределение
[ редактировать ]Можно показать, что M-оценки асимптотически нормально распределены. Таким образом, подходы типа Вальда можно использовать к построению доверительных интервалов и проверке гипотез. Однако, поскольку теория является асимптотической, часто имеет смысл проверить распределение, возможно, исследуя распределение перестановок или бутстреп- распределение.
Функция влияния
[ редактировать ]Функция влияния M-оценки -тип пропорционален его определению функция.
Пусть T — M-оценка ψ-типа, а G — распределение вероятностей, для которого определяется. Его функция влияния IF равна
предполагая, что функция плотности существует. Доказательство этого свойства М-оценок можно найти у Хубера (1981, раздел 3.2).
Приложения
[ редактировать ]M-оценщики могут быть построены для параметров местоположения и параметров масштаба в одномерных и многомерных настройках, а также использоваться в устойчивой регрессии.
Примеры
[ редактировать ]Иметь в виду
[ редактировать ]Пусть ( X 1 , ..., X n ) — набор независимых одинаково распределенных случайных величин с распределением F .
Если мы определим
отметим, что это минимизируется, когда является средним значением X θ s. Таким образом, среднее значение является M-оценкой ρ-типа с этой функцией ρ.
Поскольку эта функция ρ непрерывно дифференцируема по θ , среднее значение, таким образом, также является M-оценкой ψ-типа для ψ( x , θ ) = θ − x .
медиана
[ редактировать ]Вместо этого для медианной оценки ( X 1 , ..., X n ) мы можем определить функцию ρ как
и аналогично функция ρ минимизируется, когда является медианой X s θ .
Хотя эта функция ρ не дифференцируема по θ , M-оценка ψ-типа, которая является субградиентом функции ρ, может быть выражена как
и
Достаточные условия статистической согласованности
[ редактировать ]M-оценки согласованы при различных условиях. Типичный набор предположений состоит в том, что класс функций удовлетворяет равномерному закону больших чисел и что максимум хорошо разделен. В частности, с учетом эмпирической и популяционной цели соответственно, как :
и для каждого :
где является функцией расстояния и является оптимальным, то M-оценка непротиворечива. [11]
Ограничение равномерной сходимости не обязательно требуется; альтернативный набор предположений состоит в том, чтобы вместо этого рассмотреть поточечную сходимость ( по вероятности ) целевых функций. Кроме того, предположим, что каждый из имеет непрерывную производную ровно с одним нулем или имеет неубывающую производную и асимптотически порядок . Наконец, предположим, что максимум хорошо разделен. Тогда M-оценка непротиворечива. [12]
См. также
[ редактировать ]- Двухшаговая M-оценка
- Надежная статистика
- Устойчивая регрессия
- Спускающаяся M-оценка
- S-оценщик
- Фреше означает
Ссылки
[ редактировать ]- ^ Хаяси, Фумио (2000). «Экстремальные оценки» . Эконометрика . Издательство Принстонского университета. ISBN 0-691-01018-8 .
- ^ Видьядхар П. Годамбе , редактор. Оценочные функции , том 7 серии Oxford Statistical Science. Clarendon Press Oxford University Press, Нью-Йорк, 1991.
- ^ Кристофер К. Хейд. Квазиправдоподобие и его применение: общий подход к оценке оптимальных параметров . Серия Спрингера по статистике. Спрингер-Верлаг, Нью-Йорк, 1997 г.
- ^ DL Маклиш и Кристофер Г. Смолл. Теория и приложения статистических функций вывода , том 44 конспектов лекций по статистике. Спрингер-Верлаг, Нью-Йорк, 1988 г.
- ^ Паримал Мукхопадхьяй. Введение в оценивание функций . Альфа Сайенс Интернэшнл, Лтд, 2004.
- ^ Кристофер Г. Смолл и Цзиньфан Ван. Численные методы для нелинейных уравнений оценки , том 29 серии Oxford Statistical Science. Издательство Clarendon Press Oxford University Press, Нью-Йорк, 2003 г.
- ^ Сара А. ван де Гир . Эмпирические процессы в M-оценке: приложения теории эмпирических процессов, том 6 Кембриджской серии по статистической и вероятностной математике. Издательство Кембриджского университета, Кембридж, 2000.
- ^ Фергюсон, Томас С. (1982). «Непоследовательная оценка максимального правдоподобия». Журнал Американской статистической ассоциации . 77 (380): 831–834. дои : 10.1080/01621459.1982.10477894 . JSTOR 2287314 .
- ^ Jump up to: а б Джайлз, Делавэр (10 июля 2012 г.). «Концентрация или профилирование функции правдоподобия» .
- ^ Вулдридж, Дж. М. (2001). Эконометрический анализ перекрестных и панельных данных . Кембридж, Массачусетс: MIT Press. ISBN 0-262-23219-7 .
- ^ Ваарт А.В. ван дер. Асимптотическая статистика. Издательство Кембриджского университета; 1998.
- ^ Ваарт А.В. ван дер. Асимптотическая статистика. Издательство Кембриджского университета; 1998.
Дальнейшее чтение
[ редактировать ]- Андерсен, Роберт (2008). Современные методы устойчивой регрессии . Количественные приложения в социальных науках. Том. 152. Лос-Анджелес, Калифорния: Публикации Sage. ISBN 978-1-4129-4072-6 .
- Годамбе, вице-президент (1991). Оценочные функции . Оксфордская серия статистических наук. Том. 7. Нью-Йорк: Кларендон Пресс. ISBN 978-0-19-852228-7 .
- Хейде, Кристофер К. (1997). Хейде, Кристофер С. (ред.). Квазиправдоподобие и его применение: общий подход к оценке оптимальных параметров . Серия Спрингера по статистике. Нью-Йорк: Спрингер. дои : 10.1007/b98823 . ISBN 978-0-387-98225-0 .
- Хубер, Питер Дж. (2009). Надежная статистика (2-е изд.). John Wiley & Sons Inc. Хобокен, Нью-Джерси: ISBN 978-0-470-12990-6 .
- Хоглин, Дэвид К.; Фредерик Мостеллер; Джон В. Тьюки (1983). Понимание надежного и исследовательского анализа данных . John Wiley & Sons Inc. Хобокен, Нью-Джерси: ISBN 0-471-09777-2 .
- Маклиш, Д.Л.; Кристофер Г. Смолл (1989). Теория и приложения статистических функций вывода . Конспект лекций по статистике. Том. 44. Нью-Йорк: Спрингер. ISBN 978-0-387-96720-2 .
- Мукхопадьяй, Паримал (2004). Введение в оценивание функций . Харроу, Великобритания: Alpha Science International, Ltd. ISBN 978-1-84265-163-6 .
- Пресс, WH; Теукольский, С.А.; Феттерлинг, WT; Фланнери, BP (2007), «Раздел 15.7. Робастная оценка» , Численные рецепты: искусство научных вычислений (3-е изд.), Нью-Йорк: Cambridge University Press, ISBN 978-0-521-88068-8
- Серфлинг, Роберт Дж. (2002). Аппроксимационные теоремы математической статистики . Ряд Уайли по вероятности и математической статистике. John Wiley & Sons Inc. Хобокен, Нью-Джерси: ISBN 978-0-471-21927-9 .
- Шапиро, Александр (2000). «Об асимптотике локальных M -оценок с ограничениями». Анналы статистики . 28 (3): 948–960. CiteSeerX 10.1.1.69.2288 . дои : 10.1214/aos/1015952006 . JSTOR 2674061 . МР 1792795 .
- Смолл, Кристофер Г.; Цзиньфан Ван (2003). Численные методы решения нелинейных уравнений . Оксфордская серия статистических наук. Том. 29. Нью-Йорк: Издательство Оксфордского университета. ISBN 978-0-19-850688-1 .
- ван де Гир, Сара А. (2000). Эмпирические процессы в M-оценке: приложения теории эмпирических процессов . Кембриджская серия по статистической и вероятностной математике. Том. 6. Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 978-0-521-65002-1 .
- Уилкокс, Р.Р. (2003). Применение современных статистических методов . Сан-Диего, Калифорния: Academic Press. стр. 55–79.
- Уилкокс, Р.Р. (2012). Введение в робастную оценку и проверку гипотез, 3-е изд . Сан-Диего, Калифорния: Academic Press.
Внешние ссылки
[ редактировать ]- М-оценщики — введение в тему Чжэнъю Чжана