Инвариантная оценка
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
В статистике понятие инвариантной оценки — это критерий, который можно использовать для сравнения свойств разных оценок одной и той же величины. Это способ формализовать идею о том, что оценщик должен обладать определенными интуитивно привлекательными качествами. Строго говоря, «инвариантность» будет означать, что сами оценки не изменяются, когда и измерения, и параметры преобразуются совместимым образом, но значение было расширено, чтобы позволить оценкам изменяться соответствующим образом при таких преобразованиях. [ 1 ] Термин «эквивариантная оценка» используется в формальных математических контекстах, которые включают точное описание отношения того, как оценка изменяется в ответ на изменения в наборе данных и параметризации: это соответствует использованию « эквивариантности » в более общей математике.
Общие настройки
[ редактировать ]Фон
[ редактировать ]В статистическом выводе существует несколько подходов к теории оценивания , которые можно использовать для немедленного принятия решения о том, какие оценщики следует использовать в соответствии с этими подходами. Например, идеи байесовского вывода приведут непосредственно к байесовским оценкам . Точно так же теория классического статистического вывода иногда может привести к убедительным выводам о том, какую оценку следует использовать. Однако полезность этих теорий зависит от наличия полностью предписанной статистической модели , а также может зависеть от наличия соответствующей функции потерь для определения оценщика. Таким образом, можно провести байесовский анализ , ведущий к апостериорному распределению соответствующих параметров, но использование конкретной функции полезности или потерь может быть неясным. Затем идеи инвариантности можно применить к задаче суммирования апостериорного распределения. В других случаях статистический анализ проводится без полностью определенной статистической модели или классическая теория статистического вывода не может быть легко применена, поскольку рассматриваемое семейство моделей не поддается такой обработке. В дополнение к этим случаям, когда общая теория не предписывает оценку, концепция инвариантности оценки может применяться при поиске оценок альтернативных форм либо ради простоты применения оценки, либо для того, чтобы оценка была крепкий .
Концепция инвариантности иногда используется сама по себе как способ выбора между оценщиками, но это не обязательно является окончательным. Например, требование инвариантности может быть несовместимо с требованием того, чтобы оценщик был несмещенным по среднему значению ; с другой стороны, критерий несмещенности медианы определяется в терминах выборочного распределения оценщика и поэтому инвариантен при многих преобразованиях.
Одним из вариантов использования концепции инвариантности является предложение класса или семейства оценок, среди которых необходимо выбрать конкретную формулировку. Одна из процедур состоит в том, чтобы наложить соответствующие свойства инвариантности, а затем найти в этом классе формулировку, которая обладает лучшими свойствами, что приводит к так называемой оптимальной инвариантной оценке.
Некоторые классы инвариантных оценок
[ редактировать ]Существует несколько типов преобразований, которые полезно учитывать при работе с инвариантными оценками. Каждый из них порождает класс оценок, инвариантных к этим конкретным типам преобразований.
- Инвариантность сдвига: теоретически оценки параметра местоположения должны быть инвариантны к простым сдвигам значений данных. Если все значения данных увеличиваются на заданную величину, оценка должна измениться на ту же величину. При рассмотрении оценки с использованием средневзвешенного значения это требование инвариантности немедленно подразумевает, что сумма весов должна равняться единице. Хотя тот же результат часто получается из требования несмещенности, использование «инвариантности» не требует существования среднего значения и вообще не использует какое-либо распределение вероятностей.
- Масштабная инвариантность: обратите внимание, что эту тему об инвариантности масштабного параметра оценки не следует путать с более общей масштабной инвариантностью поведения систем при совокупных свойствах (в физике).
- Инвариантность преобразования параметров: здесь преобразование применяется только к параметрам. Идея здесь заключается в том, что на основе данных и модели, включающей параметр θ, следует сделать по существу тот же самый вывод, который был бы сделан на основе тех же данных, если бы в модели использовался параметр φ, где φ — взаимно однозначное преобразование θ, φ= h (θ). В соответствии с этим типом инвариантности результаты оценок, инвариантных к преобразованию, также должны быть связаны соотношением φ = h (θ). Оценщики максимального правдоподобия обладают этим свойством, когда преобразование является монотонным . Хотя асимптотические свойства средства оценки могут быть инвариантными, свойства небольшой выборки могут быть разными, и необходимо получить конкретное распределение. [ 2 ]
- Инвариантность перестановок: если набор значений данных может быть представлен статистической моделью, согласно которой они являются результатами независимых и одинаково распределенных случайных величин , разумно наложить требование, чтобы любая оценка любого свойства общего распределения была инвариантной к перестановкам. : в частности, оценщик, рассматриваемый как функция набора значений данных, не должен меняться, если элементы данных меняются местами внутри набора данных.
Сочетание инвариантности перестановок и инвариантности местоположения для оценки параметра местоположения из независимого и одинаково распределенного набора данных с использованием средневзвешенного значения подразумевает, что веса должны быть идентичными и в сумме равняться единице. Конечно, предпочтительнее могут быть другие оценки, кроме средневзвешенного.
Оптимальные инвариантные оценки
[ редактировать ]В рамках этой настройки нам предоставляется набор измерений который содержит информацию о неизвестном параметре . Размеры моделируются как векторная случайная величина, имеющая функцию плотности вероятности который зависит от вектора параметров .
Проблема в том, чтобы оценить данный . Оценка, обозначаемая , является функцией измерений и принадлежит множеству . Качество результата определяется функцией потерь которая определяет функцию риска . Наборы возможных значений , , и обозначаются , , и , соответственно.
В классификации
[ редактировать ]В статистической классификации правило, которое присваивает класс новому элементу данных, можно рассматривать как специальный тип оценщика. можно учитывать ряд соображений типа инвариантности При формулировании предварительных знаний для распознавания образов .
Математическая установка
[ редактировать ]Определение
[ редактировать ]Инвариантная оценка — это оценка, которая подчиняется следующим двум правилам: [ нужна ссылка ]
- Принцип рациональной инвариантности: действие, предпринимаемое при решении проблемы, не должно зависеть от преобразования используемого измерения.
- Принцип инвариантности: если две задачи решения имеют одинаковую формальную структуру (с точки зрения , , и ), то в каждой задаче следует использовать одно и то же решающее правило.
Чтобы формально определить инвариантную или эквивариантную оценку, сначала необходимы некоторые определения, связанные с группами преобразований. Позволять обозначают набор возможных выборок данных. Группа преобразований , который будет обозначаться , представляет собой набор (измеримых) 1:1 и преобразований в себя, что удовлетворяет следующим условиям:
- Если и затем
- Если затем , где (То есть каждое преобразование имеет обратное внутри группы.)
- (т.е. происходит тождественное преобразование )
Наборы данных и в эквивалентны, если для некоторых . Все эквивалентные точки образуют класс эквивалентности . Такой класс эквивалентности называется орбитой ( в ). орбита, , это набор . Если состоит из одной орбиты, тогда называется транзитивным.
Семья плотностей называется инвариантным относительно группы если для каждого и существует уникальный такой, что имеет плотность . будет обозначен .
Если инвариантен относительно группы тогда функция потерь называется инвариантным относительно если для каждого и существует такой, что для всех . Преобразованное значение будет обозначаться .
В приведенном выше представляет собой группу преобразований из себе и представляет собой группу преобразований из самому себе.
Задача оценивания инвариантна (эквивариантна) относительно если существуют три группы как определено выше.
Для задачи оценивания, которая инвариантна относительно , оценщик является инвариантной оценкой относительно если для всех и ,
Характеристики
[ редактировать ]- Функция риска инвариантной оценки, , постоянна на орбитах . Эквивалентно для всех и .
- Функция риска инвариантной оценки с транзитивным является постоянным.
Для данной задачи инвариантная оценка с наименьшим риском называется «лучшей инвариантной оценкой». Наилучшую инвариантную оценку не всегда можно получить. Частным случаем, для которого это может быть достигнуто, является случай, когда является транзитивным.
Пример: параметр местоположения
[ редактировать ]Предполагать является параметром местоположения, если плотность имеет форму . Для и , задача инвариантна относительно . Инвариантная оценка в этом случае должна удовлетворять
таким образом, он имеет вид ( ). является транзитивным по поэтому риск не зависит от : то есть, . Лучшая инвариантная оценка — это та, которая приносит риск до минимума.
В случае, когда L — квадрат ошибки
Оценщик Питмана
[ редактировать ]Проблема оценки состоит в том, что имеет плотность , где θ — оцениваемый параметр, а функция потерь равна . Эта проблема инвариантна со следующими (аддитивными) группами преобразований:
Лучшая инвариантная оценка это тот, который минимизирует
а это оценщик Питмана (1939).
Для случая потерь с квадратичной ошибкой результат:
Если (т.е. многомерное нормальное распределение с независимыми компонентами единичной дисперсии), тогда
Если (независимые компоненты, имеющие распределение Коши с масштабным параметром σ ), тогда ,. Однако результат
с
Ссылки
[ редактировать ]- Бергер, Джеймс О. (1985). Статистическая теория принятия решений и байесовский анализ (2-е изд.). Нью-Йорк: Springer-Verlag. ISBN 0-387-96098-8 . МР 0804611 . [ нужна страница ]
- Фрой, Габриэла В. Коэн (2007). «Оценка Питмана параметра местоположения Коши». Журнал статистического планирования и выводов . 137 (6): 1900–1913. дои : 10.1016/j.jspi.2006.05.002 .
- Питман, EJG (1939). «Оценка местоположения и масштабных параметров непрерывной популяции любой заданной формы». Биометрика . 30 (3/4): 391–421. дои : 10.1093/biomet/30.3-4.391 . JSTOR 2332656 .
- Питман, EJG (1939). «Проверка гипотез относительно параметров местоположения и масштаба». Биометрика . 31 (1/2): 200–215. дои : 10.1093/biomet/31.1-2.200 . JSTOR 2334983 .