Jump to content

Повторная выборка складного ножа

(Перенаправлено с Складной нож (статистика) )
Схема повторной выборки складного ножа

В статистике складной нож (перекрестная проверка складным ножом) — это метод перекрестной проверки и, следовательно, форма повторной выборки .Это особенно полезно для оценки смещения и дисперсии . Складной нож появился раньше других распространенных методов повторной выборки, таких как бутстрап . Учитывая выборку размером , оценщик складного ножа может быть построен путем агрегирования оценок параметров из каждой подвыборки размера получено путем исключения одного наблюдения. [1]

Техника складного ножа была разработана Морисом Кенуем (1924–1973) в 1949 году и усовершенствована в 1956 году. Джон Тьюки расширил эту технику в 1958 году и предложил название «складной нож», потому что, как и обычный складной нож (компактный складной нож), это готовый инструмент, который может импровизировать решение множества проблем, хотя конкретные проблемы можно более эффективно решить с помощью специально разработанного инструмента. [2]

Складной нож — это линейная аппроксимация бутстрапа . [2]

Простой пример: средняя оценка

[ редактировать ]

параметра «складной нож» Оценщик находится путем систематического исключения каждого наблюдения из набора данных и расчета оценки параметра по оставшимся наблюдениям, а затем агрегирования этих вычислений.

Например, если оцениваемый параметр представляет собой среднее совокупное значение случайной величины , то для данного набора iid наблюдений естественная оценка - это выборочное среднее:

где последняя сумма использовала другой способ указать, что индекс пробегает по съемочной площадке .

Далее поступаем следующим образом: для каждого мы вычисляем среднее значение подвыборки складного ножа, состоящей из всех, кроме -я точка данных, и это называется -й повтор складного ножа:

Было бы полезно подумать, что эти складной нож реплики дайте нам приблизительное распределение выборочного среднего значения и чем больше тем лучше будет это приближение. Затем, наконец, чтобы получить оценку складного ножа, мы берем среднее из этих складной нож повторяет:

Можно задаться вопросом о смещении и дисперсии . Из определения поскольку среднее значение складного ножа повторяется, можно попытаться вычислить явно, а смещение - это тривиальный расчет, но дисперсия более сложен, поскольку реплики складного ножа не являются независимыми.

Для частного случая среднего можно явно показать, что оценка складного ножа равна обычной оценке:

Это устанавливает тождество . Затем, учитывая ожидания, мы получаем , так является несмещенным, принимая во внимание дисперсию, мы получаем . Однако эти свойства обычно не справедливы для других параметров, кроме среднего.

Этот простой пример для случая оценки среднего предназначен только для иллюстрации конструкции оценщика складного ножа, в то время как реальные тонкости (и полезность) проявляются в случае оценки других параметров, таких как моменты, более высокие, чем среднее значение, или другие функционалы от распределение.

может быть использован для построения эмпирической оценки систематической ошибки , а именно с некоторым подходящим коэффициентом , хотя в этом случае мы знаем, что поэтому эта конструкция не добавляет никаких значимых знаний, но дает правильную оценку систематической ошибки (которая равна нулю).

Складная оценка дисперсии можно рассчитать по дисперсии повторов складного ножа : [3] [4]

Левое равенство определяет оценку а правое равенство — это тождество, которое можно проверить непосредственно. Затем, учитывая ожидания, мы получаем , так что это несмещенная оценка дисперсии .

Оценка смещения оценщика

[ редактировать ]

Метод «складного ножа» можно использовать для оценки (и корректировки) смещения оценщика, рассчитанного по всей выборке.

Предполагать представляет собой целевой параметр, который, как предполагается, является некоторым функционалом распределения . На основе конечного набора наблюдений , который, как предполагается, состоит из iid- копий , оценщик построен:

Стоимость зависит от выборки, поэтому это значение будет меняться от одной случайной выборки к другой.

По определению, предвзятость заключается в следующем:

Возможно, вам захочется вычислить несколько значений из нескольких образцов и усреднить их, чтобы рассчитать эмпирическую аппроксимацию , но это невозможно, когда нет «других выборок», когда вся совокупность имеющихся наблюдений был использован для расчета . В такой ситуации может помочь метод повторной выборки «складной нож».

Конструируем повторы складного ножа:

где каждый экземпляр представляет собой оценку с «исключением одного» на основе подвыборки складного ножа, состоящей из всех точек данных, кроме одной:

Затем мы определяем их среднее значение:

Складная оценка смещения дается:

и результирующая оценка складного ножа с поправкой на предвзятость дается:

Это устраняет смещение в особом случае, когда смещение и сводит его к в других случаях. [2]

Оценка дисперсии оценщика

[ редактировать ]

Метод «складного ножа» также можно использовать для оценки дисперсии оценщика, рассчитанного по всей выборке.

См. также

[ редактировать ]

Литература

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Эфрон 1982 , с. 2.
  2. ^ Jump up to: а б с Кэмерон и Триведи 2005 , с. 375.
  3. ^ Эфрон 1982 , с. 14.
  4. ^ Макинтош, Эйвери И. «Метод оценки складного ножа» (PDF) . Бостонский университет . Эйвери И. Макинтош. Архивировано из оригинала (PDF) 14 мая 2016 г. Проверено 30 апреля 2016 г. : с. 3.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: cc1a657a72f6c756ce6dde6d1695065f__1721664420
URL1:https://arc.ask3.ru/arc/aa/cc/5f/cc1a657a72f6c756ce6dde6d1695065f.html
Заголовок, (Title) документа по адресу, URL1:
Jackknife resampling - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)