Jump to content

Оценщик Ходжеса – Лемана

В статистике оценка Ходжеса -Лемана является надежной и непараметрической оценкой популяции параметра местоположения . Для популяций, которые симметричны относительно одной медианы , таких как гауссово или нормальное распределение или Стьюдента t -распределение , оценщик Ходжеса-Лемана представляет собой последовательную и несмещенную к медиане оценку медианы популяции. Для несимметричных популяций оценщик Ходжеса-Лемана оценивает « псевдомедиану », которая тесно связана с медианой популяции.

Оценка Ходжеса-Лемана была первоначально предложена для оценки параметра местоположения одномерных популяций, но она использовалась для многих других целей. Он использовался для оценки различий между членами двух популяций. Он был обобщен от одномерных популяций до многомерных популяций , которые производят образцы векторов .

Он основан на знаково-ранговой статистике Уилкоксона . В статистической теории это был ранний пример ранговой оценки , важного класса оценок как в непараметрической статистике, так и в робастной статистике. Оценка Ходжеса-Лемана была предложена в 1963 году независимо Пранабом Кумаром Сеном , Джозефом Ходжесом и Эрихом Леманном , поэтому ее также называют « оценкой Ходжеса-Лемана-Сена ». [ 1 ]

Определение

[ редактировать ]

В простейшем случае статистика «Ходжеса – Лемана» оценивает параметр местоположения для одномерной совокупности. [ 2 ] [ 3 ] Его вычисление можно быстро описать. Для набора данных с n измерениями набор всех возможных его двухэлементных подмножеств такой, что (т.е., в частности, включая самопары; многие вторичные источники ошибочно опускают эту деталь), набор которого состоит из n ( n + 1)/2 элементов. Для каждого такого подмножества вычисляется среднее значение; наконец, медиана этих n ( n + 1)/2 средних значений определяется как оценка местоположения Ходжеса – Лемана.

Статистика Ходжеса-Лемана также оценивает разницу между двумя популяциями. Для двух наборов данных с m и n наблюдениями набор составленных из них двухэлементных наборов представляет собой их декартово произведение, содержащее m × n пар точек (по одной из каждого набора); каждая такая пара определяет одну разность значений. Статистика Ходжеса-Лемана представляет собой различий m медиану × n . [ 4 ]

Оценка медианной численности симметричной популяции

[ редактировать ]

Для симметричной популяции статистика Ходжеса-Лемана оценивает медиану популяции. Это надежная статистика с точкой разбивки 0,29, что означает, что статистика остается ограниченной, даже если почти 30 процентов данных были искажены. Эта устойчивость является важным преимуществом по сравнению со средним значением выборки, которое имеет нулевую точку разбивки, пропорционально любому отдельному наблюдению и поэтому может быть введено в заблуждение даже одним выбросом . Медиана выборки еще более надежна и имеет точку пробоя 0,50. [ 5 ] Оценка Ходжеса-Лемана также намного лучше, чем выборочное среднее, при оценке смесей нормальных распределений. [ 6 ]

Для симметричных распределений статистика Ходжеса-Лемана имеет большую эффективность , чем выборочная медиана. Для нормального распределения статистика Ходжеса-Лемана почти так же эффективна, как и выборочное среднее. Для распределения Коши (t-распределение Стьюдента с одной степенью свободы) распределение Ходжеса-Лемана бесконечно более эффективно, чем выборочное среднее, которое не является последовательной оценкой медианы. [ 5 ]

Для несимметричных популяций статистика Ходжеса-Лемана оценивает «псевдомедиану» популяции. [ 7 ] параметр местоположения , который тесно связан с медианой . Разница между медианой и псевдомедианой относительно невелика, поэтому в элементарных обсуждениях этим различием пренебрегают. Подобно пространственной медиане , [ 8 ] псевдомедиана четко определена для всех распределений случайных величин размерности два и более; для одномерных распределений существует некоторая псевдомедиана, которая, однако, не обязательно должна быть уникальной. Как и медиана, псевдомедиана определяется даже для распределений с тяжелым хвостом, в которых отсутствует какое-либо (конечное) среднее значение . [ 9 ]

Одновыборочная статистика Ходжеса – Лемана не требует оценки какого-либо среднего значения совокупности, которого для многих распределений не существует. Оценщику Ходжеса – Лемана с двумя выборками не нужно оценивать разницу двух средних или разницу двух (псевдо-) медиан; скорее, он оценивает различия между совокупностью парных случайных величин, взятых соответственно из совокупностей. [ 4 ]

В целом статистика

[ редактировать ]

статистика Ходжеса-Лемана Одномерная имеет несколько обобщений в многомерной статистике : [ 10 ]

  • Многомерные ранги и знаки [ 11 ]
  • Тесты пространственных знаков и пространственные медианы [ 8 ]
  • Пространственные знаково-ранговые тесты [ 12 ]
  • Сравнение тестов и оценок [ 13 ]
  • Проблемы с расположением нескольких образцов [ 14 ]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Леманн (2006 , стр. 176 и 200–201)
  2. ^ Додж, Ю. (2003) Оксфордский словарь статистических терминов , OUP. ISBN   0-19-850994-4 Запись для «Одновыборочной оценки Ходжеса-Лемана»
  3. ^ Ходжес и Леманн (1963)
  4. ^ Перейти обратно: а б Эверитт (2002) Запись для «Оценщика Ходжеса-Лемана»
  5. ^ Перейти обратно: а б Майлз Холландер. Дуглас А. Вулф. Непараметрические статистические методы . 2-е изд. Джон Уайли.
  6. ^ Джуреккова-сенатор. Надежные статистические процедуры.
  7. ^ Хеттманспергер и Маккин (1998 , стр. 2–4)
  8. ^ Перейти обратно: а б Дитч (2010 , стр. 71)
  9. ^ Хеттманспергер и Маккин (1998 , стр. 2–4 и 355–356)
  10. ^ Оджа (2010 , стр. 2–3)
  11. ^ Дитч (2010 , стр. 34)
  12. ^ Оджа (2010 , стр. 83–94)
  13. ^ Оджа (2010 , стр. 98–102)
  14. ^ Оджа (2010 , стр. 160, 162 и 167–169)
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 80b04e44ec47f011de1146332743473c__1714096680
URL1:https://arc.ask3.ru/arc/aa/80/3c/80b04e44ec47f011de1146332743473c.html
Заголовок, (Title) документа по адресу, URL1:
Hodges–Lehmann estimator - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)