~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 76C0B5B1BB598BF95B9AD179B213FE30__1715180820 ✰
Заголовок документа оригинал.:
✰ Estimator - Wikipedia ✰
Заголовок документа перевод.:
✰ Оценщик — Википедия, бесплатная энциклопедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Estimator ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/76/30/76c0b5b1bb598bf95b9ad179b213fe30.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/76/30/76c0b5b1bb598bf95b9ad179b213fe30__translat.html ✰
Дата и время сохранения документа:
✰ 10.06.2024 23:54:23 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 8 May 2024, at 18:07 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Оценщик — Википедия, бесплатная энциклопедия Jump to content

Оценщик

Из Википедии, бесплатной энциклопедии
Оценка — это не то же самое, что оценщик: оценка — это конкретное значение, зависящее только от набора данных, тогда как оценщик — это метод оценки, реализуемый с помощью случайных величин.

В статистике оценщик наблюдаемых — это правило расчета оценки заданной величины на основе данных правило (оценщик), интересующую величину ( оценку ) и ее результат (оценку). : таким образом различают [1] Например, выборочное среднее является широко используемым средством оценки среднего значения генеральной совокупности .

Существуют точечные и интервальные оценки . Точечные оценки дают однозначные результаты. В этом отличие от интервальной оценки , где результатом будет диапазон вероятных значений. «Одно значение» не обязательно означает «одиночное число», но включает в себя векторные или функциональные оценки.

Теория оценки занимается свойствами оценщиков; то есть с определением свойств, которые можно использовать для сравнения разных оценщиков (разных правил создания оценок) для одного и того же количества на основе одних и тех же данных. Такие свойства можно использовать для определения наилучших правил для использования в данных обстоятельствах. Однако в робастной статистике статистическая теория продолжает рассматривать баланс между наличием хороших свойств, если выполняются строго определенные предположения, и наличием худших свойств, которые выполняются в более широких условиях.

Предыстория [ править ]

«Оценщик» или « точечная оценка » — это статистика (то есть функция данных), которая используется для вывода значения неизвестного параметра в статистической модели . Обычно это формулируют так: «оценщик — это метод, выбранный для получения оценки неизвестного параметра». Оцениваемый параметр иногда называют оценкой . Он может быть как конечномерным (в параметрических и полупараметрических моделях ), так и бесконечномерным ( в полупараметрических и непараметрических моделях ). [2] Если параметр обозначен тогда оценка традиционно записывается добавлением циркумфлекса над символом: . Будучи функцией данных, оценщик сам по себе является случайной величиной ; конкретная реализация этой случайной величины называется «оценкой». Иногда слова «оценщик» и «оценка» используются как синонимы.

Определение практически не налагает ограничений на то, какие функции данных можно назвать «оценщиками». О привлекательности различных оценок можно судить, глядя на их свойства, такие как несмещенность , среднеквадратическая ошибка , непротиворечивость , асимптотическое распределение и т. д. Построение и сравнение оценок являются предметом теории оценивания . В контексте теории принятия решений оценщик представляет собой тип правила принятия решения , и его эффективность можно оценить с помощью функций потерь .

Когда слово «оценщик» используется без уточнения, оно обычно относится к точечной оценке. Оценка в этом случае представляет собой одну точку в пространстве параметров . Также существует другой тип оценок: интервальные оценки , где оценки являются подмножествами пространства параметров.

Проблема оценки плотности возникает в двух приложениях. Во-первых, при оценке функций плотности вероятности случайных величин и, во-вторых, при оценке функции спектральной плотности временного ряда . В этих задачах оценки представляют собой функции, которые можно рассматривать как точечные оценки в бесконечномерном пространстве, и существуют соответствующие проблемы интервальных оценок.

Определение [ править ]

Предположим, фиксированный параметр необходимо оценить. Тогда «оценщик» — это функция, которая отображает выборочное пространство в набор выборочных оценок . Оценщик обычно обозначается символом . Часто бывает удобно выразить теорию с использованием алгебры случайных величин : например, если X используется для обозначения случайной величины , соответствующей наблюдаемым данным, оценщик (который сам рассматривается как случайная величина) обозначается как функция этой случайной величины. , . Оценка конкретного значения наблюдаемых данных (т.е. для ) затем , что является фиксированным значением. Часто используют сокращенную запись, в которой интерпретируется непосредственно как случайная величина , но это может вызвать путаницу.

Количественные свойства [ править ]

Следующие определения и атрибуты имеют отношение к делу. [3]

Ошибка [ править ]

Для данного образца , " ошибка " оценщика определяется как

где оцениваемый параметр. Ошибка e зависит не только от средства оценки (формулы или процедуры оценки), но и от выборки.

Среднеквадратическая ошибка [ править ]

Среднеквадратическая ошибка определяется как ожидаемое значение (среднее значение вероятности, по всем выборкам) квадратов ошибок; то есть,

Он используется для указания того, насколько в среднем набор оценок далек от одного оцениваемого параметра. Рассмотрим следующую аналогию. Предположим, что параметром является яблочко цели, оценщиком является процесс стрельбы стрелами по цели, а отдельные стрелы являются оценками (выборками). Тогда высокое MSE означает, что среднее расстояние стрелок от яблочка высокое, а низкое MSE означает, что среднее расстояние от яблочка низкое. Стрелки могут быть сгруппированы, а могут и не сгруппированы. Например, даже если все стрелы попали в одну и ту же точку, но сильно не достигли цели, MSE все равно будет относительно большим. Однако если MSE относительно низкая, то стрелки, скорее всего, будут скорее сгруппированы (а не сильно рассеяны) вокруг цели.

Отклонение выборки [ править ]

Для данного образца , отклонение выборки средства оценки определяется как

где ожидаемое значение оценщика. Отклонение выборки d зависит не только от оценщика, но и от выборки.

Дисперсия [ править ]

Дисперсия – ожидаемое значение квадрата отклонений выборки; то есть, . Он используется для указания того, насколько в среднем набор оценок далек от ожидаемого значения оценок. (Обратите внимание на разницу между MSE и дисперсией.) Если параметр представляет собой «яблочко» цели, а стрелки являются оценками, то относительно высокая дисперсия означает, что стрелки рассредоточены, а относительно низкая дисперсия означает, что стрелки сгруппированы. Даже если дисперсия невелика, группа стрелок все равно может быть далеко от цели, и даже если дисперсия высока, рассеянный набор стрелок все равно может быть несмещенным. Наконец, даже если все стрелы сильно не попали в цель, но все же все они попали в одну и ту же точку, дисперсия равна нулю.

Предвзятость [ править ]

Предвзятость определяется как . Это расстояние между средним значением набора оценок и одним оцениваемым параметром. Предвзятость является функцией истинного значения так сказать, что предвзятость является означает, что для каждого предвзятость является .

Существует два типа оценок: смещенные оценки и несмещенные оценки. Является ли оценщик предвзятым или нет, можно определить по взаимосвязи между и 0:

  • Если , является предвзятым.
  • Если , является беспристрастным.

Смещение также является ожидаемым значением ошибки, поскольку . Если параметром является яблочко цели, а стрелки являются приблизительными, то относительно высокое абсолютное значение смещения означает, что среднее положение стрелок находится вне цели, а относительно низкое абсолютное смещение означает среднее положение стрелок. находится на цели. Они могут быть рассредоточены, а могут быть сгруппированы. Отношения между смещением и дисперсией аналогичны отношениям между точностью и прецизионностью .

Оценщик является несмещенной оценкой если и только если . Смещение — это свойство оценщика, а не оценки. Часто люди говорят о «предвзятой оценке» или «несмещенной оценке», но на самом деле они говорят об «оценке, полученной на основе смещенной оценки» или «оценке, полученной на основе несмещенной оценки». Кроме того, люди часто путают «ошибку» одной оценки с «предвзятостью» оценщика. То, что ошибка одной оценки велика, не означает, что оценка смещена. Фактически, даже если все оценки имеют астрономические абсолютные значения ошибок, если ожидаемое значение ошибки равно нулю, оценка является несмещенной. Кроме того, предвзятость оценщика не исключает того, что ошибка оценки будет равна нулю в конкретном случае. Идеальная ситуация — иметь несмещенную оценку с низкой дисперсией, а также попытаться ограничить количество выборок, в которых ошибка является экстремальной (то есть иметь мало выбросов). Однако беспристрастность не является существенной. Часто, если допускается лишь небольшая погрешность, то можно найти оценщик с более низкой среднеквадратической ошибкой и/или меньшим количеством выбросов выборочных оценок.

Альтернативой версии «несмещенный», приведенной выше, является «несмещенный медианный», где медиана распределения оценок соответствует истинному значению; таким образом, в долгосрочной перспективе половина оценок будет слишком занижена, а половина — слишком высока. Хотя это применимо непосредственно только к скалярным оценкам, это можно распространить на любую меру центральной тенденции распределения: см. Медианно-несмещенные оценки .

В практической задаче всегда может иметь функциональные отношения с . Например, генетическая теория утверждает, что существует тип листьев, крахмально-зеленый, который с вероятностью встречается , с . Для листья, случайная величина , количество крахмалистых зеленых листьев, можно смоделировать с помощью распределение. Это число можно использовать для выражения следующей оценки для : . Можно показать, что является несмещенной оценкой : .

Беспристрастный [ править ]

Разница между оценщиками: несмещенная оценка сосредоточен вокруг против смещенной оценки .

Желаемым свойством для оценщиков является свойство несмещенности, при котором оценщик не имеет систематической тенденции давать оценки, большие или меньшие, чем заданная вероятность. Кроме того, несмещенные оценки с меньшими дисперсиями предпочтительнее, чем с большими дисперсиями, поскольку они будут ближе к «истинному» значению параметра. Несмещенная оценка с наименьшей дисперсией известна как несмещенная оценка с минимальной дисперсией (MVUE).

Чтобы определить, является ли ваша оценка несмещенной, легко следовать уравнению , . С оценщиком T и интересующим параметром решаем предыдущее уравнение, чтобы оно выглядело как оценка является несмещенной. Глядя на рисунок справа, несмотря на будучи единственным несмещенным оценщиком. Если распределения перекрывались и оба были сосредоточены вокруг затем распространение на самом деле будет предпочтительной несмещенной оценкой.

Ожидание При рассмотрении величин в интересах ожидаемого распределения модели существует несмещенная оценка, которая должна удовлетворять двум приведенным ниже уравнениям.

Дисперсия Аналогичным образом, если рассматривать величины с точки зрения дисперсии как модельного распределения, существует также несмещенная оценка, которая должна удовлетворять двум приведенным ниже уравнениям.

Обратите внимание, что мы делим на n - 1, потому что если бы мы разделили на n, мы получили бы оценку с отрицательным смещением, что, таким образом, привело бы к получению оценок, которые слишком малы для . Следует также упомянуть, что хотя является беспристрастным для обратное неверно. [4]

Отношения между величинами [ править ]

  • Среднеквадратическая ошибка, дисперсия и смещение связаны между собой: т.е. среднеквадратическая ошибка = дисперсия + квадрат смещения. В частности, для несмещенной оценки дисперсия равна среднеквадратической ошибке.
  • Стандартное отклонение оценщика из ( квадратный корень из дисперсии) или оценка стандартного отклонения оценщика из , называется стандартной ошибкой .
  • Компромисс смещения и дисперсии будет использоваться для определения сложности модели, переподбора и недостаточного подбора. В основном он используется в области контролируемого обучения и прогнозного моделирования для диагностики производительности алгоритмов.

Выборочное распределение

может Распределение выборки быть показано оценщиком . представлена ​​случайной выборкой: . Распределение выборки эквивалентно распределению вероятностей оценки S, которое также может быть представлено уравнением:

.

где Y — количество равно нулю, а n — количество испытаний. Чтобы понять, почему математическое ожидание зависит от вероятности ( ) нам нужно понять распределение. Например, в распределении выборки для каждого i в случайном наборе данных X можно считать успехом, когда X = 0. Это делает Y равным успеху X = 0 в n испытаниях. Учитывая, что Y либо успешен, либо нет, его можно рассматривать как биномиальное распределение с постоянной вероятностью. . Следовательно, выборочное распределение S можно рассматривать как распределение делая S дискретной случайной величиной . В результате ожидание распределения выборки можно представить как

.

доказательство того, что имущество удерживается независимо от стоимости является. Это показывает, что, несмотря на значения, колеблющиеся между оценщиками выборок, могут быть целевыми независимо от различий. [4]

Поведенческие свойства [ править ]

Консистенция [ править ]

Согласованная последовательность оценок — это последовательность оценок, которые сходятся по вероятности к оцениваемой величине по мере индекса (обычно размера выборки неограниченного роста ). Другими словами, увеличение размера выборки увеличивает вероятность того, что оценщик будет близок к параметру генеральной совокупности.

Математически последовательность оценок { t n ; n ≥ 0 } является согласованной оценкой параметра θ тогда и только тогда, когда для всех ε > 0 , независимо от того, насколько они малы, мы имеем

.

Определенную выше согласованность можно назвать слабой согласованностью. Последовательность является сильно согласованной , если она почти наверняка сходится к истинному значению.

Оценщик, который сходится к кратному параметру, можно превратить в непротиворечивую оценку, умножив оценку на масштабный коэффициент , а именно на истинное значение, разделенное на асимптотическое значение оценки. Это часто происходит при оценке параметров масштаба по мерам статистической дисперсии .

Фишера Последовательность

Оценщик можно считать согласованным по Фишеру, если он является тем же функционалом эмпирической функции распределения, что и истинная функция распределения. Следуя формуле:

Где и эмпирическая функция распределения и теоретическая функция распределения соответственно. Простой пример того, как увидеть, является ли что-то согласованным по Фишеру, — это проверить среднюю согласованность и дисперсию. Например, чтобы проверить согласованность среднего значения и для проверки отклонений подтвердите, что . [5]

нормальность Асимптотическая

Асимптотически нормальная оценка - это непротиворечивая оценка, распределение которой вокруг истинного параметра θ приближается к нормальному распределению со стандартным отклонением, уменьшающимся пропорционально по мере роста размера выборки n . С использованием для обозначения сходимости по распределению , t n является асимптотически нормальным если

для какого- В. то

В этой формулировке V/n можно назвать асимптотической дисперсией оценки. Однако некоторые авторы также называют V асимптотической дисперсией . Обратите внимание, что сходимость не обязательно произойдет для любого конечного «n», поэтому это значение является лишь приближением к истинной дисперсии оценки, в то время как в пределе асимптотическая дисперсия (V/n) равна просто нулю. Точнее говоря, распределение оценки t n слабо сходится к дельта-функции Дирака с центром в точке .

Центральная предельная теорема подразумевает асимптотическую нормальность выборочного среднего. как оценка истинного среднего значения. В более общем смысле, оценки максимального правдоподобия асимптотически нормальны при довольно слабых условиях регулярности — см. раздел асимптотики статьи о максимальном правдоподобии. Однако не все оценки асимптотически нормальны; наиболее простые примеры встречаются, когда истинное значение параметра лежит на границе допустимой области параметра.

Эффективность [ править ]

Эффективность оценщика используется для оценки интересующей величины способом «минимальной ошибки». В действительности не существует явной лучшей оценки; может быть только лучшая оценка. Хорошая или плохая эффективность оценки основана на выборе конкретной функции потерь и отражается двумя естественными желательными свойствами оценок: быть несмещенными. и иметь минимальную среднеквадратическую ошибку (MSE) . В общем, они не могут быть удовлетворены одновременно: несмещенная оценка может иметь меньшую среднеквадратическую ошибку, чем любая смещенная оценка (см. Смещение оценки ). Функция связывает среднеквадратическую ошибку со смещением оценщика. [6]

Первый член представляет собой среднеквадратичную ошибку; второй член представляет собой квадрат смещения средства оценки; а третий член представляет собой дисперсию выборки. Качество средства оценки можно определить путем сравнения дисперсии, квадрата смещения средства оценки или MSE. Дисперсия хорошей оценки (хорошая эффективность) будет меньше, чем дисперсия плохой оценки (плохая эффективность). Квадрат смещения оценки с хорошей оценкой будет меньше, чем смещение оценки с плохой оценкой. СКО хорошей оценки будет меньше, чем СКО плохой оценки. Предположим, есть две оценки, является хорошим оценщиком и это плохой оценщик. Вышеуказанную зависимость можно выразить следующими формулами.

Помимо использования формулы для определения эффективности оценщика, ее также можно определить с помощью графика. Если оценщик эффективен, на графике зависимости частоты от значения будет кривая с высокой частотой в центре и низкой частотой с двух сторон. Например:

Если оценщик неэффективен, график зависимости частоты от значения будет относительно более плавной кривой.

Проще говоря, хорошая оценка имеет узкую кривую, а плохая — большую. Если нанести эти две кривые на один график с общей осью Y, разница станет более очевидной.

Сравнение хорошей и плохой оценки.

Среди несмещенных оценок часто существует оценка с наименьшей дисперсией, называемая несмещенной оценкой с минимальной дисперсией ( MVUE ). В некоторых случаях существует несмещенная эффективная оценка , которая, помимо того, что имеет самую низкую дисперсию среди несмещенных оценок, удовлетворяет границе Крамера-Рао , которая является абсолютной нижней границей дисперсии для статистики переменной.

Относительно таких «наилучших несмещенных оценок» см. также оценку Крамера–Рао , теорему Гаусса–Маркова , теорему Лемана–Шеффе , теорему Рао–Блэквелла .

Прочность [ править ]

См. также [ править ]

Ссылки [ править ]

  1. ^ Мостеллер, Ф.; Тьюки, JW (1987) [1968]. «Анализ данных, включая статистику» . Собрание сочинений Джона В. Тьюки: философия и принципы анализа данных 1965–1986 гг . Том. 4. ЦРК Пресс. стр. 601–720 [с. 633]. ISBN  0-534-05101-4 – через Google Книги .
  2. ^ Косорок (2008), раздел 3.1, стр. 35–39.
  3. ^ Джейнс (2007), стр.172.
  4. ^ Перейти обратно: а б Деккинг, Фредерик (15 июня 2005 г.). Современное введение в теорию вероятности и статистики . Спрингер. стр. 285–293. ISBN  978-1-85233-896-1 .
  5. ^ Лауритцен, Штеффен. «Свойства оценщиков» (PDF) . Оксфордский университет . Проверено 9 декабря 2023 г.
  6. ^ Декинг, Фредерик Мишель; Краайкамп, Корнелис; Лопухаа, Хендрик Пауль; Местер, Людольф Эрвин (2005). «Современное введение в теорию вероятности и статистику » Спрингеровские тексты в статистике . дои : 10.1007/ 1-84628-168-7 ISBN  978-1-85233-896-1 . ISSN   1431-875X .

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 76C0B5B1BB598BF95B9AD179B213FE30__1715180820
URL1:https://en.wikipedia.org/wiki/Estimator
Заголовок, (Title) документа по адресу, URL1:
Estimator - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)