Jump to content

Усечение (статистика)

В статистике усечению усечение приводит к значениям, которые ограничены сверху или снизу, что приводит к выборки . [1] Случайная величина называется усеченным снизу, если для некоторого порогового значения , точное значение известно для всех случаев , но неизвестно для всех случаев . Аналогично, усечение сверху означает точное значение известно в тех случаях, когда , но неизвестно когда . [2]

Усечение похоже на концепцию статистической цензуры, но отличается от нее . Усеченную выборку можно рассматривать как эквивалент базовой выборки, в которой все значения, выходящие за пределы границ, полностью опущены, при этом даже не сохраняется количество пропущенных. При статистической цензуре будет записываться примечание, в котором будет указано, какая граница (верхняя или нижняя) была превышена, а также значение этой границы. При усеченной выборке нота не записывается.

Приложения

[ редактировать ]

Обычно значения, которые получают специалисты по страхованию, либо усечены влево, либо подвергнуты цензуре вправо, либо и то, и другое. Например, если на держателей полисов распространяется лимит полиса u , то любые суммы убытков, которые фактически превышают u, сообщаются страховой компании как равные именно u, поскольку u — это сумма, которую платит страховая компания . Страховщик знает, что фактический убыток больше, чем вы , но он не знает, что это такое. С другой стороны, усечение влево происходит, когда держатели полисов подлежат франшизе. Если держатели полисов облагаются франшизой d , любая сумма убытка, меньшая d, даже не будет сообщена страховой компании. Если есть претензия по лимиту полиса u и франшизе d , любая сумма убытка, превышающая u, будет сообщена страховой компании как убыток в размере потому что это сумма, которую должна выплатить страховая компания. Таким образом, данные о страховых убытках усекаются по левому краю, поскольку страховая компания не знает, есть ли суммы ниже франшизы d , поскольку держатели полисов не будут предъявлять претензии. Страховой убыток также подвергается цензуре справа, если убыток превышает u, поскольку u — это наибольшая сумма, которую выплатит страховая компания. Таким образом, он знает только то, что ваша претензия превышает сумму u , а не точную сумму претензии.

Распределения вероятностей

[ редактировать ]

Усечение может быть применено к любому распределению вероятностей . Обычно это приводит к новому распределению, а не внутри одного семейства. Таким образом, если случайная величина X имеет F ( x ) в качестве функции распределения, новая случайная величина Y , определенная как имеющая распределение X, усеченное до полуоткрытого интервала ( a , b ], имеет функцию распределения

для y в интервале ( a , b ] и 0 или 1 в противном случае. Если бы усечение было до замкнутого интервала [ a , b ], функция распределения была бы

для y в интервале [ a , b ] и 0 или 1 в противном случае.

Анализ данных

[ редактировать ]

Анализ данных, в которых наблюдения рассматриваются как полученные из усеченных версий стандартных распределений, может быть проведен с использованием максимального правдоподобия , где правдоподобие будет получено из распределения или плотности усеченного распределения. При этом учитывается фактор в модифицированной функции плотности, которая будет зависеть от параметров исходного распределения.

На практике, если усеченная часть очень мала, эффект усечения можно игнорировать при анализе данных. обычно используется нормальное распределение Например, для моделирования данных, значения которых могут быть только положительными, но для которых типичный диапазон значений далеко от нуля, . В таких случаях формально предпочтительнее может быть усеченная или подвергнутая цензуре версия нормального распределения (хотя могут быть и альтернативы); результаты более сложного анализа изменятся очень незначительно. Однако легко доступно программное обеспечение для оценки максимального правдоподобия даже умеренно сложных моделей, таких как модели регрессии , для усеченных данных. [3]

В эконометрике , усеченные зависимые переменные — это переменные для которых нельзя проводить наблюдения для определенных значений в некотором диапазоне. [4] Модели регрессии с такими зависимыми переменными требуют особого внимания, которое должным образом учитывает усеченную природу переменной. Оценка такой модели усеченной регрессии может быть выполнена параметрически. [5] [6] [7] или полу- и непараметрические рамки. [8] [9]

См. также

[ редактировать ]
  1. ^ Додж, Ю. (2003) Оксфордский словарь статистических терминов . ОУП. ISBN   0-19-920613-9
  2. ^ Брин, Ричард (1996). Модели регрессии: цензурированные, выборочные или усеченные данные . Количественные приложения в социальных науках. Том. 111. Тысяча Дубов: Мудрец. стр. 2–4. ISBN  0-8039-5710-6 .
  3. ^ Волынец, М.С. (1979). «Оценка максимального правдоподобия в линейной модели на основе ограниченных и подвергнутых цензуре нормальных данных». Журнал Королевского статистического общества . Серия С. 28 (2): 195–206. дои : 10.2307/2346749 . JSTOR   2346749 .
  4. ^ «Усеченные зависимые переменные» . О сайте.com . Проверено 22 марта 2008 г.
  5. ^ Амемия, Т. (1973). «Регрессионный анализ, когда зависимая переменная усечена до нормального значения». Эконометрика . 41 (6): 997–1016. дои : 10.2307/1914031 . JSTOR   1914031 .
  6. ^ Хекман, Джеймс (1976). «Общая структура статистических моделей усечения, выборки выборки и ограниченных зависимых переменных, а также простая система оценки для таких моделей» . Анналы экономических и социальных измерений . 5 (4): 475–492.
  7. ^ Ванчак, В.; Гольдберг, Ю.; Бар-Лев, СК; Букай, Б. (2015). «Непрерывные статистические модели: с параметрами усечения или без них?». Математические методы статистики . 24 (1): 55–73. дои : 10.3103/S1066530715010044 . hdl : 1805/7048 . S2CID   255455365 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  8. ^ Левбель, А .; Линтон, О. (2002). «Непараметрическая цензурированная и усеченная регрессия» . Эконометрика . 70 (2): 765–779. дои : 10.1111/1468-0262.00304 . JSTOR   2692291 . S2CID   120113700 .
  9. ^ Парк, Будапешт; Симар, Л.; Зеленюк, В. (2008). «Оценка локального правдоподобия усеченной регрессии и ее частных производных: теория и применение» (PDF) . Журнал эконометрики . 146 (1): 185–198. doi : 10.1016/j.jeconom.2008.08.007 . S2CID   55496460 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3329476533c34337400da07f4de5c63d__1678296180
URL1:https://arc.ask3.ru/arc/aa/33/3d/3329476533c34337400da07f4de5c63d.html
Заголовок, (Title) документа по адресу, URL1:
Truncation (statistics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)