Эмпирическая вероятность
В теории вероятностей и статистике эмпирическая вероятность , относительная частота или экспериментальная вероятность события , — это отношение числа исходов при которых происходит определенное событие, к общему числу испытаний. [1] т.е. посредством не теоретического выборочного пространства , а реального эксперимента . В более общем смысле, эмпирическая вероятность оценивает вероятности на основе опыта и наблюдений . [2]
событие A в пространстве выборки, относительная частота A Учитывая равна отношению m — количество исходов, при которых произошло событие A , а n — общее количество исходов эксперимента. [3]
С точки зрения статистики, эмпирическая вероятность — это оценка или оценка вероятности. В простых случаях, когда результат испытания определяет только то, произошло ли указанное событие, может оказаться целесообразным моделирование с использованием биномиального распределения , а затем эмпирическая оценка является оценкой максимального правдоподобия . Это байесовская оценка для того же случая, если сделаны определенные предположения относительно априорного распределения вероятности. Если испытание дает больше информации, эмпирическую вероятность можно улучшить, приняв дополнительные предположения в форме статистической модели : если такая модель подходит, ее можно использовать для получения оценки вероятности указанного события.
Преимущества и недостатки
[ редактировать ]Преимущества
[ редактировать ]Преимущество оценки вероятностей с использованием эмпирических вероятностей состоит в том, что эта процедура относительно свободна от предположений.
Например, рассмотрим оценку вероятности среди популяции мужчин того, что они удовлетворяют двум условиям:
- что их превышает 6 футов . высота
- что они предпочитают клубничное варенье малиновому.
Прямую оценку можно получить, подсчитав количество мужчин, удовлетворяющих обоим условиям, чтобы получить эмпирическую вероятность комбинированного условия. Альтернативную оценку можно получить, умножив долю мужчин ростом более 6 футов на долю мужчин, предпочитающих клубничное варенье малиновому, но эта оценка основана на предположении, что эти два условия статистически независимы .
Недостатки
[ редактировать ]Недостаток использования эмпирических вероятностей возникает при оценке вероятностей, которые либо очень близки к нулю, либо очень близки к единице. В этих случаях потребуются очень большие размеры выборки, чтобы оценить такие вероятности с хорошим стандартом относительной точности. Здесь могут помочь статистические модели , в зависимости от контекста, и в целом можно надеяться, что такие модели обеспечат повышение точности по сравнению с эмпирическими вероятностями, при условии, что используемые предположения действительно выполняются.
Например, рассмотрим оценку вероятности того, что самая низкая из дневных максимальных температур на участке в феврале любого года будет ниже нуля градусов Цельсия. Для оценки этой вероятности можно использовать данные о таких температурах в прошлые годы. Альтернативой на основе модели было бы выбрать семейство вероятностных распределений и подогнать его к набору данных, содержащему значения прошлых лет. Подогнанное распределение обеспечит альтернативную оценку желаемой вероятности. Этот альтернативный метод может дать оценку вероятности, даже если все значения в записи больше нуля.
Смешанная номенклатура
[ редактировать ]Фраза апостериорная вероятность также используется как альтернатива «эмпирической вероятности» или «относительной частоте». [1] Использование фразы «апостериорная» напоминает термины в байесовской статистике , но не имеет прямого отношения к байесовскому выводу , где апостериорная вероятность иногда используется для обозначения апостериорной вероятности , которая отличается, хотя и имеет сбивающее с толку значение. похожее имя.
Термин апостериорная вероятность , в его значении, наводящем на мысль об «эмпирической вероятности», может использоваться в сочетании с априорной вероятностью , которая представляет собой оценку вероятности, не основанную на каких-либо наблюдениях, а основанную на дедуктивных рассуждениях . [4]
См. также
[ редактировать ]- Эмпирическая функция распределения
- Эмпирическая мера
- Оценка квантилей по выборке
- Вероятность частоты
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Настроение, утро; Грейбилл, ФА; Боес, округ Колумбия (1974). «Раздел 2.3». Введение в теорию статистики (3-е изд.). МакГроу-Хилл. ISBN 0070428646 .
- ^ «Эмпирические вероятности на tpub.com» . Архивировано из оригинала 10 мая 2007 г. Проверено 31 марта 2007 г.
- ^ Гуджарати, Дамодар Н. (2003). «Приложение А». Основная эконометрика (4-е изд.). МакГроу-Хилл. ISBN 978-0-07-233542-2 .
- ^ Настроение, утро; Грейбилл, ФА; Боес, округ Колумбия (1974). «Раздел 2.2». Введение в теорию статистики (3-е изд.). МакГроу-Хилл. ISBN 0070428646 . ( доступно онлайн. Архивировано 15 мая 2012 г. на Wayback Machine )