~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ BA99C8ECA597D4F9BB79DBAFE505B5A3__1713444000 ✰
Заголовок документа оригинал.:
✰ Density estimation - Wikipedia ✰
Заголовок документа перевод.:
✰ Оценка плотности - Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Density_estimation ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/ba/a3/ba99c8eca597d4f9bb79dbafe505b5a3.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/ba/a3/ba99c8eca597d4f9bb79dbafe505b5a3__translat.html ✰
Дата и время сохранения документа:
✰ 11.06.2024 00:29:22 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 18 April 2024, at 15:40 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Оценка плотности - Википедия Jump to content

Оценка плотности

Из Википедии, бесплатной энциклопедии
Демонстрация оценки плотности с использованием оценки плотности ядра : истинная плотность представляет собой смесь двух гауссиан с центрами вокруг 0 ​​и 3, показанную сплошной синей кривой. В каждом кадре из распределения, показанного красным, генерируется 100 выборок. В центре каждой выборки серым цветом нарисовано ядро ​​Гаусса. Усреднение гауссиан дает оценку плотности, показанную пунктирной черной кривой.

В статистике оценка плотности вероятности или просто оценка плотности — это построение оценки на основе наблюдаемых данных ненаблюдаемой основной функции плотности вероятности . Ненаблюдаемая функция плотности рассматривается как плотность, согласно которой распределяется большая популяция; данные обычно рассматриваются как случайная выборка из этой совокупности. [1]

Используются различные подходы к оценке плотности, включая окна Парцена и ряд методов кластеризации данных , включая векторное квантование . Самая базовая форма оценки плотности — это масштабированная гистограмма .

Пример [ править ]

Предполагаемая плотность p (glu | диабет=1) (красный), p (glu | диабет=0) (синий) и p (glu) (черный)
Предполагаемая вероятность p (диабет = 1 | glu)
Предполагаемая вероятность p (диабет = 1 | глу)

Мы рассмотрим записи заболеваемости сахарным диабетом . Следующее цитируется дословно из описания набора данных :

Популяция женщин в возрасте не менее 21 года, индейцев Пима , проживающих недалеко от Финикса, штат Аризона, была протестирована на сахарный диабет в соответствии с критериями Всемирной организации здравоохранения . Данные были собраны Национальным институтом диабета, заболеваний органов пищеварения и почек США. Мы использовали 532 полные записи. [2] [3]

В этом примере мы строим три оценки плотности для «glu» ( в плазме концентрации глюкозы ), одна зависит от наличия диабета, второй при условии отсутствия диабета, а третий не при условии диабета. Затем оценки условной плотности используются для построения вероятности диабета, зависящей от «глу».

Данные «glu» были получены из пакета MASS. [4] языка программирования R. Внутри Р, ?Pima.tr и ?Pima.te дать более полный отчет о данных.

Среднее значение «glu» в случаях диабета составляет 143,1, а стандартное отклонение — 31,26. Среднее значение «glu» в случаях отсутствия диабета составляет 110,0, а стандартное отклонение — 24,29. Из этого мы видим, что в этом наборе данных случаи диабета связаны с более высоким уровнем «глю». Это станет более понятным из графиков оцененных функций плотности.

На первом рисунке показаны оценки плотности p (glu | диабет=1), p (glu | диабет=0) и p (glu). Оценки плотности представляют собой оценки плотности ядра с использованием ядра Гаусса. То есть функция плотности Гаусса помещается в каждую точку данных, а сумма функций плотности вычисляется по диапазону данных.

Из плотности «глю», обусловленного диабетом, мы можем получить вероятность диабета, обусловленного «глю», с помощью правила Байеса . Для краткости слово «диабет» обозначается сокращенно «дб». в этой формуле.

На втором рисунке показана предполагаемая апостериорная вероятность p (диабет = 1 | glu). Из этих данных следует, что повышенный уровень «глу» связан с диабетом.

Применение и цель [ править ]

Очень естественным использованием оценок плотности является неформальное исследование свойств данного набора данных. Оценки плотности могут дать ценное представление о таких особенностях, как асимметрия и мультимодальность данных. В некоторых случаях они приведут к выводам, которые затем можно будет считать самоочевидно верными, тогда как в других все, что они сделают, — это укажут путь к дальнейшему анализу и/или сбору данных. [5]

Гистограмма и функция плотности распределения Гамбеля [6]

Важным аспектом статистики часто является представление данных клиенту с целью объяснения и иллюстрации выводов, которые могли быть получены другими способами. Оценки плотности идеально подходят для этой цели по той простой причине, что они довольно легко понятны нематематикам.

Дополнительные примеры, иллюстрирующие использование оценок плотности в исследовательских и презентационных целях, включая важный случай двумерных данных. [7]

Оценка плотности также часто используется при обнаружении аномалий или обнаружении новизны : [8] если наблюдение находится в регионе с очень низкой плотностью населения, оно, скорее всего, будет аномалией или новинкой.

  • В гидрологии гистограмма распределения и расчетная функция плотности данных об осадках и расходе рек, проанализированные с помощью вероятностей , используются для понимания их поведения и частоты появления. [9] Пример показан на синем рисунке.

Оценка плотности ядра [ править ]

Оценка плотности ядра для 100 нормально распределенных случайных чисел с использованием различных полос сглаживания.
В статистике ( оценка плотности вероятности KDE) — это применение сглаживания ядра для оценки плотности вероятности , т. е. непараметрический метод оценки функции плотности вероятности на случайной величины основе ядер в качестве весов . KDE решает фундаментальную проблему сглаживания данных, когда выводы о совокупности делаются на основе конечной выборки данных . В некоторых областях, таких как обработка сигналов и эконометрика, его также называют методом окна Парцена-Розенблатта в честь Эмануэля Парцена и Мюррея Розенблатта , которым обычно приписывают независимое создание его в его нынешней форме. [10] [11] Одним из известных применений оценки плотности ядра является оценка условных классов предельных плотностей данных при использовании наивного байесовского классификатора , что может повысить точность его прогнозирования. [12]

См. также [ править ]

Ссылки [ править ]

  1. ^ Альберто Бернаккья, Симоне Пиголотти, Самосогласованный метод оценки плотности, Журнал Королевского статистического общества, серия B: Статистическая методология, том 73, выпуск 3, июнь 2011 г., страницы 407–422, https://doi.org/10.1111 /j.1467-9868.2011.00772.x
  2. ^ «Диабет у индийских женщин Пима - документация R» .
  3. ^ Смит, Дж.В., Эверхарт, Дж.Э., Диксон, В.К., Ноулер, В.К. и Йоханнес, Р.С. (1988). Р. А. Гринс (ред.). «Использование алгоритма обучения ADAP для прогнозирования возникновения сахарного диабета» . Материалы симпозиума по компьютерным приложениям в медицинской помощи (Вашингтон, 1988) . Лос-Аламитос, Калифорния: 261–265. ПМК   2245318 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ «Функции поддержки и наборы данных для Венейблса и МАССЫ Рипли» .
  5. ^ Сильверман, BW (1986). Оценка плотности для статистики и анализа данных . Чепмен и Холл. ISBN  978-0412246203 .
  6. ^ Калькулятор распределений вероятностей и функций плотности.
  7. ^ Джефф Х., Гивенс (2013). Вычислительная статистика. Уайли. п. 330. ISBN   978-0-470-53331-4 .
  8. ^ Пиментел, Марко А.Ф.; Клифтон, Дэвид А.; Клифтон, Лей; Тарасенко, Лионель (2 января 2014 г.). «Обзор обнаружения новизны». Обработка сигнала . 99 (июнь 2014 г.): 215–249. дои : 10.1016/j.sigpro.2013.12.026 .
  9. ^ Иллюстрация гистограмм и функций плотности вероятности.
  10. ^ Розенблатт, М. (1956). «Замечания о некоторых непараметрических оценках функции плотности» . Анналы математической статистики . 27 (3): 832–837. дои : 10.1214/aoms/1177728190 .
  11. ^ Парзен, Э. (1962). «Об оценивании функции плотности вероятности и режима» . Анналы математической статистики . 33 (3): 1065–1076. дои : 10.1214/aoms/1177704472 . JSTOR   2237880 .
  12. ^ Хасти, Тревор ; Тибширани, Роберт ; Фридман, Джером Х. (2001). Элементы статистического обучения: интеллектуальный анализ данных, логические выводы и прогнозирование: с 200 полноцветными иллюстрациями . Нью-Йорк: Спрингер. ISBN  0-387-95284-5 . OCLC   46809224 .

Источники

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: BA99C8ECA597D4F9BB79DBAFE505B5A3__1713444000
URL1:https://en.wikipedia.org/wiki/Density_estimation
Заголовок, (Title) документа по адресу, URL1:
Density estimation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)