Оценка переменной плотности ядра
В статистике адаптивная . оценка плотности ядра или оценка плотности ядра с «переменной полосой пропускания» — это форма оценки плотности ядра , в которой размер ядер, используемых в оценке, варьируется в зависимости от местоположения образцов или местоположения контрольной точки.Это особенно эффективный метод, когда пространство выборки многомерно. [1]
Обоснование
[ редактировать ]Учитывая набор образцов, , мы хотим оценитьплотность, , на контрольной точке, :
где n — количество выборок, K — «ядро» , h — его ширина, а D — количество измерений в .Ядро можно рассматривать как простой линейный фильтр .
Использование фиксированной ширины фильтра может означать, что в регионах с низкой плотностью все образцыпопадут в хвосты фильтра с очень низким весом, а области с высокимплотность обнаружит избыточное количество образцов в центральной области с взвешиваниемблизко к единице. Чтобы решить эту проблему, мы варьируем ширину ядра в разныхобласти выборочного пространства. Есть два метода сделать это: баллонная оценка и точечная оценка.В баллонной оценке ширина ядра варьируется в зависимости от местоположения. тестовой точки. В поточечной оценке ширина ядра варьируется в зависимости ото месте образца. [1]
Для многомерных оценок параметр h можно обобщить доразличаются не только размер, но и форма ядра. Этот более сложный подходздесь не будет рассмотрено.
Баллонные оценщики
[ редактировать ]Распространенный метод изменения ширины ядра — сделать ее обратно пропорциональной плотности в контрольной точке:
где k — константа. Если мы заменим оцененную PDF и примем функцию ядра Гаусса ,мы можем показать, что W является константой: [2]
Аналогичный вывод справедлив для любого ядра, нормализующая функция которого имеет порядок h Д , хотя и с другим постоянным множителем вместо (2 π) Д/2 срок. Это дает обобщение алгоритма k-ближайшего соседа .То есть универсальная функция ядра будет возвращать Техника КНН. [2]
Ошибка состоит из двух компонентов: фактор дисперсии и фактор смещения. Дисперсия определяется как: [1]
- .
Член смещения находится путем оценки аппроксимированной функции в пределе как ядроширина становится намного больше, чем расстояние между образцами. При использовании расширения Тейлора для реальной функции член смещения исключается:
Таким образом, можно получить оптимальную ширину ядра, которая минимизирует ошибку каждой оценки.
Использование для статистической классификации
[ редактировать ]Метод особенно эффективен при применении к статистической классификации .Мы можем действовать двумя способами: первый — вычислить PDF-файлыкаждый класс отдельно, используя разные параметры пропускной способности, а затем сравните их, как у Тейлора. [3] В качестве альтернативы мы можем разделить сумму в зависимости от класса каждого образца:
где c i — класс i-го образца .Класс контрольной точки может быть оценен через максимальное правдоподобие .
Внешние ссылки
[ редактировать ]- akde1d.m — m-файл Matlab для одномерной адаптивной оценки плотности ядра.
- libAGF — библиотека C++ для многомерной адаптивной оценки плотности ядра.
- akde.m — функция Matlab для многомерной (многомерной) оценки плотности переменных ядра.
Ссылки
[ редактировать ]- ^ Jump up to: а б с Д.Г. Террелл; Д. У. Скотт (1992). «Оценка переменной плотности ядра» . Анналы статистики . 20 (3): 1236–1265. дои : 10.1214/aos/1176348768 .
- ^ Jump up to: а б Миллс, Питер (2011). «Эффективная статистическая классификация спутниковых измерений». Международный журнал дистанционного зондирования . 32 (21): 6109–6132. arXiv : 1202.2194 . Бибкод : 2011IJRS...32.6109M . дои : 10.1080/01431161.2010.507795 . S2CID 88518570 .
- ^ Тейлор, Чарльз (1997). «Классификация и оценка плотности ядра». Перспективы в астрономии . 41 (3): 411–417. Бибкод : 1997ВА.....41..411Т . дои : 10.1016/s0083-6656(97)00046-9 .